Tôi đã suy nghĩ về chi phí Landauer để xóa một bit và tất cả những bit bậc thấp đó bị ReLu hóa, bị cắt và chuẩn hóa đến mức không còn gì. Và rồi chúng ta lại tiêu tốn nhiều tính toán hơn để ra ngoài và lấy những Gaussian mới... có gì sai với tiếng ồn mà chúng ta có ở nhà?