SAM 3 của Meta là một cỗ máy khổng lồ. trước đây: thu thập dữ liệu, đào tạo bộ phát hiện đối tượng tùy chỉnh, sử dụng bộ theo dõi để ước lượng chuyển động của đối tượng - mất vài ngày bây giờ: theo dõi bất kỳ thứ gì với lời nhắc văn bản - chỉ trong vài giây phát hiện đối tượng theo thời gian thực sẽ không bao giờ giống như trước.