Ми відкриваємо Perception Encoder Audiovisual (PE-AV) — технічний двигун, який допомагає забезпечити передове аудіорозділення SAM Audio. Побудований на нашій моделі Perception Encoder на початку цього року, PE-AV інтегрує аудіо з візуальним сприйняттям, досягаючи найсучасніших результатів у широкому спектрі аудіо та відеобенчмарків. Його рідна мультимодальна підтримка може допомогти людям у повсякденних справах, включно з виявленням звуку та глибшим розумінням аудіовізуальної сцени. 🔗 Прочитайте статтю: 🔗 Завантажте код: