Estamos abriendo el código Perception Encoder Audiovisual (PE-AV), el motor técnico que ayuda a impulsar la separación de audio de última generación de SAM Audio. Basado en nuestro modelo Perception Encoder de principios de este año, PE-AV integra audio con percepción visual, logrando resultados de última generación en una amplia gama de benchmarks de audio y vídeo. Su soporte multimodal nativo puede ayudar a las personas en tareas cotidianas, incluyendo la detección de sonido y una comprensión más profunda de la escena audiovisual. 🔗 Lee el artículo: 🔗 Descarga el código: