Estamos liberando el código de Perception Encoder Audiovisual (PE-AV), el motor técnico que ayuda a impulsar la separación de audio de vanguardia de SAM Audio. Construido sobre nuestro modelo Perception Encoder de principios de este año, PE-AV integra audio con percepción visual, logrando resultados de vanguardia en una amplia gama de benchmarks de audio y video. Su soporte nativo multimodal puede ayudar a las personas en tareas cotidianas, incluyendo la detección de sonidos y una comprensión más rica de las escenas audiovisuales. 🔗 Lee el artículo: 🔗 Descarga el código: