热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
我们正在开源感知编码器视听(PE-AV),这是推动SAM Audio最先进音频分离的技术引擎。
PE-AV基于我们今年早些时候的感知编码器模型,集成了音频与视觉感知,在广泛的音频和视频基准测试中实现了最先进的结果。其原生的多模态支持可以帮助人们完成日常任务,包括声音检测和更丰富的音频-视觉场景理解。
🔗 阅读论文:
🔗 下载代码:

热门
排行
收藏
