阿里通义开源音频语言模型Qwen2

摘要 据悉,阿里通义大模型继续开源,新增音频语言模型Qwen2-Audio。该模型可以直接进行语音问答,并能理解和分析用户输入的各种音频信号。多个...

据悉,阿里通义大模型继续开源,新增音频语言模型Qwen2-Audio。该模型可以直接进行语音问答,并能理解和分析用户输入的各种音频信号。多个权威测评表明该模型超越了之前的最佳模型。同时,通义团队还发布了一套全新的音频理解模型测评基准,并且相关论文已被选中参加正在举办的国际顶会ACL 2024。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。