阿里国际发布多模态大模型Ovis 支持数学推理问答和物体识别等功能
摘要 据悉,阿里国际AI团队发布了一款名为Ovis的多模态大模型。该模型在数学推理问答、物体识别、文本提取和复杂任务决策等方面表现出色。Ovis能...
据悉,阿里国际AI团队发布了一款名为Ovis的多模态大模型。该模型在数学推理问答、物体识别、文本提取和复杂任务决策等方面表现出色。
Ovis能够准确回答数学问题,识别花的品种,并支持多种语言的文本提取。此外,它还可以识别手写字体和复杂的数学公式。
Ovis 1.0、1.5版本的数据、模型、训练和推理代码已全部开源,并可进行复现。同时,最新版Ovis1.6-Gemma2-9B也已开源权重。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。