参数量 42 亿,微软公布 SLM 小语言 AI 模型最新成员 Phi-3-vision

集知网 20240526

  • 人工智能
  • 图像识别

IT之家 5 月 26 最近,微软宣布了其小语言 AI 模型家族(SLM)最新成员“Phi-3-vision该模型以“视觉能力”为主,能理解图文内容,同时据说能在移动平台上流畅高效地运行。

据介绍,Phi-3-vision 是微软 Phi-3 家族第一个多模态模型,基于这个模型的文本理解能力 Phi-3-mini,同时也具备 Phi-3-mini 轻量级的特点,能够在移动平台上 / 嵌入终端运行;模型参数为 42 亿,大于 Phi-3-mini(3.8B),但小于 Phi-3-small(7B)上下文长度为 128k token,训练期间为 2024 年 2 月至 4 月。

IT之家注意到,Phi-3-vision 模型最大的特点就像它的名字一样,主要支持“图形识别能力”,声称能够理解现实世界的图片含义,快速识别和提取图片中的文本。

微软表示,Phi-3-vision 特别适用于办公场合,开发人员在识别图表和方块图时特别优化了该模型 (Block diagram) 据说,理解能力可以利用用户输入的信息进行推论,同时也可以得出一系列结论,为企业提供战略建议,被称为“效果与大模型相当”。

在模型训练方面,微软声称 Phi-3-vision 它由“各种类型的图片和文本数据培训”组成,包括一系列“严格选择的公共内容”,如“教科书等级”教育材料、代码、图形标记数据、现实世界知识、图表图片、聊天格式等,以确保模型输入内容的多样性。微软声称,他们使用的训练数据“可追溯性”不包含任何个人信息,以确保隐私。

在性能方面,微软提供 Phi-3-vision 与字节跳动相比 Llama3-Llava-Next(8B)、微软研究所与威斯康星大学和哥伦比亚大学合作 LlaVA-1.6(7B)、阿里巴巴通义千问 QWEN-VL-Chat 比较模型等竞争模型的图表,其中显示 Phi-3-vision 模型在多个项目中表现出色。

目前,微软已上传到该模型 Hugging Face,感兴趣的朋友可以访问项目地址:点击此进入

相关阅读:

英特尔力押 SLM 小语言 AI 该模型宣布其软硬件已适应微软 Phi-3》

广告声明:文本中包含的外部跳转链接(包括不限于超链接、二维码、密码等形式)用于传递更多信息,节省选择时间。结果仅供参考。IT之家的所有文章都包括本声明。

声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请与我们联系,我们将及时更正、删除,谢谢。

查看全文

点赞

集知网

作者最近更新

  • 国巨成功收购芝浦电子,1090亿日元落槌
    集知网
    1天前
  • 科创板MEMS芯片第一股,引机构扎堆调研
    集知网
    09-29 13:46
  • 破产重整获批!引入6000万投资,这家卫星遥感龙头能否涅槃重生?
    集知网
    09-27 14:59

期刊订阅

相关推荐

  • 传感器应该推进人工智能实现整体进化

    2018-12-07

  • 华为首款AI音箱:可通过HiLink开放协议控制19个家电品类

    2020-02-21

  • 本田将在CES展出自动驾驶作业车和机器人新品

    2018-12-14

  • 日本新研究:人工智能或能提前一周预测台风

    2019-01-08

评论0条评论

×
私信给集知网

点击打开传感搜小程序 - 速览海量产品,精准对接供需

  • 收藏

  • 评论

  • 点赞

  • 分享

收藏文章×

已选择0个收藏夹

新建收藏夹
完成
创建收藏夹 ×
取消 保存

1.点击右上角

2.分享到“朋友圈”或“发送给好友”

×

微信扫一扫,分享到朋友圈

推荐使用浏览器内置分享功能

×

关注微信订阅号

关注微信订阅号,了解更多传感器动态

  • #{faceHtml}

    #{user_name}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 查看评论 回复

    共#{comment_count}条评论

    加载更多

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} #{reback} 回复

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 回复

  • 关闭
      广告