当前位置：首页> 腾云科技> 正文

微软发布 Phi-4 多模态与迷你模型，语音视觉文本处理再升级

腾云科技
腾云科技
2025-03-01 17:28:34
279

微软最近推出了Phi-4系列的新模型，包括Phi-4多模态和Phi-4迷你，Phi-4多模态模型集成了语音、视觉和文本处理，参数达到5600万，在多项基准测试中表现优异，尤其是在自动语音识别和翻译任务中表现突出。Phi-4迷你则专注于文本处理，参数为3800万，表现同样出色。

亮点提要：

Phi-4多模态模型是微软首款集成语音、视觉和文本处理的统一架构模型，参数达到5600万，表现超越许多竞争对手。

在视觉处理和数学推理方面，Phi-4多模态模型表现出色，能够有效理解文档和图表，并执行光学字符识别。

Phi-4迷你模型专注于文本处理，参数为3800万，在文本推理和编程等任务中表现卓越，超越多款流行的大型语言模型。

详情入口：

https://www.chinaz.com/ainews/15766.shtml

本站内容来源于网络，并不代表本站立场！版权归原作者所有，转发请注明来源，文章内容仅供参考。
腾云数据--为你提供快速、稳定、安全的专业云计算服务。www.qqidc.com.cn 联系QQ：810379922
本文链接： https://www.qqidc.com.cn/keji/348.html

上一篇
阿里启动2026届春招，开放3000岗位AI相关占近50%

下一篇
字节跳动AI智能助手豆包APP推出“照片动起来”功能

最新文章