当前位置: 首页> 腾云科技> 正文

微软发布 Phi-4 多模态与迷你模型,语音视觉文本处理再升级

微软最近推出了Phi-4系列的新模型,包括Phi-4多模态和Phi-4迷你,Phi-4多模态模型集成了语音、视觉和文本处理,参数达到5600万,在多项基准测试中表现优异,尤其是在自动语音识别和翻译任务中表现突出。Phi-4迷你则专注于文本处理,参数为3800万,表现同样出色。

亮点提要:

Phi-4多模态模型是微软首款集成语音、视觉和文本处理的统一架构模型,参数达到5600万,表现超越许多竞争对手。

在视觉处理和数学推理方面,Phi-4多模态模型表现出色,能够有效理解文档和图表,并执行光学字符识别。

Phi-4迷你模型专注于文本处理,参数为3800万,在文本推理和编程等任务中表现卓越,超越多款流行的大型语言模型。

详情入口:

https://www.chinaz.com/ainews/15766.shtml