当前位置: 首页> 腾云科技> 正文

阿里巴巴达摩院推出电商场景多模态大模型Valley 2

阿里巴巴达摩院推出的Valley2是一款多模态大型语言模型,专为电商场景设计,旨在提升各领域的性能并拓展应用边界。该模型结合了先进的视觉编码器和创新的处理模块,展现了在多个基准测试中的卓越表现,标志着多模态语言模型的重大进展。

Valley.png

亮点提要:

Valley2基于电商场景设计,采用Qwen2.5作为主干,结合SigLIP-384视觉编码器,提升多模态处理能力。

训练过程包括文本-视觉对齐和链式思维后训练,确保模型在复杂问题解决中的高效性。

在多个公开基准测试中,Valley2表现卓越,尤其在电商领域的应用中超越同规模模型。

详情入口:

https://www.modelscope.cn/models/bytedance-research/Valley-Eagle-7B