壹号娱乐 - NG大舞台,有梦你就来 - 小米多模态大模型MiMo-VL开源，官方称多方面领先 Qwen2.5-VL-7B

5 月 30 日，Xiaomi MiMo 官方大众号发文宣告，小米多模态大模型 Xiaomi MiMo-VL 现已正式开源。官方表明，其在图片、视频、言语的通用问答和了解推理等多个使命上，大幅抢先同尺度标杆多模态模型 Qwen2.5-VL-7B，并且在 GUI Grounding 使命上比肩专用模型，为 Agent 年代而来。

MiMo-VL-7B 在坚持 MiMo-7B 纯文本推理才能的一起，在多模态推理使命上，仅用 7B 参数规划，在奥林匹克比赛（OlympiadBench）和多个数学比赛（MathVision、MathVerse）大幅抢先 10 倍参数大的阿里 Qwen-2.5-VL-72B 和 QVQ-72B-Preview，也逾越闭源模型 GPT-4o。

资讯详情

相关推荐

英特尔与阿里云签署战略合作备忘录，将在云转播等领域展开密切合作

苹果 Apple Intelligence 前瞻调查：将改变短信和邮件、Siri、照片编辑交互方式

全球金融科技投资放缓之际，新加坡重回增长轨道

多邻国收购了音游厂商NextBeat

滴滴回应：未删道歉微博，网友误解了；华为推出最新AI芯片，将用于10月发布的Mate 20 | 早8点档

阿联酋 du 与华为签署 5.5G 战略合作谅解备忘录，持续引领数智阿联酋