内地低成本AI大模型发展迅勐高端晶片依赖减

阿里巴巴

。2025年4月29日，宣布开源新一代通义千问模型Qwen3。

。中国首个混合推理模型系列

。包含2款参数规模分別爲30B和235B的混合专家(MoE)模型。

。235B模型的参数量仅爲DeepSeek-R1的三分之一。

。成本大幅下降。

。性能更全面超越R1、OpenAI-o1等全球顶尖模型。

。再度刷新中国AI发展记录。

小米集团

。2025年4月30日官宣推出专注推理能力的开源大模型「Xiaomi MiMo」。

。仅用7B参数规模。

。在数学推理和代码竞赛测评中超越OpenAI的闭源模型o1-mini以及阿里巴巴Qwen的开源推理模型QwQ-32B-Preview。

另外一些相关讯息

。小米正在建设万卡GPU集群，並引入顶尖AI人才。

。腾讯近日宣布对其混元大模型研发体系进行了全面重构，加码研发投入，並重新部署团队成立大语言模型部和多模态模型部两个新的部门。

。蚂蚁集团近期的实验结果显示，其3000亿参数的MoE大模型可在使用国产GPU的低性能设备上完成高效训练，性能与完全使用英伟达晶片、同规模的稠密模型及MoE模型相当，现时国产大模型对高端晶片性能的依赖正在降低。

腾讯混元大模型、阿里千问大模型等的近期发展，多数是按高速、慢速、和将推理和学习能力分成两种，从而采用不同的晶片，可以大幅减低参数，解决依赖高端晶片的问题，相信也都或会是未来的发展方向。

管理署

一言以蔽之，管理就是化繁为简，系统经营，讲究效率，绩效次之。管理署收集各种社会讯息供参考，一起改善管理效率和效绩。

上载日期：2025.5.1

日志