日志

内地低成本AI大模型发展迅勐 高端晶片依赖减

内地低成本AI大模型发展迅勐 高端晶片依赖减

 

阿里巴巴

。2025年4月29日,宣布开源新一代通义千问模型Qwen3。
。中国首个混合推理模型系列
。包含2款参数规模分別爲30B和235B的混合专家(MoE)模型。
。235B模型的参数量仅爲DeepSeek-R1的三分之一。
。成本大幅下降。
。性能更全面超越R1、OpenAI-o1等全球顶尖模型。
。再度刷新中国AI发展记录。
小米集团
。2025年4月30日官宣推出专注推理能力的开源大模型「Xiaomi MiMo」。
。仅用7B参数规模。
。在数学推理和代码竞赛测评中超越OpenAI的闭源模型o1-mini以及阿里巴巴Qwen的开源推理模型QwQ-32B-Preview。
 
另外一些相关讯息
小米正在建设万卡GPU集群,並引入顶尖AI人才。
。腾讯近日宣布对其混元大模型研发体系进行了全面重构,加码研发投入,並重新部署团队成立大语言模型部和多模态模型部两个新的部门。
。蚂蚁集团近期的实验结果显示,其3000亿参数的MoE大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达晶片、同规模的稠密模型及MoE模型相当,现时国产大模型对高端晶片性能的依赖正在降低。
 
腾讯混元大模型、阿里千问大模型等的近期发展,多数是按高速、慢速、和将推理和学习能力分成两种,从而采用不同的晶片,可以大幅减低参数,解决依赖高端晶片的问题,相信也都或会是未来的发展方向。
 

管理署

一言以蔽之,管理就是化繁为简,系统经营,讲究效率,绩效次之。管理署收集各种社会讯息供参考,一起改善管理效率和效绩。

 

上载日期:2025.5.1