阿里巴巴
。2025年4月29日,宣布開源新一代通義千問模型Qwen3。
。中國首個混合推理模型系列
。包含2款參數規模分別爲30B和235B的混合專家(MoE)模型。
。235B模型的參數量僅爲DeepSeek-R1的三分之一。
。成本大幅下降。
。性能更全面超越R1、OpenAI-o1等全球頂尖模型。
。再度刷新中國AI發展記錄。
小米集團
。2025年4月30日官宣推出專注推理能力的開源大模型「Xiaomi MiMo」。
。僅用7B參數規模。
。在數學推理和代碼競賽測評中超越OpenAI的閉源模型o1-mini以及阿里巴巴Qwen的開源推理模型QwQ-32B-Preview。
另外一些相關訊息
。小米正在建設萬卡GPU集群,並引入頂尖AI人才。
。騰訊近日宣布對其混元大模型研發體系進行了全面重構,加碼研發投入,並重新部署團隊成立大語言模型部和多模態模型部兩個新的部門。
。螞蟻集團近期的實驗結果顯示,其3000億參數的MoE大模型可在使用國產GPU的低性能設備上完成高效訓練,性能與完全使用英偉達晶片、同規模的稠密模型及MoE模型相當,現時國產大模型對高端晶片性能的依賴正在降低。
騰訊混元大模型、阿里千問大模型等的近期發展,多數是按高速、慢速、和將推理和學習能力分成兩種,從而采用不同的晶片,可以大幅減低參數,解決依賴高端晶片的問題,相信也都或會是未來的發展方向。
管理署
一言以蔽之,管理就是化繁為簡,系統經營,講究效率,績效次之。管理署收集各種社會訊息供參考,一起改善管理效率和效績。
上載日期:2025.5.1