36 氪獲悉,月之暗面 Kimi 發(fā)布 MoE 架構基礎模型 K2 并同步開源,總參數(shù) 1T,激活參數(shù) 32B,在自主編程、工具調(diào)用、數(shù)學推理等領域超越全球其他開源模型。Kimi K2 使用 MuonClip 優(yōu)化器實現(xiàn)萬億參數(shù)模型的高效訓練,在高質(zhì)量數(shù)據(jù)遇到瓶頸的背景下通過提升 Token 效率,找到新的預訓練擴展空間。K2 具備更強代碼能力,擅長通用 Agent 任務,在多個實際場景中展現(xiàn)出更強的能力泛化及實用性,新模型目前已上線開放體驗。
36氪
昨天