羽整理自凹非寺量子位|公眾號QbitAI百度文心大模型開源,如期而至。就在今天,百度官宣文心大模型4.5系列正式開源,還同步提供API服務。此番,百度一次性推出10款開源模型,涵蓋從47B參數的混合專家(MoE)模型到輕量級0.3B稠密型模型,覆蓋文本、多模態等多種任務需求。此次開源不僅權重與代碼完全開放,還同步提供API服務,開發者可通過飛槳星河社區、HuggingFace、百度智能云千帆平臺直接下載使用。值得關注的是,文心大模型4.5開源系列遵照的是Apache2.0協議。10款模型同步開源此次百度一次性推出10款文心大模型4.5系列開源模型,在獨立自研模型數量占比、模型類型數量、參數豐富度、開源寬松度與可靠性等關鍵維度上,都拿出了誠意。文心大模型4.5開源系列,還針對MoE架構提出了一種創新性的多模態異構模型結構。該結構適用于從大語言模型向多模態模型的持續預訓練范式,在保持甚至提升文本任務性能的基礎上,顯著增強了多模態理解能力,其優越的性能主要得益于多模態混合專家模型預訓練、高效訓練推理框架和針對模態的后訓練等關鍵技術點。此外,文心大模型4.5開源系列均使用飛槳深度學習框架進行高效訓練、推理和部署。在大語言模型的預訓練中,模型FLOPs利用率(MFU)達到47%。
文心4.5預訓練模型在主流基準測試中表現優異實驗結果顯示,其系列模型在多個文本和多模態基準測試中達到SOTA水平,尤其在指令遵循、世界知識記憶、視覺理解和多模態推理任務上效果突出。在文本模型方面,文心大模型4.5開源系列在多個主流基準評測中超越DeepSeek-V3、Qwen3等模型。
文心4.5-300B-A47B模型在主流基準測試中表現優異在多模態模型方面,文心大模型4.5開源系列基于強大的視覺感知能力和豐富的視覺常識,實現了思考與非思考統一,在視覺常識、多模態推理、視覺感知等主流的多模態大模型評測中優于閉源的OpenAIo1此外,在輕量模型上,文心4.5-21B-A3B-Base文本模型效果與同量級的Qwen3相當,文心4.5-VL-28B-A3B多模態模型在同量級開源模型中達到SOTA,甚至能和更大參數模型Qwen2.5-VL-32B掰掰手腕。
文心多模態后訓練模型在多個多模態基準測試中達到SOTA水平開發者福利:開箱即用的工具鏈據了解,文心大模型4.5開源系列權重按照Apache2.0協議開源,支持開展學術研究和產業應用。另外基于飛槳提供開源的產業級開發套件,由于其廣泛兼容多種芯片,可以顯著降低模型的后訓練和部署門檻。而作為國內最早投入AI研發的企業之一,百度在算力、框架、模型到應用的四層布局構建了AI全棧技術優勢。其中,飛槳作為中國首個自主研發、功能豐富、開源開放的產業級深度學習平臺,基于多年飛槳開源技術與生態系統積累,本次文心大模型4.5開源系列同步升級發布文心大模型開發套件ERNIEKit和大模型高效部署套件FastDeploy,為文心大模型4.5系列及開發者提供開箱即用的工具和全流程支持。此外值得一提的是,文心大模型4.5系列開源后,百度也實現了框架層與模型層的“雙層開源”。