【ＡＩ】百度文小言升級，支持多模型融合調度、圖片問答等功能

　　《經濟通通訊社駐京記者黃燕明３１日北京專電》百度（０９８８８）舉行ＡＩ　ＤＡＹ。
百度文小言宣布完成品牌煥新與功能升級。除品牌視覺形象煥新外，文小言聚焦模型開放與功能
創新，支持多模型融合調度，升級全新語音大模型、圖片問答、ＡＩ生圖生視頻等多項能力，為
用戶帶來更智能、更高效的ＡＩ體驗。
　
　　百度ＡＩ產品創新業務負責人薛蘇強調：「ＡＩ的未來不再是單純的技術參數比拼，而是如
何通過多模型協同，真正為用戶創造價值。文小言希望通過開放生態，整合頂尖模型能力，做出
更強大、更簡單的ＡＩ產品。」
　
　　文小言此次升級的核心在於「多模型融合調度」。通過整合百度自研的文心Ｘ１、文心
４﹒５等模型，並接入ＤｅｅｐＳｅｅｋ－Ｒ１、可靈等第三方優質模型。用戶只需選擇「自動
模式」，即可一鍵調用最優模型組合，或根據需求靈活選擇單一模型完成特定任務，大幅提升響
應速度與任務處理能力。以「設計三種風格的南偏東客廳效果圖」為例，文小言能夠精準解析裝
修風格差異，調用文心Ｘ１完成深度推理，生成三幅風格迥異但視角一致的裝修效果圖。
　
＊大模型調用成本比行業平均降低５０％－９０％＊
　
　　文小言此次進一步提升了全新語音大模型、圖片問答、ＡＩ生圖生視頻等能力，支持方言對
話、複雜知識問答及隨時打斷等場景，用戶可進行語音知識問答或趣味角色扮演。
　
　　百度語音首席架構師賈磊透露，該模型是百度在業界首個推出、基於全新互相關注意力
（Ｃｒｏｓｓ－Ａｔｔｅｎｔｉｏｎ）的端到端語音語言大模型。在語音場景滿足一定交互指標
下，大模型調用成本比行業平均降低５０％－９０％，推理響應速度極快，將語音交互等待時間
壓縮至１秒左右，極大提升了交互流暢性。同時，在大模型加持下，實現了流式逐字的ＬＬＭ驅
動的多情感語音合成，情感飽滿、逼真、擬人，交互聽感也得到極大提升。

【你點睇？】5支的士車隊陸續投入服務，提供網約服務及電子支付等，收費較咪錶價高，你會否考慮選用服務？► 立即投票

大國博弈

埃爾多安日子倒數？土耳其大示威衝擊地緣政治

貨幣攻略

高息定存 | 滙豐3個月特選客3.4厘，工銀98日3.43厘

說說心理話

備註：	即時報價更新時間為03/04/2025 17:59
	港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站