《經濟通通訊社駐京記者黃燕明31日北京專電》百度(09888)舉行AI DAY。
百度文小言宣布完成品牌煥新與功能升級。除品牌視覺形象煥新外,文小言聚焦模型開放與功能
創新,支持多模型融合調度,升級全新語音大模型、圖片問答、AI生圖生視頻等多項能力,為
用戶帶來更智能、更高效的AI體驗。
百度AI產品創新業務負責人薛蘇強調:「AI的未來不再是單純的技術參數比拼,而是如
何通過多模型協同,真正為用戶創造價值。文小言希望通過開放生態,整合頂尖模型能力,做出
更強大、更簡單的AI產品。」
文小言此次升級的核心在於「多模型融合調度」。通過整合百度自研的文心X1、文心
4﹒5等模型,並接入DeepSeek-R1、可靈等第三方優質模型。用戶只需選擇「自動
模式」,即可一鍵調用最優模型組合,或根據需求靈活選擇單一模型完成特定任務,大幅提升響
應速度與任務處理能力。以「設計三種風格的南偏東客廳效果圖」為例,文小言能夠精準解析裝
修風格差異,調用文心X1完成深度推理,生成三幅風格迥異但視角一致的裝修效果圖。
*大模型調用成本比行業平均降低50%-90%*
文小言此次進一步提升了全新語音大模型、圖片問答、AI生圖生視頻等能力,支持方言對
話、複雜知識問答及隨時打斷等場景,用戶可進行語音知識問答或趣味角色扮演。
百度語音首席架構師賈磊透露,該模型是百度在業界首個推出、基於全新互相關注意力
(Cross-Attention)的端到端語音語言大模型。在語音場景滿足一定交互指標
下,大模型調用成本比行業平均降低50%-90%,推理響應速度極快,將語音交互等待時間
壓縮至1秒左右,極大提升了交互流暢性。同時,在大模型加持下,實現了流式逐字的LLM驅
動的多情感語音合成,情感飽滿、逼真、擬人,交互聽感也得到極大提升。
【你點睇?】5支的士車隊陸續投入服務,提供網約服務及電子支付等,收費較咪錶價高,你會否考慮選用服務?► 立即投票