【ＡＩ】阿里發布兩款語音新模型，可定制角色及模擬背景音

02/03/2026 14:16

　　3月2日，阿里發布兩款語音新模型，基於參考音頻的聲音克隆模型Fun-CosyVoice3.5和無參考音頻的音色設計模型Fun-AudioGen-VD。兩款模型均引入「指令遵循」能力，自由控制聲音的情感、語速、場景等，可用freestyle（自由風格模式）定制角色，適用於有聲書、遊戲、客服、播客、教育、直播等多個場景。即日起，用戶可在阿里雲百煉調用這兩款最新模型。

　　據了解，兩款模型在同尺寸模型的基準評測中斬獲多項SOTA。在Seed-TTS基準測試的中文「困難案例」指標中，Fun-CosyVoice3.5表現搶眼，詞錯誤率(Word Error Rate, WER)和說話人相似度(Speaker Similarity, SSIM)，均為最佳。同時，因為優化了「困難案例」的發音，生僻字句錯率由15.2%降低到5.3%。

　　官方介紹稱，兩款模型均支持通過自然語言指令控制語音生成，但應用方向不同：Fun-CosyVoice3.5支持自由風格模式指令控制，Fun-AudioGen-VD則專注「從無到有」的音色設計，其不僅能根據描述定制音色和情感，還能同步模擬複雜的聽覺環境。此外，Fun-CosyVoice3.5所用的tokenizer幀率減半，提高了訓練效率，並且首包延遲降低35%，大幅提升了實時交互體驗。
《經濟通通訊社2日專訊》

【你點睇？】電動車「一換一」告終，政府認為本港電動車市場已逐步成熟，階段性任務已完成，你是否認同？► 立即投票

【ＡＩ】阿里發布兩款語音新模型，可定制角色及模擬背景音

【兩會在即】人大四次會議周三召開新聞發布會，回答中外傳媒提問 02/03/2026 14:16

《Ａ股焦點》比亞迪周四召開「顛覆性」技術發布會，ＡＨ股齊急漲 02/03/2026 14:14

其他全日新聞

《Ａ股焦點》雙良節能跌停，涉信息披露違規被中證監立案 02/03/2026 14:27

《Ａ股異動》赤峰黃金Ａ漲停，現報４３﹒９１元人幣 02/03/2026 14:25

【ＦＯＣＵＳ】伊朗深陷連鎖誤判，中國暗藏能源底牌 02/03/2026 14:20

《Ａ股行情》滬綜指午後升０﹒５％，三桶油率石油板塊掀漲停潮 02/03/2026 13:47

《Ａ股焦點》地緣衝突或推高煤價，煤炭板塊拉升，中煤能源Ａ一… 02/03/2026 13:42