05/04/2024
AI | 打破美國AI霸權?法國初創Mistral AI走開源路線,降低模型訓練成本,劍指OpenAI龍頭地位!
生成式AI熱潮橫掃全球,OpenAI、Anthropic等乘勢而起,搶佔大量市場份額,讓AI市場被美國公司完全主導,但此局面或許會被來自法國的Mistral AI所打破。這家成立不到一年、只有25名員工的AI初創,已推出能跟OpenAI匹敵的AI產品,並先後獲得輝達(NVIDIA)、微軟(Microsoft)的注資,因而受到市場高度關注。究竟Mistral AI有何過人之處,可以讓它在短時間內躍居為歐洲最熱門的AI公司、甚至是OpenAI的最強挑戰者呢?
7頁簡報換來1.13億美元投資
2023年5月,Mistral AI正式註冊成立,3位聯合創辦人亞瑟·門施(Arthur Mensch)、蒂莫西·拉克魯瓦(Timothée Lacroix)、以及紀堯姆·蘭普爾(Guillaume Lample)從學生時代已認識。門施曾擔任Google DeepMind部門的研究員,是大型語言模型Chinchilla與視覺語言模型Flamingo的骨幹開發成員。拉克魯瓦、蘭普爾曾在Facebook母公司Meta的巴黎AI實驗室工作,是開源模型Llama與Llama 2的核心貢獻者。
該公司成立一個月後,只有6名員工,還未造出任何產品,但卻憑著7頁Powerpoint簡報,成功取得1.13億美元(約8.81億港元)的投資,是歐洲有史以來最大筆的種子輪融資,令公司估值達到2.6億美元(約20.28億港元),震動整個歐洲AI業界。
2023年9月,Mistral AI發布第一個AI模型「Mistral 7B」,所有基準測試中表現均優於Meta Llama 2;同年12月推出第二個模型「Mixtral 8x7B」,能夠處理32K token(相等於2.5個英文單字)上下文,大多數基準測試表現勝過OpenAI GPT-3.5。
先後獲NVIDIA、微軟策略投資
憑著如此亮麗的產品成績,Mistral AI於2023年12月完成4.15億美元(約32.37億港元)的A輪融資,讓公司估值暴增至20億美元(約156億港元),躋身為歐洲獨角獸之一。這次由著名創投公司Andreessen Horowitz(a16z)領投,吸引了NVIDIA參與投資,並成為Mistral AI的策略合作夥伴,這讓該公司有管道取得輝達的最新技術。
2024年2月,Mistral AI釋出全新大型語言模型「Mistral Large」、以及類似ChatGPT的聊天機械人「Le Chat」。在多項基準測試中,Mistral Large的成績優於Google Gemini Pro、Anthropic Claude 2和Meta Llama 2,僅遜於GPT-4,。
Mistral AI的聊天機械人「Le Chat」現仍處於測試階段,大家只要前往chat.mistral.ai註冊新帳戶,即可免費試用。(圖片來源:翻攝Mistral AI官網)
同月,微軟宣布與Mistral AI達成合作夥伴關係。據悉,微軟不但向Mistral AI投入1,500萬歐元(約1.27億港元)的資金,還會向其Azure雲端平台客戶提供Mistral Large的服務選項。近日更有消息指,日本軟銀集團有意參與Mistral AI下一輪融資,可能讓其估值突破20億美元。
模型完全開源,使用修改無限制
為甚麼Mistral AI被那麼多人看好?儘管其商業模式跟OpenAI非常相似,同樣是通過API來提供大型語言模型,然後按照使用量向客戶收費,但它與OpenAI的最大分野是,堅持走「開放源碼」(Open Source)路線。在開源授權模式下,Mistral模型內部結構是公開的,任何人都可以修改;開發者可根據業務需要來調整模型大小,藉此控制成本或適應特定任務。
Mistral Large採用「Mixture of Experts」(MoE)架構,模型表現直逼GPT-4,因此被喻為是OpenAI的最強挑戰者。(圖片來源:Mistral AI官網)
Mistral AI商業長弗洛里安·布雷桑(Florian Bressand)指出,對國營或受嚴格管制的機構來說,開源AI模型特別有吸引力。譬如說,國防企業或銀行有意採用生成式AI,但因條例規限而不能使用閉源的專有軟件(Proprietary Software),這時候開源模型就是唯一選擇。
目前市場上最出名的開源模型是Meta Llama 2,但它會根據用戶規模和使用目的而施加相應限制,例如月均活躍用戶在7億以上便要向Meta申請特殊授權。至於Mistral模型,對用戶的使用、複製、修改程式碼均沒有任何限制。
目前有十多家企業採用Mistral模型,客戶來自全球各地,當中包括法國巴黎銀行。據悉,Mistral AI平台的使用量約有5成來自美國。(圖片來源:維基百科)
Mistral模型變小,訓練成本低
更重要的是,Mistral AI非常擅於整理和篩選用於訓練模型的數據,能夠過濾當中重複或無意義的雜訊,因此可用較少數據來訓練AI模型,讓其模型訓練成本遠低於GPT-4的1億美元(約7.8億港元)。同時,因為訓練數據量較少,模型規模也變小了,所以客戶可以直接在自己的電腦上運行Mistral模型,不需再花大錢租用雲端數據中心。
在地緣政治局勢日趨緊張下,愈來愈多國家認為本土研發的大型語言模型可以帶來經濟和戰略上的優勢;尤其是歐洲企業,不願被單一美國AI平台綁定,可能有較高意願支付Mistral模型的使用費。
繼Meta 與Google後,開源陣營再添一名新力軍Mistral AI,令AI開源聲勢看似大振。惟真正決勝關鍵在於,OpenAI在2024年夏季發布新一代大型語言模型「GPT-5」的實際表現如何。倘若它的效能較上代有飛躍改進,甚至完全輾壓Mistral Large、Meta Llama、Google Gemma等開源模型,那麼OpenAI一家獨大的局面很有可能會持續下去。
延伸閱讀:
GPT-4閉源惹議!Google推開源模型Gemma,為AI競爭添新變數,扭轉OpenAI獨大局面?
GPT Store複製App Store神話?OpenAI建構AI應用平台經濟,邁向AI霸權的關鍵一步!
樂本健【雙11感謝祭】雙重優惠、多買多賞► 了解詳情