DeepSeek團隊聯合北京大學於27日發布論文《DSpark:基於置信度調度的推測解碼與半自回歸生成》,DeepSeek創始人梁文鋒位列作者名單。這是繼6月中旬完成500億元人民幣融資後,DeepSeek首次開源新成果。
論文介紹了其推理加速框架DSpark,旨在解決大語言模型在高並發場景下的推理效率瓶頸。該框架採用半自回歸生成架構,融合高吞吐並行生成與輕量級串行校驗,並引入置信度調度驗證機制,可根據系統負載動態調整驗證長度。實測數據顯示,部署於DeepSeek-V4線上服務後,單用戶生成速度提升60%-85%,高並發場景下有效吞吐量翻4倍。
在論文中,團隊開源了DSpark模型權重,並同步發布了面向推測解碼、由算法驅動的訓練代碼倉庫DeepSpec。
《經濟通通訊社29日專訊》
獨家優惠【etnet x 環球海產】用戶專享全場95折,特價貨品更可折上折。立即使用優惠代碼【ETN1WWS】,選購五星級酒店級海鮮► 立即瀏覽
























