據公眾號「京東黑板報」消息,京東(09618)近日開源實時視頻視覺語言交互模型JoyAI-VL-Interaction。據介紹,這是全球首個全棧開源的Interaction模型和系統,並獲得vLLM-Omni的day-0原生支持。它讓大模型從「一問一答」走向「邊看邊說」,開發者基於這套框架,可以快速搭建能持續觀察、自主判斷、即時響應的實景AI助手。
京東表示,相比傳統模型,JoyAI-VL-Interaction有三重突破:主動判斷、實時響應、適時智能體委託,同時保持觀察和交互。此外,該模型支持攝像頭、直播流、監控流等多種視頻輸入,也支持語音輸入輸出、可視化界面、長期記憶、後台模型接口和vLLM部署方案。
《經濟通通訊社22日專訊》
【香港好去處】2026去邊最好玩?etnet為你提供全港最齊盛事活動,所有資訊盡在掌握!► 即睇
























