(相關資料圖)
據美團官微消息,11月3日,美團LongCat-Flash系列再升級,正式發布全新家族成員——LongCat-Flash-Omni。
自9月1日,美團正式發布LongCat-Flash系列模型,現已開源LongCat-Flash-Chat和LongCat-Flash-Thinking兩大版本。
據介紹,LongCat-Flash-Omni是一款開源全模態模型,在一體化框架中整合了離線多模態理解與實時音視頻交互能力。LongCat-Flash-Omni以LongCat-Flash系列的高效架構設計為基礎(Shortcut-Connected MoE,含零計算專家),同時創新性集成了高效多模態感知模塊與語音重建模塊。即便在總參數5600億(激活參數270億)的龐大參數規模下,仍實現了低延遲的實時音視頻交互能力,為開發者的多模態應用場景提供了更高效的技術選擇。
綜合評估結果表明,LongCat-Flash-Omni在全模態基準測試中達到開源最先進水平(SOTA),同時在文本、圖像、視頻理解及語音感知與生成等關鍵單模態任務中,均展現出極強的競爭力。LongCat-Flash-Omni是業界首個實現 “全模態覆蓋、端到端架構、大參數量高效推理” 于一體的開源大語言模型,首次在開源范疇內實現了全模態能力對閉源模型的對標,并憑借創新的架構設計與工程優化,讓大參數模型在多模態任務中也能實現毫秒級響應,解決了行業內推理延遲的痛點。