阿里云發布通義千問 2.5，趕超 GPT-4，千問 110B 成為全球最強開源大模型

2024-05-09 23:38:38 36氪

5 月 9 日，通義大模型發布一周年之際，阿里云正式發布通義千問 2.5，模型性能全面趕超 GPT-4 Turbo，成為地表最強中文大模型。同時，通義千問 1100 億參數開源模型在多個基準測評收獲最佳成績，超越 Llama-3-70B，成為全球開源領域最強大模型。

Open LLM LeaderBoard 截圖

技術依然是阿里云在 AI 時代保持領先的最強武器

大模型技術爆發一年多，行業競爭態勢激烈而又多變。通義千問走了一條最 " 卷 " 的路，2023 年 4 月問世以來，始終專注于基礎模型的技術研發，從初代模型升級至 2.5 版本。相比此前的通義千問 2.1 版，通義千問 2.5 的理解能力、邏輯推理、指令遵循、代碼能力分別提升 9%、16%、19%、10%，中文能力更是持續領先業界。

官方提供

同時，通義還發布了 1100 億參數開源模型 Qwen1.5-110B，該模型在 MMLU、TheoremQA、GPQA 等基準測評中超越 Meta 的 Llama-3-70B，在 HuggingFace 開源大模型排行榜 Open LLM Leaderboard 上進入榜首，再度證明通義開源系列業界最強的競爭力。

通義多模態模型和專有能力模型也具備業界頂尖影響力。在多個多模態標準測試中，通義千問視覺理解模型 Qwen-VL-Max 得分超越 Gemini Ultra 和 GPT-4V，這款模型已在多家企業落地；代碼大模型 CodeQwen1.5-7B 則是 HuggingFace 代碼模型榜單 Big Code 的榜首模型，也是國內用戶規模第一的智能編碼助手通義靈碼的底座。

Big Code 截圖

一年間，通義還發展出了業界領先的文生圖、智能編碼、文檔解析、音視頻理解等能力，企業客戶和開發者可以通過 API 調用、模型下載等方式接入通義，個人用戶可從 APP、官網和小程序免費使用通義。大會當日，原通義千問 APP 宣布更名為 " 通義 APP"，將通義大模型全套能力集于一身，致力于成為 " 通情達義 " 的全能 AI 助手。

堅定開源路線，成為全球最強開源大模型

去年 8 月，通義宣布加入開源行列，隨之啟動馬不停蹄的開源狂飆，沿著 " 全模態、全尺寸 " 開源路線陸續推出十多款模型。目前，通義開源模型下載量已經超過 700 萬。

大模型的訓練和迭代成本極高，絕大部分的 AI 開發者和中小企業都無法負擔。Meta、阿里云等推動的大模型開源風潮，讓開發者不必從頭訓練模型，還把模型選型的主動權交給了開發者，大大加速了大模型的應用落地進程。

為順應不同場景用戶需求，通義推出參數規模橫跨 5 億到 1100 億的八款大語言模型，小尺寸模型如 0.5B、1.8B、4B、7B、14B，可便捷地在手機、PC 等端側設備部署；大尺寸模型如 72B、110B 能支持企業級和科研級的應用；中等尺寸如 32B 試圖在性能、效率和內存占用之間找到最具性價比的平衡點。此外，通義還開源了視覺理解模型 Qwen-VL、音頻理解模型 Qwen-Audio、代碼模型 CodeQwen1.5-7B、混合專家模型 Qwen1.5-MoE。

通義 72B、110B 開源模型都曾登頂 Open LLM Leaderboard 榜首。在開放研究機構 LMSYS Org 推出的基準測試平臺 Chatbot Arena 上，通義 72B 模型多次進入 " 盲測 " 結果全球 Top 10，創造了國產大模型的先例。

Hugging Face 截圖

長期沉淀的良好口碑為通義開源模型贏得一眾鐵粉，每有開源動作都會早早被開發者 " 蹲守 "，也總能獲得生態伙伴第一時間支持。" 開發者的反饋和開源社區的生態支持，是通義大模型技術進步的重要助力。" 阿里云 CTO 周靖人透露，未來通義大模型還會持續開源。

百煉平臺 2.0 全面升級，提供大模型最強外掛

百煉平臺從模型開發、應用開發到算力底座全面升級，更加易用、更加開放，引入更多模型，還率先兼容 LlamaIndex 等開源框架，企業可自由替換能力組件來適配自身系統。針對當下企業最關注的 RAG 鏈路，百煉提供靈活開放的企業級檢索增強服務，5 到 10 行代碼即可搭建 RAG 應用，讓大模型擁有 " 最強外掛 "。

2023 年 10 月，阿里云發布了百煉大模型平臺，開發者可通過 " 拖拉拽 "5 分鐘開發一款大模型應用，幾小時 " 煉 " 出一個專屬模型，把精力專注于應用創新。本次大會上，百煉升級成為阿里云承載云 +AI 能力的重要平臺，提供一站式、全托管的大模型定制與應用服務。升級后，百煉可以更好地支持大型企業和成熟開發者的需求。

、

" 當下企業應用大模型存在三種范式：一是對大模型開箱即用，二是對大模型進行微調和持續訓練，三是基于模型開發應用，其中最典型的需求是 RAG，以企業數據對大模型進行知識增強。圍繞這些需求，百煉打造了模型中心和應用中心，提供最豐富的模型和最易用的工具箱。" 周靖人介紹。

對希望直接調用模型進行推理的企業，百煉集成了上百款大模型 api，除了通義、Llama、ChatGLM 等系列，還首家托管百川等系列三方模型，覆蓋國內外主流廠商，聯動魔搭開源社區，同時支持企業上架通用或行業模型，給開發者提供足夠多的模型選擇。同時，百煉依托阿里云 AI 基礎設施，支持千億級模型的萬級并發推理，充分滿足企業需求。

針對需要進一步訓練模型的用戶，百煉提供了從數據管理、模型調優、評測到部署的全鏈路模型服務，用戶可按需彈性調用算力，無需擔心底層架構。訓練過程可視化，還可自動評測模型質量，并與其他模型進行對比。

對希望打造 RAG 應用的企業，百煉支持 Assistant API 開發模式，可在百煉上輕松創建知識庫，并一鍵開啟知識檢索增強（RAG），通過 Assistant API 聯合輸出。同時，百煉支持 agent 智能體開發，并能實現多智能體協作、對話記憶等高級功能。

據介紹，阿里云百煉的一大重要優勢，在于最大程度的開放性和自由度。當下一些大模型應用平臺采用封閉鏈路，不支持替換原子能力，導致企業開發應用時無法引入自研插件，和業務場景充分融合。

百煉率先兼容并優化了 LlamaIndex 等開源架構，擁抱社區生態，支持從本地或不同云端導入 SQL、pdf、excel、ppt 等各種類型數據源，還支持根據需求自由替換精細的能力組件，讓 AI 應用絲滑嵌入企業原有業務系統。