中國焦點新聞   >   社會  >  正文

阿里云發布通義千問 2.5,趕超 GPT-4,千問 110B 成為全球最強開源大模型

5 月 9 日,通義大模型發布一周年之際,阿里云正式發布通義千問 2.5,模型性能全面趕超 GPT-4 Turbo,成為地表最強中文大模型。同時,通義千問 1100 億參數開源模型在多個基準測評收獲最佳成績,超越 Llama-3-70B,成為全球開源領域最強大模型。

Open LLM LeaderBoard 截圖

技術依然是阿里云在 AI 時代保持領先的最強武器

大模型技術爆發一年多,行業競爭態勢激烈而又多變。通義千問走了一條最 " 卷 " 的路,2023 年 4 月問世以來,始終專注于基礎模型的技術研發,從初代模型升級至 2.5 版本。相比此前的通義千問 2.1 版,通義千問 2.5 的理解能力、邏輯推理、指令遵循、代碼能力分別提升 9%、16%、19%、10%,中文能力更是持續領先業界。

官方提供

同時,通義還發布了 1100 億參數開源模型 Qwen1.5-110B,該模型在 MMLU、TheoremQA、GPQA 等基準測評中超越 Meta 的 Llama-3-70B,在 HuggingFace 開源大模型排行榜 Open LLM Leaderboard 上進入榜首,再度證明通義開源系列業界最強的競爭力。

通義多模態模型和專有能力模型也具備業界頂尖影響力。在多個多模態標準測試中,通義千問視覺理解模型 Qwen-VL-Max 得分超越 Gemini Ultra 和 GPT-4V,這款模型已在多家企業落地;代碼大模型 CodeQwen1.5-7B 則是 HuggingFace 代碼模型榜單 Big Code 的榜首模型,也是國內用戶規模第一的智能編碼助手通義靈碼的底座。

Big Code 截圖

一年間,通義還發展出了業界領先的文生圖、智能編碼、文檔解析、音視頻理解等能力,企業客戶和開發者可以通過 API 調用、模型下載等方式接入通義,個人用戶可從 APP、官網和小程序免費使用通義。大會當日,原通義千問 APP 宣布更名為 " 通義 APP",將通義大模型全套能力集于一身,致力于成為 " 通情達義 " 的全能 AI 助手。

堅定開源路線,成為全球最強開源大模型

去年 8 月,通義宣布加入開源行列,隨之啟動馬不停蹄的開源狂飆,沿著 " 全模態、全尺寸 " 開源路線陸續推出十多款模型。目前,通義開源模型下載量已經超過 700 萬。

大模型的訓練和迭代成本極高,絕大部分的 AI 開發者和中小企業都無法負擔。Meta、阿里云等推動的大模型開源風潮,讓開發者不必從頭訓練模型,還把模型選型的主動權交給了開發者,大大加速了大模型的應用落地進程。

為順應不同場景用戶需求,通義推出參數規模橫跨 5 億到 1100 億的八款大語言模型,小尺寸模型如 0.5B、1.8B、4B、7B、14B,可便捷地在手機、PC 等端側設備部署;大尺寸模型如 72B、110B 能支持企業級和科研級的應用;中等尺寸如 32B 試圖在性能、效率和內存占用之間找到最具性價比的平衡點。此外,通義還開源了視覺理解模型 Qwen-VL、音頻理解模型 Qwen-Audio、代碼模型 CodeQwen1.5-7B、混合專家模型 Qwen1.5-MoE。

通義 72B、110B 開源模型都曾登頂 Open LLM Leaderboard 榜首。在開放研究機構 LMSYS Org 推出的基準測試平臺 Chatbot Arena 上,通義 72B 模型多次進入 " 盲測 " 結果全球 Top 10,創造了國產大模型的先例。

Hugging Face 截圖

長期沉淀的良好口碑為通義開源模型贏得一眾鐵粉,每有開源動作都會早早被開發者 " 蹲守 ",也總能獲得生態伙伴第一時間支持。" 開發者的反饋和開源社區的生態支持,是通義大模型技術進步的重要助力。" 阿里云 CTO 周靖人透露,未來通義大模型還會持續開源。

百煉平臺 2.0 全面升級,提供大模型最強外掛

百煉平臺從模型開發、應用開發到算力底座全面升級,更加易用、更加開放,引入更多模型,還率先兼容 LlamaIndex 等開源框架,企業可自由替換能力組件來適配自身系統。針對當下企業最關注的 RAG 鏈路,百煉提供靈活開放的企業級檢索增強服務,5 到 10 行代碼即可搭建 RAG 應用,讓大模型擁有 " 最強外掛 "。

2023 年 10 月,阿里云發布了百煉大模型平臺,開發者可通過 " 拖拉拽 "5 分鐘開發一款大模型應用,幾小時 " 煉 " 出一個專屬模型,把精力專注于應用創新。本次大會上,百煉升級成為阿里云承載云 +AI 能力的重要平臺,提供一站式、全托管的大模型定制與應用服務。升級后,百煉可以更好地支持大型企業和成熟開發者的需求。

" 當下企業應用大模型存在三種范式:一是對大模型開箱即用,二是對大模型進行微調和持續訓練,三是基于模型開發應用,其中最典型的需求是 RAG,以企業數據對大模型進行知識增強。圍繞這些需求,百煉打造了模型中心和應用中心,提供最豐富的模型和最易用的工具箱。" 周靖人介紹。

對希望直接調用模型進行推理的企業,百煉集成了上百款大模型 api,除了通義、Llama、ChatGLM 等系列,還首家托管百川等系列三方模型,覆蓋國內外主流廠商,聯動魔搭開源社區,同時支持企業上架通用或行業模型,給開發者提供足夠多的模型選擇。同時,百煉依托阿里云 AI 基礎設施,支持千億級模型的萬級并發推理,充分滿足企業需求。

針對需要進一步訓練模型的用戶,百煉提供了從數據管理、模型調優、評測到部署的全鏈路模型服務,用戶可按需彈性調用算力,無需擔心底層架構。訓練過程可視化,還可自動評測模型質量,并與其他模型進行對比。

對希望打造 RAG 應用的企業,百煉支持 Assistant API 開發模式,可在百煉上輕松創建知識庫,并一鍵開啟知識檢索增強(RAG),通過 Assistant API 聯合輸出。同時,百煉支持 agent 智能體開發,并能實現多智能體協作、對話記憶等高級功能。

據介紹,阿里云百煉的一大重要優勢,在于最大程度的開放性和自由度。當下一些大模型應用平臺采用封閉鏈路,不支持替換原子能力,導致企業開發應用時無法引入自研插件,和業務場景充分融合。

百煉率先兼容并優化了 LlamaIndex 等開源架構,擁抱社區生態,支持從本地或不同云端導入 SQL、pdf、excel、ppt 等各種類型數據源,還支持根據需求自由替換精細的能力組件,讓 AI 應用絲滑嵌入企業原有業務系統。

周靖人表示,接下來,百煉將繼續做對開發者最友好、最開放的大模型平臺。阿里云歡迎更多大模型上架,百煉將進一步支持三方模型的微調訓練和云上專屬部署,幫助大模型生態中的企業提供商業化服務。

開源開放,打造最受中國企業歡迎的大模型

通義正在成為最受中國企業歡迎的大模型。根據最新數據,通義通過阿里云服務企業超過 9 萬、通過釘釘服務企業超過 220 萬,現已落地 PC、手機、汽車、航空、天文、礦業、教育、醫療、餐飲、游戲、文旅等領域。

5 月 9 日,小米旗下的人工智能助手 " 小愛同學 " 與阿里云通義大模型達成合作,強化其在圖片生成、圖片理解等方面的多模態 AI 生成能力,并在小米汽車、手機等多類設備落地;微博、眾安保險、完美世界游戲等企業也宣布接入通義大模型,將大模型應用于社交媒體、保險、游戲等領域。

此前,通義大模型還曾 " 上天入地 " 服務客戶,中國科學院國家天文臺人工智能組基于通義千問開發了新一代天文大模型 " 星語 3.0",這是大模型首次應用于天文觀測領域;陜煤建新煤礦等十余座礦山推出由通義支持的新型礦山重大風險識別處置系統,成為大模型在礦山場景的首次規模化落地。

一直以來,阿里云都強調要成為 "AI 時代最開放的云 ",通過開放的算力平臺、開源的自研模型、優質的模型服務,幫助客戶抓住大模型時代的機遇。如今,開源開放戰略正為阿里云帶來新的商業增長。

熱門推薦

聯繫我們|www.chinafocusnews.com All Right Reserve 版權所有