阿里發布并開源千問3,稱成本僅需DeepSeek-R1三分之一
      來源:第一財經作者:陳楊園2025-04-29 09:24

      4月29日凌晨,阿里巴巴宣布推出新一代通義千問模型Qwen3(千問3)并進行開源。阿里云方面表示,千問3是國內首個“混合推理模型”,將“快思考”與“慢思考”集成進同一個模型,參數量僅為DeepSeek-R1的1/3,成本大幅下降,并在ChatBot Arena等榜單中性能全面超越R1、OpenAI-o1等全球頂尖模型,登頂全球最強開源模型。知情人士對記者表示,這是今年上半年阿里云最核心的技術產品發布。

      具體來看,通義千問官方發布的技術博客顯示,千問3采用混合專家(MoE)架構,總參數量235B,激活僅需22B。預訓練數據量達36T ,并在后訓練階段多輪強化學習。同時將非思考模式無縫整合到思考模型中,對簡單需求可“快思考”,低算力“秒回”答案,對復雜問題可多步驟“深度思考”,兩種模式的結合增強了模型實現穩定且高效的“思考預算”控制能力。

      阿里云方面表示,性能大幅提升的同時,千問3的部署成本大幅下降,僅需4張H20即可部署千問3滿血版,顯存占用僅為DeepSeek-R1的三分之一。

      目前,千問3已開源了2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,阿里云透露,千問3的30B參數MoE模型實現了10倍以上的模型性能杠桿提升,僅激活3B就能實現上代Qwen2.5-32B模型性能。所有千問3模型都是混合推理模型,API可按需設置“思考預算”(即預期最大深度思考的tokens數量),靈活滿足AI應用和不同場景對性能和成本的多樣需求。

      開源后,用戶可在魔搭社區、HuggingFace等平臺下載模型并商用,也可以通過阿里云百煉調用千問3的API服務。個人用戶可通過通義APP體驗千問3,記者了解到,夸克也即將全線接入千問3。

      未來,千問3將通過優化模型架構和訓練方法等提升模型,以實現幾個關鍵目標:擴展數據規模、增加模型大小、延長上下文長度、拓寬模態范圍,并利用環境反饋推進強化學習以進行長周期推理。通義千問團隊在技術博客中表示,“Qwen3 代表了我們在通往通用人工智能(AGI)和超級人工智能(ASI)旅程中的一個重要里程碑。我們認為,我們正從專注于訓練模型的時代過渡到以訓練 Agent 為中心的時代。”

      責任編輯: 李志強
      聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
      下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態,洞察政策信息,把握財富機會。
      網友評論
      登錄后可以發言
      發送
      網友評論僅供其表達個人看法,并不表明證券時報立場
      暫無評論
      為你推薦
      時報熱榜
      換一換
        熱點視頻
        換一換
        最新久久免费视频| 成人综合婷婷国产精品久久蜜臀| 成人综合久久综合| 无码精品久久久天天影视| 亚洲国产高清精品线久久| 久久永久免费人妻精品下载| 狠狠人妻久久久久久综合蜜桃| 91综合久久婷婷久久| 综合久久久久久中文字幕亚洲国产国产综合一区首 | 国产精品亚洲综合专区片高清久久久| 日韩久久久久久中文人妻| 久久青青草原精品国产软件| 亚洲国产精品美女久久久久| 性做久久久久久久| 伊人久久大香线蕉亚洲| 爱做久久久久久久久久| 久久精品国产亚洲av影院| 亚洲中文字幕无码久久精品1| 色偷偷色噜噜狠狠网站久久| 久久亚洲日韩看片无码| 波多野结衣中文字幕久久| 狠狠色综合网久久久久久| 久久精品青青草原伊人| 久久国产乱子伦精品免费不卡| 狠狠人妻久久久久久综合| 国产精品福利久久香蕉中文| 久久久久久久久波多野高潮| 久久久亚洲精品无码| 久久综合九色综合欧洲| 国产综合精品久久亚洲| 国产成人精品综合久久久| 久久精品成人一区二区三区| 91精品国产91久久久久久蜜臀| 一本大道加勒比久久综合| 久久久91精品国产一区二区三区 | 久久无码人妻一区二区三区 | 好了av第四综合无码久久| 亚洲国产精品成人久久久| 亚洲嫩草影院久久精品| 无码伊人66久久大杳蕉网站谷歌 | 久久综合九色综合精品|