性刺激久久久久久久久,亚洲精品tv久久久久久久久,国产精品成人99久久久久

阿里發布并開源千問3，稱成本僅需DeepSeek-R1三分之一

來源：第一財經作者：陳楊園2025-04-29 09:24

4月29日凌晨，阿里巴巴宣布推出新一代通義千問模型Qwen3（千問3）并進行開源。阿里云方面表示，千問3是國內首個“混合推理模型”，將“快思考”與“慢思考”集成進同一個模型，參數量僅為DeepSeek-R1的1/3，成本大幅下降，并在ChatBot Arena等榜單中性能全面超越R1、OpenAI-o1等全球頂尖模型，登頂全球最強開源模型。知情人士對記者表示，這是今年上半年阿里云最核心的技術產品發布。

具體來看，通義千問官方發布的技術博客顯示，千問3采用混合專家（MoE）架構，總參數量235B，激活僅需22B。預訓練數據量達36T ，并在后訓練階段多輪強化學習。同時將非思考模式無縫整合到思考模型中，對簡單需求可“快思考”，低算力“秒回”答案，對復雜問題可多步驟“深度思考”，兩種模式的結合增強了模型實現穩定且高效的“思考預算”控制能力。

阿里云方面表示，性能大幅提升的同時，千問3的部署成本大幅下降，僅需4張H20即可部署千問3滿血版，顯存占用僅為DeepSeek-R1的三分之一。

目前，千問3已開源了2款30B、235B的MoE模型，以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型，阿里云透露，千問3的30B參數MoE模型實現了10倍以上的模型性能杠桿提升，僅激活3B就能實現上代Qwen2.5-32B模型性能。所有千問3模型都是混合推理模型，API可按需設置“思考預算”（即預期最大深度思考的tokens數量），靈活滿足AI應用和不同場景對性能和成本的多樣需求。

開源后，用戶可在魔搭社區、HuggingFace等平臺下載模型并商用，也可以通過阿里云百煉調用千問3的API服務。個人用戶可通過通義APP體驗千問3，記者了解到，夸克也即將全線接入千問3。

未來，千問3將通過優化模型架構和訓練方法等提升模型，以實現幾個關鍵目標：擴展數據規模、增加模型大小、延長上下文長度、拓寬模態范圍，并利用環境反饋推進強化學習以進行長周期推理。通義千問團隊在技術博客中表示，“Qwen3 代表了我們在通往通用人工智能（AGI）和超級人工智能（ASI）旅程中的一個重要里程碑。我們認為，我們正從專注于訓練模型的時代過渡到以訓練 Agent 為中心的時代。”

責任編輯：李志強

阿里云

千問3

DeepSeek-R1

聲明：證券時報力求信息真實、準確，文章提及內容僅供參考，不構成實質性投資建議，據此操作風險自擔

下載“證券時報”官方APP，或關注官方微信公眾號，即可隨時了解股市動態，洞察政策信息，把握財富機會。

網友評論

登錄后可以發言

發送

網友評論僅供其表達個人看法，并不表明證券時報立場