炒股就看金麒麟分析師研報(bào),權(quán)威,專業(yè),及時(shí),全面,助您挖掘潛力主題機(jī)會(huì)!
【導(dǎo)讀】騰訊混元T1正式版發(fā)布:創(chuàng)新混合Mamba架構(gòu),能秒回、吐字快、擅長(zhǎng)超長(zhǎng)文推理
中國(guó)基金報(bào) 記者 張燕北
騰訊最近在大模型領(lǐng)域動(dòng)作頻頻。
繼2月底推出新一代快思考模型混元Turbo S后,3月21日深夜,騰訊宣布推出自研深度思考模型混元T1正式版,并同步在騰訊云官網(wǎng)上線。
騰訊發(fā)布自研混元T1正式版
騰訊混元T1正式版如期發(fā)布。
之所以稱之為“如期發(fā)布”,是因?yàn)榍安痪抿v訊混元自研的快思考模型混元Turbo S正式發(fā)布時(shí),騰訊就曾表示,正式版的騰訊混元T1模型API也將很快上線,對(duì)外提供接入服務(wù)。
據(jù)知情人士介紹,騰訊混元T1正式版以混元Turbo S為基座打造,亮點(diǎn)在于其是能夠秒回、吐字快、擅長(zhǎng)超長(zhǎng)文處理的強(qiáng)推理模型,性能保持業(yè)界領(lǐng)先。
“混元T1正式版沿用了混元Turbo S的創(chuàng)新架構(gòu),采用Hybrid-Mamba-Transformer融合模式。這是工業(yè)界首次將混合Mamba架構(gòu)無損應(yīng)用于超大型推理模型。”上述知情人士說,這一架構(gòu)顯著降低了訓(xùn)練和推理成本,讓混元T1實(shí)現(xiàn)首字秒出,吐字速度達(dá)到最快80 tokens/s。
混元T1在超長(zhǎng)文本推理領(lǐng)域也展現(xiàn)出獨(dú)特優(yōu)勢(shì),能夠有效解決長(zhǎng)文推理中常見的上下文丟失和長(zhǎng)距離信息依賴問題。同時(shí),混合Mamba架構(gòu)針對(duì)長(zhǎng)序列處理進(jìn)行了專項(xiàng)優(yōu)化,提升了解碼速度。
通過大規(guī)模強(qiáng)化學(xué)習(xí),并結(jié)合數(shù)學(xué)、邏輯推理、科學(xué)和代碼等理科難題的專項(xiàng)優(yōu)化,混元T1正式版進(jìn)一步提升了推理能力。與此前已上線騰訊元寶的混元T1-preview模型相比,綜合效果明顯提升。
騰訊方面提供的數(shù)據(jù)顯示,在體現(xiàn)推理模型基礎(chǔ)能力的常見Benchmark上,以及在中英文知識(shí)及競(jìng)賽級(jí)數(shù)學(xué)、邏輯推理的公開基準(zhǔn)測(cè)試中,混元T1的成績(jī)也達(dá)到業(yè)界領(lǐng)先推理模型的水平。此外,T1還在多項(xiàng)對(duì)齊任務(wù)、指令跟隨任務(wù)和工具利用任務(wù)中展現(xiàn)出了非常強(qiáng)的適應(yīng)性。
值得一提的是,目前,混元T1已在騰訊云官網(wǎng)上線。定價(jià)方面,輸入價(jià)格為每百萬tokens 1元,輸出價(jià)格為每百萬tokens 4元。
騰訊混元大模型持續(xù)快速迭代
今年以來,騰訊混元大模型持續(xù)快速迭代,AI似乎已成為騰訊內(nèi)部最大的驅(qū)動(dòng)力。
其推出了深度思考模型T1 Preview和快思考模型Turbo S,并已廣泛應(yīng)用于騰訊元寶、ima、騰訊文檔、微信讀書、搜狗輸入法、QQ瀏覽器等多款內(nèi)部產(chǎn)品。騰訊混元積極擁抱開源,其開源模型全面覆蓋文本、圖像、視頻和3D生成等多個(gè)模態(tài)。
業(yè)內(nèi)認(rèn)為,這一戰(zhàn)略選擇的背后,一方面基于騰訊長(zhǎng)期以來堅(jiān)持技術(shù)普惠的理念,另一方面也得益于騰訊在用戶與產(chǎn)業(yè)多端的場(chǎng)景與生態(tài)優(yōu)勢(shì),為AI技術(shù)的落地提供了廣闊空間。
在日前公布的2024年財(cái)報(bào)中,騰訊年研發(fā)投入707億元?jiǎng)?chuàng)下紀(jì)錄。對(duì)于業(yè)務(wù)側(cè),AI技術(shù)對(duì)微信新芽業(yè)務(wù)的提振效應(yīng),推動(dòng)了騰訊營(yíng)銷服務(wù)板塊的快速增長(zhǎng)。其2024年第四季度在AI領(lǐng)域的資本開支超390億元,2025年將持續(xù)加碼,AI戰(zhàn)略已進(jìn)入重投入期。
騰訊董事會(huì)主席兼首席執(zhí)行官馬化騰表示,“受益于AI賦能的廣告平臺(tái)升級(jí)、視頻號(hào)用戶參與度提升以及長(zhǎng)青游戲的增長(zhǎng),我們2024年第4季取得雙位數(shù)的收入增長(zhǎng),并持續(xù)提升運(yùn)營(yíng)效率。數(shù)月前,我們重組了AI團(tuán)隊(duì)以聚焦于快速的產(chǎn)品創(chuàng)新及深度的模型研發(fā),增加了AI相關(guān)的資本開支,并加大了我們對(duì)原生AI產(chǎn)品的研發(fā)和營(yíng)銷力度。”他表示。
巨頭競(jìng)逐AI
我國(guó)AIGC應(yīng)用或已進(jìn)入加速期
隨著2025年我國(guó)進(jìn)入科技突破大年,各大互聯(lián)網(wǎng)巨頭持續(xù)加大AI領(lǐng)域的投入。
近期,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)官宣開源一項(xiàng)針對(duì)MoE(混合專家模型)架構(gòu)的關(guān)鍵優(yōu)化技術(shù),可將大模型訓(xùn)練效率提升1.7倍,成本節(jié)省40%。
據(jù)悉,該技術(shù)叫COMET,已實(shí)際應(yīng)用于字節(jié)的萬卡集群訓(xùn)練,累計(jì)幫助節(jié)省了數(shù)百萬 GPU 小時(shí)訓(xùn)練算力。
阿里巴巴近日宣布推出AI旗艦應(yīng)用——新夸克,將“深度思考”能力融入AI搜索。據(jù)介紹,用戶在“AI超級(jí)框”中輸入指令后,夸克智能中樞可以自動(dòng)識(shí)別意圖,規(guī)劃梳理后調(diào)動(dòng)各種不同模型和智能體(Agent)模塊,幫助用戶完成任務(wù)。
百度日前連發(fā)兩款免費(fèi)新模型,分別是文心大模型4.5和文心大模型X1。據(jù)百度相關(guān)負(fù)責(zé)人介紹,文心大模型4.5在多模態(tài)理解能力方面顯著提升。文心大模型X1為深度思考模型,在性能上對(duì)標(biāo)DeepSeek-R1,具備“長(zhǎng)思維鏈”,擅長(zhǎng)中文知識(shí)問答、文學(xué)創(chuàng)作、邏輯推理等,而且大幅降低推理成本。
值得關(guān)注的是,國(guó)產(chǎn)大模型開源步伐持續(xù)加速。阿里巴巴在基礎(chǔ)模型和原生應(yīng)用方面持續(xù)發(fā)力,近期相繼發(fā)布了Qwen2.5-VL、Qwen2.5-Max、通義萬相2.1、千問QWQ-32B等性能領(lǐng)先的開源模型。百度方面則表示,將在6月30日正式將文心大模型開源,并在今年下半年發(fā)布文心大模型5.0。
業(yè)內(nèi)分析認(rèn)為,在技術(shù)創(chuàng)新與商業(yè)應(yīng)用的雙輪驅(qū)動(dòng)下,AI有望在互聯(lián)網(wǎng)等數(shù)字原生領(lǐng)域率先形成規(guī)?;涞亍?/p>
華富人工智能ETF基金經(jīng)理郜哲表示,結(jié)合騰訊財(cái)報(bào)和近期互聯(lián)網(wǎng)巨頭競(jìng)逐AI的情況來看,我國(guó)AIGC應(yīng)用或已進(jìn)入加速期。隨著AI在各行業(yè)深入滲透,有望誕生更多AI創(chuàng)新模式與高質(zhì)量產(chǎn)品,進(jìn)一步推動(dòng)人工智能產(chǎn)業(yè)鏈向更加現(xiàn)實(shí)、業(yè)績(jī)可落地的方向發(fā)展。
發(fā)表評(píng)論
2025-03-23 04:38:25回復(fù)
2025-03-23 07:55:55回復(fù)
2025-03-23 00:06:41回復(fù)