美大學(xué)發(fā)布報(bào)告：中美AI模型性能差距縮小至2.7% - 國(guó)內(nèi) - 華網(wǎng)，華網(wǎng)資訊，華網(wǎng)頭條，華人網(wǎng)絡(luò)家園

　　近日，美國(guó)斯坦福大學(xué)以人為本人工智能研究所發(fā)布了《2026年AI指數(shù)報(bào)告》。這份423頁(yè)的年度報(bào)告對(duì)人工智能(AI)在能力、投資、就業(yè)、應(yīng)用等方面進(jìn)行了系統(tǒng)梳理。

　　最引人關(guān)注的發(fā)現(xiàn)之一，是中美兩國(guó)在AI模型性能上的差距已幾乎消失。

　　報(bào)告指出，自2025年初以來(lái)，兩國(guó)模型已多次交替登頂性能榜單。過(guò)去一年來(lái)，這一差距雖有波動(dòng)，但始終保持在個(gè)位數(shù)。2025年2月，中國(guó)“深度求索”公司的DeepSeek-R1曾短暫追平美國(guó)最佳模型。

　　截至2026年3月，美國(guó)頂尖模型Claude Opus 4.6的Elo評(píng)分為1503，而中國(guó)頂尖模型緊追其后，差距僅有2.7%。

　　報(bào)告指出，美國(guó)在基礎(chǔ)模型創(chuàng)新、資本投入和算力基礎(chǔ)設(shè)施上仍保持領(lǐng)先。美國(guó)擁有5427個(gè)數(shù)據(jù)中心，是其他國(guó)家的10倍以上。與之同步的是，其能源消耗量也位居世界第一。

　　相比之下，中國(guó)在科研產(chǎn)出與產(chǎn)業(yè)應(yīng)用方面表現(xiàn)更為突出。報(bào)告顯示，中國(guó)在論文發(fā)表量、引用次數(shù)以及專利產(chǎn)出方面均處于領(lǐng)先地位，在工業(yè)機(jī)器人(物理AI領(lǐng)域)部署數(shù)量上也位居世界前列，占全球裝機(jī)量的54%。越南媒體vietnam.vn網(wǎng)站指出，這反映出中國(guó)AI技術(shù)在制造業(yè)領(lǐng)域的快速發(fā)展，也體現(xiàn)了中國(guó)在AI領(lǐng)域的長(zhǎng)期投資戰(zhàn)略以及政府、企業(yè)和科研機(jī)構(gòu)之間的緊密合作。

　　長(zhǎng)期以來(lái)，美國(guó)是全球AI人才的“引力中心”，但這一優(yōu)勢(shì)正在快速消退。

　　報(bào)告指出，自2017年以來(lái)，移居美國(guó)的AI學(xué)者數(shù)量下降了89%，且僅在過(guò)去一年中就銳減了80%。

　　盡管美國(guó)仍是全球AI研究人員最多的國(guó)家，但支撐這一優(yōu)勢(shì)的“人才流入”正在枯竭。對(duì)于那些習(xí)慣于頂尖研究者自然流向美國(guó)公司的企業(yè)來(lái)說(shuō)，這一假設(shè)已不再穩(wěn)固。

　　與此同時(shí)，全球AI競(jìng)賽已不再是部分大國(guó)之間的“擂臺(tái)賽”，韓國(guó)已成為全球“創(chuàng)新密度”最高的國(guó)家，人均專利申請(qǐng)量領(lǐng)跑世界。

　　隨著各國(guó)競(jìng)相布局，“主權(quán)AI”已成為許多政府的首要政策考量。過(guò)去一年，一些歐洲和中亞國(guó)家對(duì)其AI基礎(chǔ)設(shè)施進(jìn)行了大量投資，使得擁有“國(guó)家支持的超級(jí)計(jì)算集群”的國(guó)家達(dá)到44個(gè)。但報(bào)告警告，南美和中東國(guó)家在AI基礎(chǔ)設(shè)施上落后，可能引發(fā)新的“數(shù)字鴻溝”。

　　報(bào)告指出，生成式AI在3年內(nèi)達(dá)到了全球53%的人口使用率，普及速度快于個(gè)人電腦和互聯(lián)網(wǎng)。然而，AI能力的進(jìn)步并非均衡發(fā)展。

　　谷歌的Gemini Deep Think模型在2025年國(guó)際數(shù)學(xué)奧賽中，以35分(滿分42分)的成績(jī)奪得金牌，能在4.5小時(shí)內(nèi)用自然語(yǔ)言完成端到端的解題。然而，在專門測(cè)試時(shí)鐘識(shí)別的ClockBench上，頂尖模型正確讀取指針時(shí)鐘的概率僅為50.1%，而人類為90.1%。

　　“AI能贏得數(shù)學(xué)奧賽金牌，卻仍然無(wú)法可靠地讀取時(shí)間。”報(bào)告用“鋸齒狀智能”來(lái)形容這種能力分布的不均衡。

　　在其他領(lǐng)域，進(jìn)步同樣顯著。AI智能體處理現(xiàn)實(shí)世界計(jì)算機(jī)任務(wù)的成功率，從18個(gè)月前的12%躍升至2026年3月的66%，距離人類表現(xiàn)僅差6個(gè)百分點(diǎn)。在網(wǎng)絡(luò)安全任務(wù)上，AI智能體解決問(wèn)題成功率從2024年的15%飆升至93%。

　　然而，從數(shù)字世界跨入物理世界，AI的能力急劇衰減。機(jī)器人在軟件模擬環(huán)境中的成功率可達(dá)89.4%，但在真實(shí)的家務(wù)任務(wù)(如疊衣服、洗碗)中，成功率驟降至12.4%。可見(jiàn)，整潔的實(shí)驗(yàn)室與凌亂的家居環(huán)境之間，隔著一道難以逾越的“鴻溝”。

　　AI對(duì)就業(yè)的影響正在顯現(xiàn)。報(bào)告發(fā)現(xiàn)，生產(chǎn)率提升明顯的領(lǐng)域，往往也是初級(jí)崗位減少的領(lǐng)域。

　　在美國(guó)，22—25歲的軟件開發(fā)人員就業(yè)率自2024年以來(lái)下降了近20%，而年長(zhǎng)從業(yè)者數(shù)量增加。類似情況也出現(xiàn)在客戶服務(wù)領(lǐng)域。企業(yè)調(diào)查顯示，計(jì)劃中的裁員規(guī)模已超過(guò)近期實(shí)際裁減幅度。

　　然而，當(dāng)就業(yè)市場(chǎng)對(duì)年輕人的“大門”開始收窄時(shí)，教育體系卻尚未教會(huì)他們?nèi)绾闻cAI共處。報(bào)告發(fā)現(xiàn)，4/5的美國(guó)高中生和大學(xué)生已經(jīng)在使用AI完成學(xué)業(yè)任務(wù)，主要用于研究、論文編輯和頭腦風(fēng)暴，但只有一半的中小學(xué)制定了AI使用政策，僅6%的教師表示這些政策是清晰的。

　　全球范圍內(nèi)，超過(guò)90%的國(guó)家已提供計(jì)算機(jī)科學(xué)課程，但AI教育推進(jìn)較慢。中國(guó)和阿聯(lián)酋已開始將AI納入必修課程。

　　當(dāng)AI能力越來(lái)越強(qiáng)，我們對(duì)它的了解卻越來(lái)越少。報(bào)告中的“基礎(chǔ)模型透明度指數(shù)”平均得分，從上一年的58分驟降至40分。IBM以95分領(lǐng)跑，而xAI的Grok和Midjourney僅得14分。

　　能力最強(qiáng)的模型往往披露的信息最少。超過(guò)90%的知名AI模型由私營(yíng)公司創(chuàng)造，但許多公司不再披露訓(xùn)練數(shù)據(jù)集大小、參數(shù)數(shù)量或訓(xùn)練時(shí)長(zhǎng)。去年發(fā)布的95個(gè)知名模型中，有80個(gè)未公開其訓(xùn)練代碼。

　　報(bào)告還披露了AI的環(huán)境成本。xAI公司訓(xùn)練Grok 4模型估計(jì)產(chǎn)生了72816噸二氧化碳當(dāng)量，相當(dāng)于17000輛汽車一年的排放量。AI數(shù)據(jù)中心的電力容量已達(dá)29.6吉瓦，接近紐約州峰值用電需求。僅GPT-4o的推理用水量，就可能超過(guò)1200萬(wàn)人的飲用水需求。

圖片資訊

資訊聚焦

熱門資訊