《2026年AI指數(shù)報(bào)告》封面。 圖片來源:美國斯坦福大學(xué)以人為本人工智能研究所官網(wǎng)
本報(bào)記者 張佳欣
近日,美國斯坦福大學(xué)以人為本人工智能研究所發(fā)布了《2026年AI指數(shù)報(bào)告》。這份423頁的年度報(bào)告對人工智能(AI)在能力、投資、就業(yè)、應(yīng)用等方面進(jìn)行了系統(tǒng)梳理。
中美差距幾乎消失
最引人關(guān)注的發(fā)現(xiàn)之一,是中美兩國在AI模型性能上的差距已幾乎消失。
報(bào)告指出,自2025年初以來,兩國模型已多次交替登頂性能榜單。過去一年來,這一差距雖有波動,但始終保持在個(gè)位數(shù)。2025年2月,中國“深度求索”公司的DeepSeek-R1曾短暫追平美國最佳模型。
截至2026年3月,美國頂尖模型Claude Opus 4.6的Elo評分為1503,而中國頂尖模型緊追其后,差距僅有2.7%。
報(bào)告指出,美國在基礎(chǔ)模型創(chuàng)新、資本投入和算力基礎(chǔ)設(shè)施上仍保持領(lǐng)先。美國擁有5427個(gè)數(shù)據(jù)中心,是其他國家的10倍以上。與之同步的是,其能源消耗量也位居世界第一。
相比之下,中國在科研產(chǎn)出與產(chǎn)業(yè)應(yīng)用方面表現(xiàn)更為突出。報(bào)告顯示,中國在論文發(fā)表量、引用次數(shù)以及專利產(chǎn)出方面均處于領(lǐng)先地位,在工業(yè)機(jī)器人(物理AI領(lǐng)域)部署數(shù)量上也位居世界前列,占全球裝機(jī)量的54%。越南媒體vietnam.vn網(wǎng)站指出,這反映出中國AI技術(shù)在制造業(yè)領(lǐng)域的快速發(fā)展,也體現(xiàn)了中國在AI領(lǐng)域的長期投資戰(zhàn)略以及政府、企業(yè)和科研機(jī)構(gòu)之間的緊密合作。
美國AI人才吸引力下降
長期以來,美國是全球AI人才的“引力中心”,但這一優(yōu)勢正在快速消退。
報(bào)告指出,自2017年以來,移居美國的AI學(xué)者數(shù)量下降了89%,且僅在過去一年中就銳減了80%。
盡管美國仍是全球AI研究人員最多的國家,但支撐這一優(yōu)勢的“人才流入”正在枯竭。對于那些習(xí)慣于頂尖研究者自然流向美國公司的企業(yè)來說,這一假設(shè)已不再穩(wěn)固。
與此同時(shí),全球AI競賽已不再是部分大國之間的“擂臺賽”,韓國已成為全球“創(chuàng)新密度”最高的國家,人均專利申請量領(lǐng)跑世界。
隨著各國競相布局,“主權(quán)AI”已成為許多政府的首要政策考量。過去一年,一些歐洲和中亞國家對其AI基礎(chǔ)設(shè)施進(jìn)行了大量投資,使得擁有“國家支持的超級計(jì)算集群”的國家達(dá)到44個(gè)。但報(bào)告警告,南美和中東國家在AI基礎(chǔ)設(shè)施上落后,可能引發(fā)新的“數(shù)字鴻溝”。
AI“偏科”嚴(yán)重
報(bào)告指出,生成式AI在3年內(nèi)達(dá)到了全球53%的人口使用率,普及速度快于個(gè)人電腦和互聯(lián)網(wǎng)。然而,AI能力的進(jìn)步并非均衡發(fā)展。
谷歌的Gemini Deep Think模型在2025年國際數(shù)學(xué)奧賽中,以35分(滿分42分)的成績奪得金牌,能在4.5小時(shí)內(nèi)用自然語言完成端到端的解題。然而,在專門測試時(shí)鐘識別的ClockBench上,頂尖模型正確讀取指針時(shí)鐘的概率僅為50.1%,而人類為90.1%。
“AI能贏得數(shù)學(xué)奧賽金牌,卻仍然無法可靠地讀取時(shí)間。”報(bào)告用“鋸齒狀智能”來形容這種能力分布的不均衡。
在其他領(lǐng)域,進(jìn)步同樣顯著。AI智能體處理現(xiàn)實(shí)世界計(jì)算機(jī)任務(wù)的成功率,從18個(gè)月前的12%躍升至2026年3月的66%,距離人類表現(xiàn)僅差6個(gè)百分點(diǎn)。在網(wǎng)絡(luò)安全任務(wù)上,AI智能體解決問題成功率從2024年的15%飆升至93%。
然而,從數(shù)字世界跨入物理世界,AI的能力急劇衰減。機(jī)器人在軟件模擬環(huán)境中的成功率可達(dá)89.4%,但在真實(shí)的家務(wù)任務(wù)(如疊衣服、洗碗)中,成功率驟降至12.4%。可見,整潔的實(shí)驗(yàn)室與凌亂的家居環(huán)境之間,隔著一道難以逾越的“鴻溝”。
AI對就業(yè)的影響顯現(xiàn)
AI對就業(yè)的影響正在顯現(xiàn)。報(bào)告發(fā)現(xiàn),生產(chǎn)率提升明顯的領(lǐng)域,往往也是初級崗位減少的領(lǐng)域。
在美國,22—25歲的軟件開發(fā)人員就業(yè)率自2024年以來下降了近20%,而年長從業(yè)者數(shù)量增加。類似情況也出現(xiàn)在客戶服務(wù)領(lǐng)域。企業(yè)調(diào)查顯示,計(jì)劃中的裁員規(guī)模已超過近期實(shí)際裁減幅度。
然而,當(dāng)就業(yè)市場對年輕人的“大門”開始收窄時(shí),教育體系卻尚未教會他們?nèi)绾闻cAI共處。報(bào)告發(fā)現(xiàn),4/5的美國高中生和大學(xué)生已經(jīng)在使用AI完成學(xué)業(yè)任務(wù),主要用于研究、論文編輯和頭腦風(fēng)暴,但只有一半的中小學(xué)制定了AI使用政策,僅6%的教師表示這些政策是清晰的。
全球范圍內(nèi),超過90%的國家已提供計(jì)算機(jī)科學(xué)課程,但AI教育推進(jìn)較慢。中國和阿聯(lián)酋已開始將AI納入必修課程。
最強(qiáng)AI模型透明度下降
當(dāng)AI能力越來越強(qiáng),我們對它的了解卻越來越少。報(bào)告中的“基礎(chǔ)模型透明度指數(shù)”平均得分,從上一年的58分驟降至40分。IBM以95分領(lǐng)跑,而xAI的Grok和Midjourney僅得14分。
能力最強(qiáng)的模型往往披露的信息最少。超過90%的知名AI模型由私營公司創(chuàng)造,但許多公司不再披露訓(xùn)練數(shù)據(jù)集大小、參數(shù)數(shù)量或訓(xùn)練時(shí)長。去年發(fā)布的95個(gè)知名模型中,有80個(gè)未公開其訓(xùn)練代碼。
報(bào)告還披露了AI的環(huán)境成本。xAI公司訓(xùn)練Grok 4模型估計(jì)產(chǎn)生了72816噸二氧化碳當(dāng)量,相當(dāng)于17000輛汽車一年的排放量。AI數(shù)據(jù)中心的電力容量已達(dá)29.6吉瓦,接近紐約州峰值用電需求。僅GPT-4o的推理用水量,就可能超過1200萬人的飲用水需求。