美大學發(fā)布報告：中美AI模型性能差距縮小至2.7%

2026年04月17日 13:21　來源：科技日報

大字體

小字體

分享到：

　　美國斯坦福大學發(fā)布《2026年AI指數報告》

　　中美AI模型性能差距縮小至2.7%

《2026年AI指數報告》封面。圖片來源：美國斯坦福大學以人為本人工智能研究所官網

　　本報記者張佳欣

　　近日，美國斯坦福大學以人為本人工智能研究所發(fā)布了《2026年AI指數報告》。這份423頁的年度報告對人工智能(AI)在能力、投資、就業(yè)、應用等方面進行了系統(tǒng)梳理。

　　中美差距幾乎消失

　　最引人關注的發(fā)現之一，是中美兩國在AI模型性能上的差距已幾乎消失。

　　報告指出，自2025年初以來，兩國模型已多次交替登頂性能榜單。過去一年來，這一差距雖有波動，但始終保持在個位數。2025年2月，中國“深度求索”公司的DeepSeek-R1曾短暫追平美國最佳模型。

　　截至2026年3月，美國頂尖模型Claude Opus 4.6的Elo評分為1503，而中國頂尖模型緊追其后，差距僅有2.7%。

　　報告指出，美國在基礎模型創(chuàng)新、資本投入和算力基礎設施上仍保持領先。美國擁有5427個數據中心，是其他國家的10倍以上。與之同步的是，其能源消耗量也位居世界第一。

　　相比之下，中國在科研產出與產業(yè)應用方面表現更為突出。報告顯示，中國在論文發(fā)表量、引用次數以及專利產出方面均處于領先地位，在工業(yè)機器人(物理AI領域)部署數量上也位居世界前列，占全球裝機量的54%。越南媒體vietnam.vn網站指出，這反映出中國AI技術在制造業(yè)領域的快速發(fā)展，也體現了中國在AI領域的長期投資戰(zhàn)略以及政府、企業(yè)和科研機構之間的緊密合作。

　　美國AI人才吸引力下降

　　長期以來，美國是全球AI人才的“引力中心”，但這一優(yōu)勢正在快速消退。

　　報告指出，自2017年以來，移居美國的AI學者數量下降了89%，且僅在過去一年中就銳減了80%。

　　盡管美國仍是全球AI研究人員最多的國家，但支撐這一優(yōu)勢的“人才流入”正在枯竭。對于那些習慣于頂尖研究者自然流向美國公司的企業(yè)來說，這一假設已不再穩(wěn)固。

　　與此同時，全球AI競賽已不再是部分大國之間的“擂臺賽”，韓國已成為全球“創(chuàng)新密度”最高的國家，人均專利申請量領跑世界。

　　隨著各國競相布局，“主權AI”已成為許多政府的首要政策考量。過去一年，一些歐洲和中亞國家對其AI基礎設施進行了大量投資，使得擁有“國家支持的超級計算集群”的國家達到44個。但報告警告，南美和中東國家在AI基礎設施上落后，可能引發(fā)新的“數字鴻溝”。

　　AI“偏科”嚴重

　　報告指出，生成式AI在3年內達到了全球53%的人口使用率，普及速度快于個人電腦和互聯網。然而，AI能力的進步并非均衡發(fā)展。

　　谷歌的Gemini Deep Think模型在2025年國際數學奧賽中，以35分(滿分42分)的成績奪得金牌，能在4.5小時內用自然語言完成端到端的解題。然而，在專門測試時鐘識別的ClockBench上，頂尖模型正確讀取指針時鐘的概率僅為50.1%，而人類為90.1%。

　　“AI能贏得數學奧賽金牌，卻仍然無法可靠地讀取時間。”報告用“鋸齒狀智能”來形容這種能力分布的不均衡。

　　在其他領域，進步同樣顯著。AI智能體處理現實世界計算機任務的成功率，從18個月前的12%躍升至2026年3月的66%，距離人類表現僅差6個百分點。在網絡安全任務上，AI智能體解決問題成功率從2024年的15%飆升至93%。

　　然而，從數字世界跨入物理世界，AI的能力急劇衰減。機器人在軟件模擬環(huán)境中的成功率可達89.4%，但在真實的家務任務(如疊衣服、洗碗)中，成功率驟降至12.4%。可見，整潔的實驗室與凌亂的家居環(huán)境之間，隔著一道難以逾越的“鴻溝”。

　　AI對就業(yè)的影響顯現

　　AI對就業(yè)的影響正在顯現。報告發(fā)現，生產率提升明顯的領域，往往也是初級崗位減少的領域。

　　在美國，22—25歲的軟件開發(fā)人員就業(yè)率自2024年以來下降了近20%，而年長從業(yè)者數量增加。類似情況也出現在客戶服務領域。企業(yè)調查顯示，計劃中的裁員規(guī)模已超過近期實際裁減幅度。

　　然而，當就業(yè)市場對年輕人的“大門”開始收窄時，教育體系卻尚未教會他們如何與AI共處。報告發(fā)現，4/5的美國高中生和大學生已經在使用AI完成學業(yè)任務，主要用于研究、論文編輯和頭腦風暴，但只有一半的中小學制定了AI使用政策，僅6%的教師表示這些政策是清晰的。

　　全球范圍內，超過90%的國家已提供計算機科學課程，但AI教育推進較慢。中國和阿聯酋已開始將AI納入必修課程。

　　最強AI模型透明度下降

　　當AI能力越來越強，我們對它的了解卻越來越少。報告中的“基礎模型透明度指數”平均得分，從上一年的58分驟降至40分。IBM以95分領跑，而xAI的Grok和Midjourney僅得14分。

　　能力最強的模型往往披露的信息最少。超過90%的知名AI模型由私營公司創(chuàng)造，但許多公司不再披露訓練數據集大小、參數數量或訓練時長。去年發(fā)布的95個知名模型中，有80個未公開其訓練代碼。

　　報告還披露了AI的環(huán)境成本。xAI公司訓練Grok 4模型估計產生了72816噸二氧化碳當量，相當于17000輛汽車一年的排放量。AI數據中心的電力容量已達29.6吉瓦，接近紐約州峰值用電需求。僅GPT-4o的推理用水量，就可能超過1200萬人的飲用水需求。

【編輯:陳海峰】

更多精彩內容請進入國內新聞

發(fā)表評論文明上網理性發(fā)言，請遵守新聞評論服務協議

國內新聞精選：

翰墨因緣聚花海兩岸書畫家走進洛陽國家牡丹園采風

2026年04月19日 22:03:07
新黨副主席李勝峰：文明累積讓兩岸有共同血脈

2026年04月19日 19:54:14
臺胞追憶抗戰(zhàn)崢嶸歲月：喚醒兩岸共御外侮記憶，讓榮耀不再沉默

2026年04月18日 21:36:58
兩岸青年相約南京共話“博物館IP授權”

2026年04月18日 20:32:08
臺片“登陸”熱潮升溫業(yè)者盼借政策東風拓新空間

2026年04月18日 18:57:08
臺商叔侄的廣西“雙城記”：從艱難創(chuàng)業(yè)到扎根筑夢

2026年04月18日 14:38:10
多型艦艇首次亮相！海軍節(jié)活動預約通道陸續(xù)開啟

2026年04月18日 12:49:37
東西問丨雷小華：蘇林訪華，為何廣西是中越合作的重要一站？

2026年04月17日 23:40:28
中國海警位釣魚島海域緊急救援中國臺灣籍漁船

2026年04月17日 21:04:20
臺生循課文訪日月潭：喚起兩岸共同記憶

2026年04月17日 17:02:03

換一批

宅男噜噜噜66国产精品86,亚洲精品97久中文字幕,五月激情综合婷婷久久,久久只精品99品免费久下载,国产亚洲欧美日韩二三线,四虎精品在线观看,欧美三级在线播放线观看高清,视频观看 久久久免费看,一区二区三区四区完整版

美大學發(fā)布報告：中美AI模型性能差距縮小至2.7%

美大學發(fā)布報告：中美AI模型性能差距縮小至2.7%

國內新聞精選：

宅男噜噜噜66国产精品86,亚洲精品97久中文字幕,五月激情综合婷婷久久,久久只精品99品免费久下载,国产亚洲欧美日韩二三线,四虎精品在线观看,欧美三级在线播放线观看高清,视频观看久久久免费看,一区二区三区四区完整版