來(lái)源:《中國(guó)企業(yè)家》雜志 發(fā)布時(shí)間:2025-11-24 10:56
段永平:現(xiàn)在市場(chǎng)上的大模型10年后能活下來(lái)的不會(huì)超過(guò)10%。誰(shuí)會(huì)活下來(lái)?我會(huì)猜Gemini,因?yàn)楣雀韬軓?qiáng)大,而且已經(jīng)醒了。
文|《中國(guó)企業(yè)家》記者 王怡潔 見習(xí)記者 孫欣
蟄伏數(shù)月,谷歌再度出手甩出王炸——Gemini 3奇襲大模型圈,交出了一張幾乎“全A”的模型測(cè)試成績(jī)單。
11月19日凌晨,谷歌發(fā)布最新一代模型Gemini 3。隨后,Gemini 3系列模型在多模態(tài)、推理、Agent 等三條大模型主線路的多項(xiàng)國(guó)際測(cè)試上全面“屠榜”。除了在編程能力測(cè)試略遜于GPT-5.1和Claude Sonnet 4.5外,在其他國(guó)際主流測(cè)試項(xiàng)目上,Gemini 3 Pro得分都是斷檔的領(lǐng)先。
其中,Humanity's Last Exam (HLE)被認(rèn)為是衡量AI能否解決人類頂尖難題的試金石,Gemini 3 Pro在此項(xiàng)測(cè)試的得分為37.5%。而GPT-5.1、Claude Sonnet 4.5得分分別為26.5%、12.7%。
模型發(fā)布后,谷歌美股股價(jià)一度上漲5.8%,市值突破3.5萬(wàn)億美元?jiǎng)?chuàng)歷史新高。
OpenAI的CEO山姆·阿爾特曼也罕見對(duì)谷歌給予贊賞:“這看起來(lái)是一個(gè)很棒的模型。”短短一年前,谷歌在舉辦2024 I/O開發(fā)者大會(huì)時(shí),阿爾特曼還曾直接嘲諷Gemini產(chǎn)品,甚至對(duì)發(fā)布會(huì)布置提出質(zhì)疑:“我無(wú)法不去思考OpenAI和谷歌之間的美學(xué)差異。”
但在今年5月的開發(fā)者大會(huì)上,谷歌拿出十余種“AI萬(wàn)花筒”產(chǎn)品,能力大幅提升,給了阿爾特曼一記回旋鏢。半年后,谷歌再度“炸場(chǎng)”,更表明在多年技術(shù)積累之下,谷歌已經(jīng)重新找回節(jié)奏。
“谷歌已不再把自己視為一家搜索公司,而是要成為下一代計(jì)算平臺(tái)的創(chuàng)建者。”谷歌CEO皮查伊今年多次強(qiáng)調(diào)。2025年,谷歌的搜索、安卓系統(tǒng)、Chrome瀏覽器、YouTube、硬件乃至手機(jī)等核心業(yè)務(wù),都在圍繞基座大模型Gemini進(jìn)行重構(gòu)。一年高達(dá)900億美元的資本開支以及工程資源,也都向模型供電傾斜。
基座模型迭代之際,谷歌也同步披露了一個(gè)關(guān)鍵數(shù)據(jù):谷歌瀏覽器的AI模式月活躍用戶已達(dá)20億。這意味著,從模型到應(yīng)用,谷歌正利用其龐大的生態(tài)系統(tǒng),重新定義AI上的話語(yǔ)權(quán)。
谷歌全棧布局的示范效應(yīng),也勢(shì)必將大模型競(jìng)爭(zhēng)拉到下一高度。近期,國(guó)內(nèi)外圍繞入口的爭(zhēng)奪也不約而同地打響。OpenAI上線桌面瀏覽器,同時(shí)強(qiáng)勢(shì)進(jìn)軍搜索功能;阿里千問(wèn)App近期回歸,高調(diào)瞄準(zhǔn)ChatGPT入局AI to C;字節(jié)也在通過(guò)豆包探索電商新入口。
幾天前,伯克希爾-哈撒韋公司披露的今年三季度持股報(bào)告顯示:巴菲特在退休前,首次建倉(cāng)買入了谷歌。
近日,段永平在接受采訪時(shí)也表示:“現(xiàn)在市場(chǎng)上的大模型很多,10年后能活下來(lái)的大概率不會(huì)超過(guò)10%。大家可以猜猜10年后,大家還在用的主流大模型會(huì)是什么?我會(huì)猜Gemini,因?yàn)楸澈蟮墓雀韬軓?qiáng)大,而且已經(jīng)醒了。”
模型屠榜,應(yīng)用升級(jí)
Gemini 3發(fā)布前,谷歌相當(dāng)?shù)驼{(diào)。
2025年11月初,皮查伊在公司財(cái)報(bào)電話會(huì)議上談及Gemini 3時(shí)態(tài)度謹(jǐn)慎:“前沿大模型的開發(fā)需要更多時(shí)間,而Gemini 3預(yù)計(jì)不會(huì)讓人們立刻就看到突破性的進(jìn)展。”
從結(jié)果看這像是一顆煙霧彈。據(jù)Model Card測(cè)試數(shù)據(jù),Gemini 3成績(jī)幾乎全面碾壓當(dāng)前所有主流大模型;在開放評(píng)測(cè)平臺(tái) LMArena 上,Gemini 3 Pro以1501分位居通用模型榜首。
在博士級(jí)科學(xué)問(wèn)答GPQA Diamond上,Gemini 3 Pro成績(jī)?yōu)?1.9%;數(shù)學(xué)難題集MathArena Apex上創(chuàng)造了最新紀(jì)錄——23.4%;SimpleQA Verified(強(qiáng)調(diào)事實(shí)性與復(fù)雜問(wèn)答準(zhǔn)確度的測(cè)試)成績(jī)是72.1%,這意味著其幻覺率和知識(shí)錯(cuò)誤率被顯著壓低;在ARC-AGI-2(推理測(cè)試)的成績(jī)?yōu)?1.1%,而上一代 Gemini 2.5 Pro的該項(xiàng)成績(jī)還不到5%。
Gemini 3在多模態(tài)的表現(xiàn)同樣令人驚艷。目前,多模態(tài)模型上有兩項(xiàng)“終極試題”:MMMU-Pro和Video-MMMU,Gemini 3 Pro在這兩項(xiàng)的成績(jī)分別為81%和87.6%,創(chuàng)下多模態(tài)模型能力歷史最高紀(jì)錄。在Agentic Coding上,Gemini 3 Pro在SWE-Bench Verified的成績(jī)比GPT-5.1和Claude Sonnet 4.5分別僅差0.1%、0.9%。
某種程度上,Gemini 3是谷歌第一款給OpenAI構(gòu)成實(shí)質(zhì)性威脅的模型——它并非以某一項(xiàng)能力出圈,而是在多模態(tài)、推理、Agent這三條最難突破的線路上,全線抵達(dá)行業(yè)天花板。
谷歌的反攻還不止于在基座模型上“血洗”榜單,還有應(yīng)用層的全面爆發(fā)。正是前者的能力跨越,才為應(yīng)用頁(yè)面、交互方式的迭代提供了關(guān)鍵基礎(chǔ)。
2022年,ChatGPT把行業(yè)帶入了小助手式“對(duì)話優(yōu)先”的交互世界。然而,Gemini新版應(yīng)用不再是單一對(duì)話框——用戶發(fā)出自然語(yǔ)言請(qǐng)求,模型并非直接生成答案,而是即時(shí)生成一個(gè)結(jié)構(gòu)化的、視覺化的界面,用戶可以和AI共同操作。
這也讓AI跳出了“小助手”的角色,不再只是在語(yǔ)言層面輔佐用戶,而是開始和用戶共享一個(gè)可操作的工作環(huán)境,向著真正的“工作伙伴”發(fā)展。據(jù)悉,Gemini 3將被整合進(jìn)Gemini應(yīng)用、谷歌的AI搜索產(chǎn)品AI Mode和AI Overviews,以及企業(yè)級(jí)產(chǎn)品。
谷歌如何找回節(jié)奏?
谷歌在AI上的爆發(fā),可以說(shuō)是“后發(fā)先至”。2022年11月底,ChatGPT燃爆硅谷后,同年12月6日,谷歌推出了Gemini 1.0。此后,谷歌的AI研發(fā)進(jìn)程一直不溫不火。
模型開發(fā)滯后之下,OpenAI、Perplexity、Anthropic等對(duì)谷歌的搜索市場(chǎng)虎視眈眈。2024年底,谷歌搜索市場(chǎng)份額首次跌破90%。
“大企業(yè)病”“掉隊(duì)”“落伍”曾是外界詬病谷歌的形容詞。但谷歌通過(guò)對(duì)關(guān)鍵技術(shù)團(tuán)隊(duì)的成功整合,再度找回了自己的研發(fā)節(jié)奏與產(chǎn)品高度。
2023年4月,谷歌宣布將Google Brain和DeepMind合并,由DeepMind創(chuàng)始人戴米斯·哈薩比斯執(zhí)掌。此前,兩支團(tuán)隊(duì)都做出過(guò)驕人戰(zhàn)績(jī):Brain創(chuàng)造了Transformer架構(gòu),DeepMind則拿出過(guò)震驚世界的AlphaGo。
“一山不容二虎”的故事沒有在谷歌發(fā)生。團(tuán)隊(duì)合并后,雖然帶頭人是哈薩比斯,但Google Brain的聯(lián)合創(chuàng)始人杰夫·迪恩仍然擔(dān)任首席科學(xué)家。2024年底,在團(tuán)隊(duì)的共同努力下,Gemini模型順利完成了迭代。
接下來(lái),谷歌更力出一孔。到2025年5月,皮查伊在I/O開發(fā)者大會(huì)上,大膽打破了谷歌搜索的立命之本:“搜索框不重要了,Google要做你的AI助理,直接替你把事辦了。”
大會(huì)上,谷歌共宣布了23項(xiàng)功能更新,覆蓋了AI模型、視覺生產(chǎn)、谷歌搜索、Agent系統(tǒng)、AI眼鏡、生態(tài)等幾乎所有與AI相關(guān)的領(lǐng)域。
AI顛覆搜索后,谷歌的野心也被放到了下一代計(jì)算平臺(tái):其自研了TPU提供底層算力支持;用安卓與Chrome構(gòu)成交互前臺(tái),Workspace承接具體任務(wù)執(zhí)行;YouTube打造流媒體資產(chǎn),為Gemini在多模態(tài)能力上奠定基礎(chǔ)。此外,Gmail、Google Docs等成熟應(yīng)用也逐步被注入AI功能。
Gemini 3的發(fā)布會(huì)上,谷歌宣布其瀏覽器AI模式的月活躍用戶已達(dá)20億,其中Gemini應(yīng)用月活用戶達(dá)6.5億。皮查伊稱:“令人驚嘆的是,僅僅兩年時(shí)間,AI已從單純處理文本和圖像,發(fā)展到能夠讀懂場(chǎng)景。從今天起,Gemini將在谷歌全系產(chǎn)品中全面鋪開。”
入口大戰(zhàn)開打
谷歌的系統(tǒng)性進(jìn)擊,也意味著AI新入口大戰(zhàn)已經(jīng)打響。AI角逐已從基模大戰(zhàn)、技術(shù)競(jìng)速,轉(zhuǎn)向了關(guān)乎下一個(gè)10年勢(shì)力版圖的場(chǎng)景落地競(jìng)爭(zhēng)。
下一代入口在哪里?在移動(dòng)互聯(lián)網(wǎng)時(shí)代,得流量者勝出。但未來(lái)如果把答案擴(kuò)展到“誰(shuí)能幫用戶解決問(wèn)題”的效用之爭(zhēng),機(jī)會(huì)又重新在巨頭面前攤平。
某種程度上,谷歌的全棧出擊,也是阿里正在嘗試“復(fù)刻”的道路。周靖人在云棲大會(huì)后,對(duì)《中國(guó)企業(yè)家》等媒體表示:阿里云是全球少數(shù)幾家在大模型和云計(jì)算方面都能夠做到全棧自研、聯(lián)合創(chuàng)新的公司。
11月17日,阿里千問(wèn)App公測(cè)版亮相,直接瞄準(zhǔn)AI to C入口,計(jì)劃打造會(huì)聊天、能辦事的個(gè)人AI助手,并整合了阿里全生態(tài)的服務(wù)能力。次日,螞蟻集團(tuán)發(fā)布全模態(tài)通用AI助手“靈光”,用戶可以在30秒內(nèi),生成可交互、可編輯、可分享的“閃應(yīng)用”。這些都昭示著阿里準(zhǔn)備抓住“生產(chǎn)力入口”的野心。
在不久前的2025年第三季度財(cái)報(bào)會(huì)上,騰訊集團(tuán)總裁劉熾平亦明確表示:微信最終將成為一個(gè)AI Agent,幫助用戶在微信內(nèi)部完成大量任務(wù)。字節(jié)豆包則在流量加持下,正在從生態(tài)滲透,走向工具賦能,與抖音、剪映深度綁定,將豆包變?yōu)樽止?jié)的生產(chǎn)力引擎。
最近,OpenAI已經(jīng)將更多目光投向了企業(yè)服務(wù)與垂直場(chǎng)景落地。今年上半年,OpenAI實(shí)現(xiàn)43億美元營(yíng)收,其中消費(fèi)者與企業(yè)訂閱占據(jù)大頭。
一位海外文旅開發(fā)從業(yè)者對(duì)《中國(guó)企業(yè)家》表示:他在使用了國(guó)內(nèi)外多項(xiàng)大模型后,感到GPT-5在上下文理解層面,明顯具備優(yōu)勢(shì)。“雖然我們海外數(shù)據(jù)相對(duì)匱乏,但因?yàn)镃hatGPT好用,海外系統(tǒng)反而更容易做。”
不過(guò),靠舊地圖未必能拿到新船票。AI時(shí)代的贏家,不只屬于技術(shù)領(lǐng)先者,或者有能力“大水漫灌”的超級(jí)App擁有者,更是能理解用戶需求、將技術(shù)轉(zhuǎn)化為解決問(wèn)題能力,能將AI與行業(yè)場(chǎng)景深度綁定,對(duì)AGI有更透徹理解和追求的企業(yè)。