谷歌醒了，新入口大戰(zhàn)開打

來(lái)源：《中國(guó)企業(yè)家》雜志發(fā)布時(shí)間：2025-11-24 10:56

段永平：現(xiàn)在市場(chǎng)上的大模型10年后能活下來(lái)的不會(huì)超過(guò)10%。誰(shuí)會(huì)活下來(lái)？我會(huì)猜Gemini，因?yàn)楣雀韬軓?qiáng)大，而且已經(jīng)醒了。

文｜《中國(guó)企業(yè)家》記者王怡潔見習(xí)記者孫欣

蟄伏數(shù)月，谷歌再度出手甩出王炸——Gemini 3奇襲大模型圈，交出了一張幾乎“全A”的模型測(cè)試成績(jī)單。

11月19日凌晨，谷歌發(fā)布最新一代模型Gemini 3。隨后，Gemini 3系列模型在多模態(tài)、推理、Agent 等三條大模型主線路的多項(xiàng)國(guó)際測(cè)試上全面“屠榜”。除了在編程能力測(cè)試略遜于GPT-5.1和Claude Sonnet 4.5外，在其他國(guó)際主流測(cè)試項(xiàng)目上，Gemini 3 Pro得分都是斷檔的領(lǐng)先。

其中，Humanity's Last Exam （HLE）被認(rèn)為是衡量AI能否解決人類頂尖難題的試金石，Gemini 3 Pro在此項(xiàng)測(cè)試的得分為37.5%。而GPT-5.1、Claude Sonnet 4.5得分分別為26.5%、12.7%。

模型發(fā)布后，谷歌美股股價(jià)一度上漲5.8%，市值突破3.5萬(wàn)億美元?jiǎng)?chuàng)歷史新高。

OpenAI的CEO山姆·阿爾特曼也罕見對(duì)谷歌給予贊賞：“這看起來(lái)是一個(gè)很棒的模型。”短短一年前，谷歌在舉辦2024 I/O開發(fā)者大會(huì)時(shí)，阿爾特曼還曾直接嘲諷Gemini產(chǎn)品，甚至對(duì)發(fā)布會(huì)布置提出質(zhì)疑：“我無(wú)法不去思考OpenAI和谷歌之間的美學(xué)差異。”

但在今年5月的開發(fā)者大會(huì)上，谷歌拿出十余種“AI萬(wàn)花筒”產(chǎn)品，能力大幅提升，給了阿爾特曼一記回旋鏢。半年后，谷歌再度“炸場(chǎng)”，更表明在多年技術(shù)積累之下，谷歌已經(jīng)重新找回節(jié)奏。

“谷歌已不再把自己視為一家搜索公司，而是要成為下一代計(jì)算平臺(tái)的創(chuàng)建者。”谷歌CEO皮查伊今年多次強(qiáng)調(diào)。2025年，谷歌的搜索、安卓系統(tǒng)、Chrome瀏覽器、YouTube、硬件乃至手機(jī)等核心業(yè)務(wù)，都在圍繞基座大模型Gemini進(jìn)行重構(gòu)。一年高達(dá)900億美元的資本開支以及工程資源，也都向模型供電傾斜。

基座模型迭代之際，谷歌也同步披露了一個(gè)關(guān)鍵數(shù)據(jù)：谷歌瀏覽器的AI模式月活躍用戶已達(dá)20億。這意味著，從模型到應(yīng)用，谷歌正利用其龐大的生態(tài)系統(tǒng)，重新定義AI上的話語(yǔ)權(quán)。

谷歌全棧布局的示范效應(yīng)，也勢(shì)必將大模型競(jìng)爭(zhēng)拉到下一高度。近期，國(guó)內(nèi)外圍繞入口的爭(zhēng)奪也不約而同地打響。OpenAI上線桌面瀏覽器，同時(shí)強(qiáng)勢(shì)進(jìn)軍搜索功能；阿里千問(wèn)App近期回歸，高調(diào)瞄準(zhǔn)ChatGPT入局AI to C；字節(jié)也在通過(guò)豆包探索電商新入口。

幾天前，伯克希爾-哈撒韋公司披露的今年三季度持股報(bào)告顯示：巴菲特在退休前，首次建倉(cāng)買入了谷歌。

近日，段永平在接受采訪時(shí)也表示：“現(xiàn)在市場(chǎng)上的大模型很多，10年后能活下來(lái)的大概率不會(huì)超過(guò)10%。大家可以猜猜10年后，大家還在用的主流大模型會(huì)是什么？我會(huì)猜Gemini，因?yàn)楸澈蟮墓雀韬軓?qiáng)大，而且已經(jīng)醒了。”

模型屠榜，應(yīng)用升級(jí)

Gemini 3發(fā)布前，谷歌相當(dāng)?shù)驼{(diào)。

2025年11月初，皮查伊在公司財(cái)報(bào)電話會(huì)議上談及Gemini 3時(shí)態(tài)度謹(jǐn)慎：“前沿大模型的開發(fā)需要更多時(shí)間，而Gemini 3預(yù)計(jì)不會(huì)讓人們立刻就看到突破性的進(jìn)展。”

從結(jié)果看這像是一顆煙霧彈。據(jù)Model Card測(cè)試數(shù)據(jù)，Gemini 3成績(jī)幾乎全面碾壓當(dāng)前所有主流大模型；在開放評(píng)測(cè)平臺(tái) LMArena 上，Gemini 3 Pro以1501分位居通用模型榜首。

在博士級(jí)科學(xué)問(wèn)答GPQA Diamond上，Gemini 3 Pro成績(jī)?yōu)?1.9%；數(shù)學(xué)難題集MathArena Apex上創(chuàng)造了最新紀(jì)錄——23.4%；SimpleQA Verified（強(qiáng)調(diào)事實(shí)性與復(fù)雜問(wèn)答準(zhǔn)確度的測(cè)試）成績(jī)是72.1%，這意味著其幻覺率和知識(shí)錯(cuò)誤率被顯著壓低；在ARC-AGI-2（推理測(cè)試）的成績(jī)?yōu)?1.1%，而上一代 Gemini 2.5 Pro的該項(xiàng)成績(jī)還不到5%。

Gemini 3在多模態(tài)的表現(xiàn)同樣令人驚艷。目前，多模態(tài)模型上有兩項(xiàng)“終極試題”：MMMU-Pro和Video-MMMU，Gemini 3 Pro在這兩項(xiàng)的成績(jī)分別為81%和87.6%，創(chuàng)下多模態(tài)模型能力歷史最高紀(jì)錄。在Agentic Coding上，Gemini 3 Pro在SWE-Bench Verified的成績(jī)比GPT-5.1和Claude Sonnet 4.5分別僅差0.1%、0.9%。

某種程度上，Gemini 3是谷歌第一款給OpenAI構(gòu)成實(shí)質(zhì)性威脅的模型——它并非以某一項(xiàng)能力出圈，而是在多模態(tài)、推理、Agent這三條最難突破的線路上，全線抵達(dá)行業(yè)天花板。

谷歌的反攻還不止于在基座模型上“血洗”榜單，還有應(yīng)用層的全面爆發(fā)。正是前者的能力跨越，才為應(yīng)用頁(yè)面、交互方式的迭代提供了關(guān)鍵基礎(chǔ)。

2022年，ChatGPT把行業(yè)帶入了小助手式“對(duì)話優(yōu)先”的交互世界。然而，Gemini新版應(yīng)用不再是單一對(duì)話框——用戶發(fā)出自然語(yǔ)言請(qǐng)求，模型并非直接生成答案，而是即時(shí)生成一個(gè)結(jié)構(gòu)化的、視覺化的界面，用戶可以和AI共同操作。

這也讓AI跳出了“小助手”的角色，不再只是在語(yǔ)言層面輔佐用戶，而是開始和用戶共享一個(gè)可操作的工作環(huán)境，向著真正的“工作伙伴”發(fā)展。據(jù)悉，Gemini 3將被整合進(jìn)Gemini應(yīng)用、谷歌的AI搜索產(chǎn)品AI Mode和AI Overviews，以及企業(yè)級(jí)產(chǎn)品。

谷歌如何找回節(jié)奏？

谷歌在AI上的爆發(fā)，可以說(shuō)是“后發(fā)先至”。2022年11月底，ChatGPT燃爆硅谷后，同年12月6日，谷歌推出了Gemini 1.0。此后，谷歌的AI研發(fā)進(jìn)程一直不溫不火。

模型開發(fā)滯后之下，OpenAI、Perplexity、Anthropic等對(duì)谷歌的搜索市場(chǎng)虎視眈眈。2024年底，谷歌搜索市場(chǎng)份額首次跌破90%。

“大企業(yè)病”“掉隊(duì)”“落伍”曾是外界詬病谷歌的形容詞。但谷歌通過(guò)對(duì)關(guān)鍵技術(shù)團(tuán)隊(duì)的成功整合，再度找回了自己的研發(fā)節(jié)奏與產(chǎn)品高度。

2023年4月，谷歌宣布將Google Brain和DeepMind合并，由DeepMind創(chuàng)始人戴米斯·哈薩比斯執(zhí)掌。此前，兩支團(tuán)隊(duì)都做出過(guò)驕人戰(zhàn)績(jī)：Brain創(chuàng)造了Transformer架構(gòu)，DeepMind則拿出過(guò)震驚世界的AlphaGo。

“一山不容二虎”的故事沒有在谷歌發(fā)生。團(tuán)隊(duì)合并后，雖然帶頭人是哈薩比斯，但Google Brain的聯(lián)合創(chuàng)始人杰夫·迪恩仍然擔(dān)任首席科學(xué)家。2024年底，在團(tuán)隊(duì)的共同努力下，Gemini模型順利完成了迭代。

接下來(lái)，谷歌更力出一孔。到2025年5月，皮查伊在I/O開發(fā)者大會(huì)上，大膽打破了谷歌搜索的立命之本：“搜索框不重要了，Google要做你的AI助理，直接替你把事辦了。”

大會(huì)上，谷歌共宣布了23項(xiàng)功能更新，覆蓋了AI模型、視覺生產(chǎn)、谷歌搜索、Agent系統(tǒng)、AI眼鏡、生態(tài)等幾乎所有與AI相關(guān)的領(lǐng)域。

AI顛覆搜索后，谷歌的野心也被放到了下一代計(jì)算平臺(tái)：其自研了TPU提供底層算力支持；用安卓與Chrome構(gòu)成交互前臺(tái)，Workspace承接具體任務(wù)執(zhí)行；YouTube打造流媒體資產(chǎn)，為Gemini在多模態(tài)能力上奠定基礎(chǔ)。此外，Gmail、Google Docs等成熟應(yīng)用也逐步被注入AI功能。

Gemini 3的發(fā)布會(huì)上，谷歌宣布其瀏覽器AI模式的月活躍用戶已達(dá)20億，其中Gemini應(yīng)用月活用戶達(dá)6.5億。皮查伊稱：“令人驚嘆的是，僅僅兩年時(shí)間，AI已從單純處理文本和圖像，發(fā)展到能夠讀懂場(chǎng)景。從今天起，Gemini將在谷歌全系產(chǎn)品中全面鋪開。”

入口大戰(zhàn)開打

谷歌的系統(tǒng)性進(jìn)擊，也意味著AI新入口大戰(zhàn)已經(jīng)打響。AI角逐已從基模大戰(zhàn)、技術(shù)競(jìng)速，轉(zhuǎn)向了關(guān)乎下一個(gè)10年勢(shì)力版圖的場(chǎng)景落地競(jìng)爭(zhēng)。

下一代入口在哪里？在移動(dòng)互聯(lián)網(wǎng)時(shí)代，得流量者勝出。但未來(lái)如果把答案擴(kuò)展到“誰(shuí)能幫用戶解決問(wèn)題”的效用之爭(zhēng)，機(jī)會(huì)又重新在巨頭面前攤平。

某種程度上，谷歌的全棧出擊，也是阿里正在嘗試“復(fù)刻”的道路。周靖人在云棲大會(huì)后，對(duì)《中國(guó)企業(yè)家》等媒體表示：阿里云是全球少數(shù)幾家在大模型和云計(jì)算方面都能夠做到全棧自研、聯(lián)合創(chuàng)新的公司。

11月17日，阿里千問(wèn)App公測(cè)版亮相，直接瞄準(zhǔn)AI to C入口，計(jì)劃打造會(huì)聊天、能辦事的個(gè)人AI助手，并整合了阿里全生態(tài)的服務(wù)能力。次日，螞蟻集團(tuán)發(fā)布全模態(tài)通用AI助手“靈光”，用戶可以在30秒內(nèi)，生成可交互、可編輯、可分享的“閃應(yīng)用”。這些都昭示著阿里準(zhǔn)備抓住“生產(chǎn)力入口”的野心。

在不久前的2025年第三季度財(cái)報(bào)會(huì)上，騰訊集團(tuán)總裁劉熾平亦明確表示：微信最終將成為一個(gè)AI Agent，幫助用戶在微信內(nèi)部完成大量任務(wù)。字節(jié)豆包則在流量加持下，正在從生態(tài)滲透，走向工具賦能，與抖音、剪映深度綁定，將豆包變?yōu)樽止?jié)的生產(chǎn)力引擎。

最近，OpenAI已經(jīng)將更多目光投向了企業(yè)服務(wù)與垂直場(chǎng)景落地。今年上半年，OpenAI實(shí)現(xiàn)43億美元營(yíng)收，其中消費(fèi)者與企業(yè)訂閱占據(jù)大頭。

一位海外文旅開發(fā)從業(yè)者對(duì)《中國(guó)企業(yè)家》表示：他在使用了國(guó)內(nèi)外多項(xiàng)大模型后，感到GPT-5在上下文理解層面，明顯具備優(yōu)勢(shì)。“雖然我們海外數(shù)據(jù)相對(duì)匱乏，但因?yàn)镃hatGPT好用，海外系統(tǒng)反而更容易做。”

不過(guò)，靠舊地圖未必能拿到新船票。AI時(shí)代的贏家，不只屬于技術(shù)領(lǐng)先者，或者有能力“大水漫灌”的超級(jí)App擁有者，更是能理解用戶需求、將技術(shù)轉(zhuǎn)化為解決問(wèn)題能力，能將AI與行業(yè)場(chǎng)景深度綁定，對(duì)AGI有更透徹理解和追求的企業(yè)。

上一篇：【中國(guó)制造新觀察】6G發(fā)展不是一步到位

下一篇：阿里巴巴承辦COP30中國(guó)角邊會(huì) 展示AI驅(qū)動(dòng)氣候治理新成果

相關(guān)資訊