首先是一個冷知識:ChatGPT 中的「T」代表「Transformer」,這個概念是谷歌的一群工程師在 2017 年提出的,并發表在一篇現在已成經典的論文《Attention Is All You Need》中。
這個小細節,很大程度上能說明谷歌在 AI 領域并不是一個花架子團隊,而是由一群 AI 產品業內經驗最豐富的老兵組成的團隊,從 Gemini 2.5 發布之后,Google 在 AI 領域的優勢已經頗有點「漸入佳境」的感覺:基礎模型能力的大幅提升,加上 Gemini 在谷歌軟件生態內的逐漸深入,讓全球數以十億計的用戶都在這個過程中,逐漸被「轉化」成谷歌 AI 產品的用戶。
如何「轉化普通用戶變成 AI 產品用戶」,是這個時代幾乎所有 2C AI 產品都需要回答的問題,顯而易見,在這個問題上,Google 已經憑借著巨大的存量用戶優勢,甩開了所有競爭對手——但谷歌同樣需要奔跑不停,才能在 Perplexity、OpenAI 以及微軟等強大競爭對手的圍剿中,留住用戶的心。
Google 顯然最清楚在端側 AI 爆發的時代,谷歌的實際優勢在哪里,用戶同樣知道谷歌知道他們想要哪些 AI 能力,出現在自己最常用的日常應用中。
01
Google 搜索引擎 AI Mode 深入
作為目前巨頭中 AI 落地成效最顯著的選手,Google 毫不掩飾自己在 AI 產品商業化用戶規模上的領先,上來就展示了大量 AI 能力在谷歌產品中的實際應用成果。
Google CEO 桑達爾 - 皮查伊 介紹,基于 Gemini 能力的 AI 總結功能現在已覆蓋全球超過 15 億用戶,AI 總結功能在全球的調用次數增長已經超過 10%,而且這種增長還在持續。多模態識別能力的谷歌 Lens 現在同樣已經有超過 15 億的月活用戶。
但 AI 顯然不只是能在搜索引擎上起到作用,比如谷歌同時就宣布了新的「虛擬試穿」功能,谷歌會要求你提供一張全身照片,通過大模型「理解人體和服裝的細微差別,不同材料在不同身體上折疊、拉伸和垂墜。然后使用這張照片,生成你穿著你正在選購的衣服的圖像。
谷歌搜索的負責人甚至放出豪言:如果你想知道互聯網上最重要的搜索引擎未來會變成什么樣,那你就去點開「AI 模式」看看。
「AI 模式」同時也支持深度研究功能,會自動將用戶的提示詞轉化為海量的搜索,并自動查找和整合信息,同時在這個模式下,AI 搜索還可以訪問你之前的搜索記錄,你也可以手動開啟權限,讓它可以訪問你的電子郵件,以便 AI 能更了解「你是誰」以及你關心什么。
把所有這些功能加起來,你就會得到一個更加靈活和個性化的 AI 搜索,無論是針對用戶本身還是當前的具體查詢,顯然都能根據用戶信息給出更加精準的回答。
Gemini 2.5 家族也同時加入了支持深度思考的版本 —— Gemini 2.5 Pro Deep Think,在 2025 年美國數學奧林匹克競賽 ( USAMO ) 中取得了 40.4% 的高分,要知道這可是最難的數學基準測試之一,比之前的 2.5 Pro 版本足足提升了 10 多個百分點。同時在 LiveCodeBench 競賽級編程難題中,它的得分更是高達 80.4%。同時,在多模態推理 MMMU 測試中,也取得了 84.0% 的成績。
據 DeepMind CEO Demis Hassabis 表示,教 AI 自主行動一直是計劃的一部分。這些「察言觀色」的技巧,是人類相對擅長但難以量化或研究的事情。
02
Android XR
明眼人看到這里已經能反映過來了:比起手機攝像頭,這個如此深入現實世界的多模態 AI 功能,似乎更適合的載體是在眼鏡上。
Google 顯然同樣想到了這一點,隨即趁熱打鐵,宣布了 Android XR 的新進展,同時在現場展示了谷歌 XR 眼鏡的原型機。
在演示中,Google 強調它們是使用 Gemini 的「最佳硬件」:Google 的、 展示的原型眼鏡搭載有相機,麥克風和揚聲器,Gemini 可以調用這些硬件,幫用戶理解周圍的世界。同時在顯示屏上顯示類似地圖導航等更多信息。
03
AI 創作全家桶
除了直接面向最多普通用戶的 Gemini,Google 同時還針對創作者的一系列 AI 創作工具,進行了更新換代 —— 其中不僅有直接與 Sora 競爭的 Veo3、圖像生成工具 image4,Lyria 2 音樂生成模型,還有全新視頻創作工具 FLOW。
谷歌現場演示了一段 CGI 級別的生成動畫,其中動物在森林里說話。聲音和視頻完美同步:有聲音的視頻顯然大大提升了 AI 生成視頻的實用性。谷歌 DeepMind 首席執行官 Demis Hassabis 也表示:「我們正在走出視頻生成的‘無聲時代’。」
Google 同步宣布了「大杯」和「超大杯」訂閱服務,AI Pro 與 AI Ultra,其中頂配的谷歌 AI Ultra 要價每月 249 美元,但同時也確實提供了物超所值的服務 —— 例如幾乎無限制的各項服務使用額度,以及 30TB 的谷歌 Cloud 云端存儲容量。
AI Ultra 計劃允許用戶試用 Gemini 2.5 Pro 全新的增強推理模式 Deep Think,據谷歌介紹,該模式專為「高度復雜」的數學和編程問題設計。它還提供 Chrome 中 Gemini 的早期訪問權限,允許訂閱者直接在瀏覽器中使用 AI 完成任務和總結信息。
顯然,在端側 AI 產品如何做這件事上,Google I/O 展示出的「軟件硬件雙管齊下」,已經足以讓谷歌再次成為 AI 產品生態中最讓人忌憚的選手。