跳至主要内容

详解谷歌AI战略:被低估的巨象,我眼中的AGI最终赢家

“现在市场上有很多大模型,但十年后,能存活的可能不会超过10%。这是一个九死一生的游戏(这是我猜的)。你猜猜,十年后主流的大模型会是什么?我猜是Gemini,因为背后的Google非常强大,而且已经醒了。”
——段永平

谷歌,作为今年AI巨头中风评反差最大的公司之一,从年初被广泛批评,到如今接连推出Gemini 2.5pro、Veo、Nano Banana等一系列现象级AI产品与应用,成功实现了在AI赛道上的逆风翻盘。

就在几天前,巴菲特旗下的伯克希尔·哈撒韦公司披露了三季度持股报告,巴菲特的退休前“最后一舞”便是首次买入谷歌的股票。

从追随者到引领者,谷歌只用了不到一年时间。正如段永平所说:“Google很强大,而且已经醒了。”


一、谷歌AI的强大根基

几个月前,我曾总结过谷歌AI的强大之处:“既有强大的底层模型做支撑,产品架构和交互设计独具匠心,全家桶生态更是未来令人忌惮的护城河。”

这些成就并非偶然。早在2017年,Google CEO Sundar Pichai就宣布了“AI-First”战略,这一年对于谷歌而言充满了标志性事件:

  • 谷歌发布了第一代TPU,自研芯片之路正式开启,这也是谷歌能够在短时间内赶超模型训练的核心原因。

  • AlphaGo在围棋比赛中战胜了当时世界排名第一的柯洁。

  • 同年,谷歌发布了改变未来AI格局的《Attention is all you need》论文,奠定了生成式AI(GenAI)的基础。

可以看出,谷歌在AI基础研究上始终走在前沿,但为什么最先引爆全球的大语言模型却是OpenAI的ChatGPT 3.5呢?

原因是,作为当时年收入达到2800亿美元的超级巨头,谷歌选择将新技术用于现有的核心业务,改善搜索和广告效率,这种务实的选择无可厚非。而此时,OpenAI却快速突围,将ChatGPT推向了全球。

在2022年,谷歌内部默默测试LaMDA(对话型语言模型),但因未达到GTM(Go To Market)的标准,始终未发布。就在此时,OpenAI横空出世。


二、谷歌的危机与反应

面对ChatGPT的强大冲击,谷歌陷入了焦虑,他们匆忙推出了聊天机器人Bard,但发布会现场的灾难级演示让谷歌的AI形象一度受挫。

此后,Sundar Pichai将Google Brain和DeepMind两个AI研究部门合并,成立了Google DeepMind,并推出了我们如今熟知的Gemini系列模型。这一举措也标志着谷歌AI战略中“全栈式AI”模式的确立。

1. 基础设施:自研AI专用芯片TPU

AI赛道的核心是算力、算法和数据,但如果没有芯片,所有的努力都将变得毫无意义。自有芯片使谷歌在训练模型时能够更加高效,节省成本,提高速度,保证了竞争力。

2. 模型与产品:整合顶尖人才,构建Gemini系列AI产品

Gemini 1.0发布时并未得到预期的反响,但随着Gemini 1.5的推出,凭借100万Token的超长上下文窗口和2.5版本的推理与编程能力提升,谷歌重新获得了市场的认可。

目前,谷歌已在图像、视频和知识库领域推出了诸多明星产品,例如:

  • Gemini 2.5 Pro:一款多模态模型,擅长复杂推理和编程,是目前最强的LLM之一,广泛应用于网站建设、市场调研、产品设计等多个场景。

  • Gemini 2.5 Flash:轻量级模型,生成速度快,日常承接一些基础搜索任务。

  • Nano Banana:基于Flash的图像生成工具,广泛应用于电商、广告等商用素材生成。

  • Veo3:专业级别的视频生成工具,支持高保真、长镜头视频创作,已被大量广告公司和视频团队采用。

  • NotebookLM:基于Gemini的AI研究和笔记助手,能够快速总结、提问和连接文档内容,极大提升工作效率。

3. 应用与分发:产品生态AI化

虽然Gemini应用的月活跃用户数已达到6.5亿,但与GPT的8亿周活用户相比,依然显得小巫见大巫。然而,谷歌拥有全球超过40亿的Chrome用户、85亿次搜索查询、超过25亿的YouTube用户,和超过30亿的Android设备用户。

谷歌正在将AI能力渗透到全家桶产品中:

  • Google搜索中推出了AI概览窗口,通过Gemini重新组织信息,生成综合性内容。

  • Chrome浏览器中,开始灰度测试Gemini功能,用户可以在浏览时随时呼叫AI进行提问。

  • YouTube中,AI提高了用户消费内容的体验,并赋能创作者创作,例如AI生成视频摘要和时间戳。

  • Workspace办公套件中,集成了Gemini AI,提升文档、表格、邮件等工具的工作效率。


三、Google Cloud:AI的更大分发引擎

谷歌在消费级应用和硬件产品中大力渗透AI的同时,其真正的分发杀器却是Google Cloud。很多人第一次体验Gemini,可能是在Google AI Studio平台上,免费试用新发布的AI模型。

为何谷歌如此慷慨提供免费的token?背后的战略考虑不仅仅是吸引新用户和收集反馈数据,最终目的是将开发者的产品部署到Google Cloud上,这样可以确保其云计算服务的最大化使用。


四、未来的挑战与AI战略

然而,谷歌仍然面临着市场的最大拷问:未来十年,如何从AI的崛起中获取新流量并实现盈利?

1. 自我革命:
虽然谷歌必然需要进行自我革命,但如何控制节奏至关重要。如果变革推进过慢,可能会被OpenAI等公司抢占先机。如果太过激进,现有的广告收入模式也会遭到冲击。

2. 浏览器的重要性:
浏览器将成为连接传统互联网和AI时代的最佳入口。未来的Agent时代,浏览器能够收集用户行为和数据,同时具备自动化执行能力,成为AI的载体。如果谷歌能够在Chrome浏览器中实现AI化,将大大增强其在AI时代的竞争力。

3. 广告收入的变革:
当AI代理人代替用户发起搜索时,传统的广告收入模式——基于点击付费(CPC)将面临巨大的挑战。新的收费模式可能将基于成交付费(CPS)或者广告推荐的采纳率付费。


五、总结

过去几年,谷歌被低估了。曾几何时,在全球为ChatGPT狂热时,谷歌被看作传统企业,似乎失去了竞争力。但如今,随着Gemini 3和Nano Banana 2的即将发布,谷歌厚积薄发,准备重回舞台。

谷歌的使命依然未变:“整合全球信息,使人人皆可访问并从中受益”。如今,AI正是这一使命的最终体现,我们期待谷歌继续在AGI的赛道上引领未来。

让我们拭目以待,谷歌的AI征程才刚刚开始。 

评论

此博客中的热门博文

用曹大的“分子分母”去做业务判断——三段思考:认知、教育、出海

最近看到曹大的一句话,简直让我大彻大悟:“公众对世界的认知,往往落后时代五到十年。” 这话一出,我瞬间回想起当年李嘉诚在大陆大肆卖房时,网上还一片“别让李嘉诚跑了”的哀嚎声。几年后,你再看看房市的走势,恒大的雷,碧桂园的破产…… 那些看清趋势的“老狐狸”们,早早就抽身了,没给自己惹上一身骚。 潘石屹当时也看不懂李嘉诚卖房的原因,结果他自己却说:“我看不懂,但我可以跟着做。”事实证明,他这招还真是狠,赚得盆满钵满。 然后我又翻回曹大的文章,他在里面用“分子/分母”来解释认知模型,简直是给我打开了新世界的大门,真是眼前一亮。 01.  分子与分母:先搞清楚你在哪一层 曹大把“分子”和“分母”做了个有趣的划分: 分母 :是准备进入某个领域,但还没搞明白这个领域的基础。 分子 :已经在这个领域获得回报的人,真正站在顶端的“行家”们。 而核心思路就是: 👉 努力让自己成为“分子” 👉 提升判断力、认知力和执行力 👉 在趋势爆发的时候,站到最前线,而不是做那些“意识滞后”的人。 这个观点让我立马想到了一个问题,干脆去问了ChatGPT:“现在有哪些行业是分子在膨胀,而分母还没反应过来的?” 然后结合我和老婆的讨论,我们得出了三个有趣的启发。 02.  启发一:认知不是“顿悟”,是“被逼出来的” 大家都喜欢说“认知”有多么高深,感觉一掌握就能解决所有问题,像是掌握了某种神奇技能。 但我敢说:认知是 做出来的 ,不是空想出来的。 举个例子: 假如把我们带回2019-2020年,问我们是否能抓住疫情下的创业机会?抓住跨境电商的黄金窗口期? 答案是—— 不能 。 原因很简单,不是看不见机会,而是: 没有技能 没有信心 没有方法 没有实践过,完全没有“手感” 即使机会就在眼前,我们也抓不住。 但现在我做了一些实际的事,明显感觉到:只要机会再来一次,我已经具备了足够的能力去抓住它。所以,我越来越相信:认知不是天上掉下来的,而是通过 行动、执行和迭代 一点点长出来的。 没有实践,你怎么能有认知?没有行动,你怎么能有信心? 这,才是最重要的结论 。 03.  启发二:孩子教育——不要把自己的路线强加给下一代 咱们讨论了三代人的成长路径: 父辈的路径 :读书 → 当兵 → 国企分配 → 稳定晋升。典型的“时代福利路径”。 我们这一代 :读书 → 升学 → 找工作...