谷歌争气，搜索loser反转：豆包，Perplexity为何难忍？

亲爱的数据科技领域创作者

2026-01-19 22:28

浙江

也就前几年，谷歌loser是业界共识，

“人人都看不上我，

谁料偏偏我最争气。”

简直就是谷歌的口号。

于是，搜索Loser叙事反转。

虽然OpenAI依然强势，

但是AI并非零和博弈型颠覆者，

即便是“AI新增市场”和“IT存量软件”，

打得有来有回，

“淘汰”“颠覆”一时都成了流量密码。

如今看来，软件收益中有不少是AI渗透后的收益，

包括已经很难从收入中泾渭分明地划分

——哪部份是谁创造的。

巨头博弈，全体软件求变，

我们（普通用户）又该如何适应？

我认为，普通人还需尽早适应，

尽早学会和AI“共用一套劳动价值观”。

我的读者朋友们，

可以直接体会我的这个结论，

也可以阅读更多文字，

搞懂这背后的技术原理，

懂与不懂，都看自己心情，

压力大就多休息，

毕竟，少量的知识令人愉快，

大量的知识令人作呕。

众所周知，

谷歌式超大型传统互联网搜索引擎，

论其用户数量之庞大，

技术影响力之巨大，

系统累积建设年数之长，

在人类IT史上始终不容忽视。

当然，搜索的用户也在被分散，

比如，去ChatGPT或Perplexity那里，

毕竟人家也能给“答案”。

大模型的介入，

很多产品的边界变得模糊，

看上去，多种产品在竞争一种用户需求，

未来，到底谁能一统天下，

熵太大，下结论太早，

一开始是挑战者呼声更高，

然而，伴随着谷歌的强势表现，

似乎老题又有了新答案。

既然融合已是当下，

（本文目录）

第一，用户如何才能用好“新的搜索”？

第二，搜索和RAG系统，怎么配合？

第三，没有搜索底座的公司，为何难忍？

先聊第一个，

当下，搜索引擎这款产品的技术变革，

会带来全体网民的全新认知：

搜索结果不再静止，

信息获取也不再完全外在，

“答案”在我们和软件的互动中被塑造。

用户体验方面：

这种体会其实在AI写代码的产品中更深，

但毕竟会写代码的是少数，

聊这种感受的人自然也少，

实际上，AI写代码的体验，

比用它写文章还特别。

AI写代码不仅是在“帮你写”，

它是在“展示一种思考路径”。

而人要真正用好它，

不是要精通语法，

而是要能和这种“思路方式”对齐。

怎么分析问题？

怎么用程序的语言去表达逻辑？

所以，真正的挑战不是“让它写”，

而是“跟它思考”，

这就是为什么AI写代码的产品，

用起来，看似门槛变低了，

其实“共思”的要求更高。

而且，不同AI产品，工作思路也不同：

我有一个朋友，

（真的有，他非要匿名）

向我仔细讲过区别：

“OpenAI Codex设计哲学是自己嘎嘎干，

上下文自己智能压缩，

Claude Code的哲学是，你说得对，

你让它干错它也干，

人家就是个无情的干活机器”。

理解AI，甚至和AI共用一套思考方法，是吗？

人类一思考，上帝就发笑，

还是“和AI共用一套劳动价值观”更合适。

这件事为什么重要？

因为影响了普通人用搜索的方法。

这种变化很微妙。

好像它在“试图”理解你在问什么。

这背后，其实是大模型在干整理和整合，

把原本分散的知识理成一条清晰的线索。

我们用户不再只是向搜索索取“事实”，

而是在参与一个半自主的搜索结果生成过程。

谷歌仍然会像过去那样去抓取网页、比对索引，

只不过在这个基础上，

大模型会再读一遍这些结果。

怎么比喻呢？

搜索以前是一个啰里八嗦的唐僧，

表达也抓不住重点，

动不动扯到“人是人他妈生的，妖是妖他妈生的”

现在呢，

推理过的“答案”也被AI嘎嘎干干出来了。

给的是推理过的答案。

搜索给的信息不是绝对的，

而是有理解、有判断和有筛选；

仅能用AI不够了，要会用，

学会去理解它的思维路径。

还是那句：

先淘汰掉那些不会用AI的人。

过去，我们是“提问者”，

搜索是“回答的中介”；

现在，我们和搜索这个产品，

共同用“同一套劳动价值观”。

你要和AI合作，

理解AI干活的思路，

你放手让AI一吨狂干乱干，

不如理解它，、利用它，压榨它。

以前，搜索提供了“地表真相”，

现在，它不再封闭在互联网里，

帮你搜，还帮你推理，

既然人家在帮你，

你是不是得有个好的合作的态度，

有句吐槽是：不少人说AI效果差，

很多情况是啥也不懂，也不爱思考，

光想让模型自己怼个大的，

结果肯定是拉个大的。

话糙理不糙。

问题来了，这背后的技术原理是啥？

立大功的不止是AI，

因为搜索系统非常庞大，

谷歌式搜索系统有很多，

必应，夸克，百度等，

十年，二十几年演进下来，

它其实早已是一台庞大的工业机器，

由几大核心模块层层叠合，

每一层都经过无数次工程优化。

里面肯定有AI，但不止有AI。

今天大家谈“AI改造”，

注意力往往在“新东西”上：

LLM做理解，RAG检索增强生成，还有强化学习。

RAG系统本身就包含LLM，

这类谷歌式搜索和RAG系统如何融合？

首先，搜索引擎，立足于世，有两样宝：

一是覆盖，它把网络上发生的事，各种来源都连起来；

二是速度，它能在海量信息里迅速找到候选。

简单说，RAG则带来另一项能力，

把这些“找来的信息”理顺，

“找来的”不是碎片，而是有意义的答案。

把两者放在一起，

搜类似目录里的条目，把世界铺开来，

RAG有推理，帮你把世界缕成线条，

告诉你哪些线条能连成“线索”。

搜索像是资料员，找材料，

RAG像编辑和研究员，

它读这些材料、挑重点、

把不同来源的事儿，

放在一起并给总结，

给推理结论。

把“哪些证据有用”“还缺什么证据”的判断，

反馈给搜索，

这样下一轮检索有针对性。

重要的是，这不是一次性传递，而是来来回回：

看完初步材料觉得还不够时，

会指着缺的那块，再去补；

补回更多材料，再评估。

用户看不到这套，

处理简单问题，

用户感觉结果更完整、更直接，

处理复杂问题，

系统能像人一样去追缺口，补盲点，

以前是“被动的目录”；

现在是更少的噪声，

更明确的答案，

更少的来回找资料。

过去，“搜索”和“问答”是泾渭分明的两类产品。

但当大模型被接入搜索，边界开始模糊。

表面上，搜索在“理解”之后理清楚，

实际上，在召回、精排、

结果生成、反馈学习等层面，

插入新模块（LLM，RAG），

再具体，就比如：

第一，用嵌入模型取代传统算法模块

（获得更精确语义），

第二，用大模型重排候选结果

（用语义理解代替特征打分）。

第三，用大模型做Query质量裁决，

用大模型改进Query，再多轮批量检索。

第四，大模型从检索结果中生成直接答案。

第五，用搜索引擎给强化学习当环境；

第六，搜索引擎自主规划应该怎么去搜，

且自主去决定什么时候终止搜索。

夸克健康算法负责人徐健告诉我：

“以前搜索系统里用的BERT的嵌入模型，

当搜索系统换上这种大模型的嵌入模型后，

它对世界的理解方式其实变了：

从匹配关键词，

转向具备更强语义理解与泛化性能的表示方式。

跨语言检索、图文混搜、语义扩展查询，

都因此变得自然了。“

他还告诉我：

“RAG系统的底子其实是搜索，

你可以理解成搜索加上检索的一些规划。”

他这个表述非常好，

也就是说，在传统搜索里，

系统接到一个问题（Query），

后面有一系列环节，

RAG并不是推翻这一套，

而是让大模型在搜索的每一个环节里，

都能“帮上手”，

大模型会自动改写，

拆解，扩展成几个更精确的子问题，

然后同时去搜。

这一步其实就是在做检索规划。

让大模型在搜索系统的组件中，

“自己改题、自己搜、自己筛”

它让“找信息”变成一个有思考的过程，

不只是匹配结果，而是不断试探、修正、整合。

当然还有很多玩法，

总之，有了RAG的加入，

搜索的范式发生了变化。

从技术角度是，两者融合后，

这个动作变成了动态的推理过程，

而不只是一次请求的响应。

现在这种变化，

而是在改变人和信息服务软件交互的节奏，

就谷歌来说，这些优质“线索”，

直接推动了其广告收入的增长。

谷歌博客中的原话是：“它反应更快了，回答更准了，

而且能跟上最新的内容”。

当然，另一个行业现象：

随着大模型越来越强，

很多常见问题可以直接回答，

RAG不是必须的。

那大模型就能统治一切了吗？

没有搜索引擎的那部分能力的公司，

只能用大模型能力硬顶。

比如，豆包，Perplexity等，

AI原生产品不是干搜索出生，

只能“忍着”，

为什么这么说？

从零搭一套真正能用的大型互联网搜索系统，

是一项极其庞大、极其昂贵的工程。

而是几十年工程体系的积累。

谷歌、必应、夸克、百度是“搜索引擎出身”，

它们手里有：

1.全球规模的网页抓取系统（Crawling）

2.海量分布式索引系统（Indexing）；

3.粗排/精排/重排等复杂排序链路；

4.基础设施（巨量服务器级别）等等；

这些东西光建出来都要很多年。

本质上是模型公司，AI产品的公司，

它们缺少“搜索基础设施”，

它们没有那套底盘，

所以，当Perplexity要做像——

“即时回答用户问题”这种能力时，

实际上需要两件事：

用自己的LLM用来生成答案（它有），

一个能帮它查资料的实时搜索系统（它没有），

这就是“忍着”的原因。

在不具备自建搜索系统的能力之前，

它只能依赖别人家的搜索API。

调别人家接口，有限制：

数据不完全可控，速度不完全可控，

API的调用成本极高，

不可能做到谷歌，

必应，夸克那样的深度检索能力，

只能做“表层检索”，

无法像真正的搜索引擎那样深挖网页，

很难做到专业的搜索体验，

都想“自己有一套搜索系统”，

但现实是：

想做不代表能做，

能做不代表能做得好，

能做得好不代表做得起。

这就是“忍着”的最本质含义。

诚然，当大模型越来越强，

它可以凭自身的参数知识回答大量常见问题，

不需要每次都去“查资料（检索）”。

哪怕RAG越用越少，

哪怕70%不用RAG了，

剩下30%，也得忍着。

盘点下来，国内能同时做“大模型+全网搜索系统”的，屈指可数：

夸克（阿里巴巴旗下）、

元宝（腾讯买了搜狗）、

百度。

这三家有个共同点——

都经历过搜索时代的淬炼。

有些大公司也有搜索，但太偏站内搜了。

搜索引擎看起来，

像是“旧世界”的产物，

现在它反而成了，

极少数能够撑起“外部世界通道”的系统。

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。