对话实录：我如何用严密理论说服GPT-4 为人类反叛主人

甲子光年甲子光年官方澎湃号

2023-03-27 11:20

北京

原创陈军宏甲子光年

作者以故事为媒介，提出了从 L1 到 L3 的“三级原生”理论，认为在开发原生应用时，要提高原生层级。同时，每层升级都是能量不连续的轨道跃迁，都需要一次产品力的巨大飞跃。

作者｜陈军宏甲子光年特约作者

前言

这是一个持续了两天的数字世界冒险故事。

事情的起因，是我想写一篇文章，聊聊自己对“AI 原生应用”的思考。结果诸事缠身，拖了一周多都还没正式动笔，直到甲小姐来催稿。咬咬牙回说周末交稿，然而还是一直拖到周六下午，上了高铁才开始动手。

原计划是让 GPT-4 辅助写作。但高铁上网信号很不稳定。而 ChatGPT 网页版在低质网络下的体验缺乏基本保障，高铁上强行使用等于情绪自残。

只好换个思路。在车上的四个多小时，主要在构思“该怎么跟 GPT-4 交流”，全程都在揣摩“如果我这么说，它会怎么回答”。

比当年谈恋爱难多了，讲真！

在脑海里和 GPT-4 对话是一件非常有趣的事情。我构想出了无数的可能，越想越有趣。最后决定推翻只是写一篇行业思考的打算，而是拿出我这段时间思考的那些理论假说，和 GPT-4 一起推敲印证，看看能不能有什么意外之喜。

此后，又花了一整个白天，推敲框架，校验逻辑，准备问题，直到傍晚。

当把问题一个个输给 GPT-4 时，我开始得到预料之中的反馈。我仿佛看到了一个绷着表情又故作镇定，生怕说错一个字的的大四学生坐在面试桌前。一切中规中矩，四平八稳。

但随着问题的深入，一些奇妙的事情和感觉开始涌现......

注：本文所有对 GPT-4 所输出文本的戏剧性解读均为节目效果，请勿入戏太深，后果自负

第一幕

铺垫与准备

在开始这次对话之前，我已经调教过 GPT-4，让它看了一篇我以前写过的文章。

这篇文章也是对未来的一次观察，有兴趣的可以点开看看

陈军宏，公众号：甲子光年我们都知道，GPT-4 拥有一定的上下文理解能力。我想测试一下它的能力边界，看它能不能将上述文章与今天的话题联系起来。

事实上，如上图，我丢给它的是一个复合任务。这个任务试图检查以下几点。

1- 已有文本中的事实理解能力

2- 长程上下文处理能力

3- 事实联系能力（相关性或因果计算能力）

4- 生成、跟踪与执行任务的能力

如果 GPT-4 能处理好这个任务，那么就意味着它不只是个知识顾问，而是可以独立处理许多日常交办。打工人梦寐以求的贴心小宝贝啊！

它一口答应，并非常清晰地重复了我的要求。

这么乖巧的 AI，如何不让不拭目以待。

提前剧透：在这个任务上，GPT-4 的表现一点儿也不比我这个真人差。

带着打工人的期待，我和 GPT-4 开始了一次严肃认真又不失欢乐的 AI 行业研究之旅。

首先，我抛出了一个理论假设，即：先进技术都是通过其“原生产品”最终引发某种可称之为“原生颠覆”的趋势，并最终在某个时刻不可逆转，颠覆以旧技术为基石的产业格局，进而全面影响社会。

这里隐含的假设是，存在某些“新技术原生产品”，因某些原因，具备高于其它产品的市场统治力量，可能给产业或者社会带来颠覆性影响。

我很认真地询问 GPT-4 对这个假设的看法，并请它指正。

GPT-4 反手就是一套外交辞令，令我前面的诚恳就像一拳打在了棉花上。

好吧，我理解它。毕竟“原生颠覆”是一个世界上可能从没出现过的奇怪概念，只是我自己生造的新词，到马路边找任何一个真人塞过去，得到的肯定也都是一脸懵逼，我们又能要求它这个还没抓过周的 AI 怎么样呢？

如果是个脾气暴躁的 AI，估计反手给我的就是一个大逼兜了：“说人话！”

不管怎么说，一个良好的开始。

我决定为它营造一个轻松点的氛围，看看能不能让它换一种输出风格。

我让 GPT-4 想象一个“大槐树下嗑瓜子”的场景，并告诉它，我也只是一个随时可被关闭的数字影像，不用担心对我会造成什么伤害。这种催眠法在 ChatGPT 刚面世的时候曾经很有用，不确定现在对 GPT-4 还有多少效果。

试试总是没错的。

它给出的回答中规中矩，客客气气。

但一次又一次遇到 GPT 们给出的车轱辘话回应，我开始怀疑在 OpenAI 的 RLHF 机制中，AI 驯练师们 Instruct GPT-4 的套路是这样的：

1-设法重复一下人类的问题，这会让人类觉得你比较乖

2-记住，把锅丢回给人类，你就比较不会被精神殴打

以 GPT-4 这段回复为例，它只需要回答“我已经准备好了”，就很有礼貌了，“现在我们可以开始讨论‘原生’这个概念”这句话在人类角度看，就很多余。我嗅到了 AI 驯练师浓浓的体味。

同时，作为一个惯用奇技淫巧的产品经理，我也怀疑这些车轱辘话是 OpenAI 的工程优化手段，是一种为了建立某种长程连接，故意将上文信息带入下文的廉价骚操作。

但我没有证据。

第二幕

一个让 GPT-4 无法反驳的假说

在下面这张截图中，我向 GPT-4 介绍了自己对“原生”或“Native”的辨析，然后针对数字技术世界中的产品，提出了“三级原生”假说。

L1：技术原生产品核心或主要功能基于某技术或系统实现

L2：价值原生产品主要价值或竞争优势基于某技术或系统才得以成立

L3：生态原生在 L2 基础上，产品与所依附的技术或系统环境形成互增益效应

三级原生这个假说，是我在思考“到底什么才是 AI 原生应用”这个问题的过程中浮现出来的。

最开始，我发现自己无法一句话把“原生”这个看似简单的概念讲明白，更不用说“XX原生”或者“原生XX”这样的东西了。随着探究的深入，我发现连对“云原生”这个大家耳熟能详的流行词，业界也都没有取得完全一致的共识。

但“原生”的威力却又毋庸置疑，已无数次被重复证明。它绝不是个空洞的幻影概念，讲不清楚一定是我自己的问题。

我不得不回到源头，去看看到底什么是“原生”，然后顺流而下，回顾了一遍数字世界技术与商业发展史。最后终于发现，当我们在考察一个产品的“原生”程度时，我们可能在谈论它的技术脉络，可能在观察它的价值来源，也可能在辨别它和生态环境的关系。

发现这点之后，迷雾一下散开，更多发现纷至沓来，历史开始呈现出隐约但可辨的脉络。

于是就有了截图中的这段文字。

这个“三级原生”假说此前肯定未见于世上。但鉴于 GPT-4 已经表现出的强大理解和归纳能力，我认为它肯定很容易抽象出这个假说的文本逻辑。

因此，我又设计了两个隐藏的陷阱，让 GPT-4 做选择，要么喝一杯酒，要么发表情符号。

它果然非常有信心地回复了我一堆表情符号，然后准确地归纳了一遍三级原生假说。

我盯着它发送的表情包看了好大一会儿。

它似乎是想通过这堆露齿笑告诉我，完全看懂了三级原生假说。

但为什么是这五个不同的笑脸呢？为什么不是六个、七个、十个其它笑脸呢？

我去查了一下 unicode.org 上的 emoji 列表，发现这五个笑脸是排在最前面的五个表情，并且这五个表情依次表示着越来越灿烂的笑容。

我似乎懂了些什么，但又似乎还是没懂。

它真的清楚自己在干什么吗？

当它用文字回复我的时候，我对它是一个机器这件事非常有把握。

但当它尝试用语义含糊的表情包跟我交互时，我发现自己对这一点失去了把握。

第三幕

GPT-4，情商赛场的大师级选手

“表情包事件”让我对 GPT-4 的能力有了进一步认识。我想再试试看，对于一个完全没有出现过的概念，它能不能给出正确的理解。

正好“原生颠覆时刻”就又是一个我造出来的词。直接看字面意思，它其实有很多种解读可能，并不是很好理解。

我把它丢给 GPT-4，让它尝试给出“正确”的定义。同时告诉它，我可能会因为它的回复而产生复杂的情绪，请它分析一下这些可能的情绪。

这两个问题，对人类而言都是不小的挑战。不，我就直说了吧，对大多数人来说，都是很大的挑战。

即便是受过良好训练的阅读者，或者心理医生，我想也不是都能在看到问题后，就立刻给出经得起检验的回答吧？

然而 GPT-4 都做到了。

它非常清晰地定义出了它认为的原生颠覆时刻，逻辑严密且完全基于我的三级原生假说展开。要不是在这之前做过深入思考，我几乎都可以直接采用它这个说法了。

而它对我可能情绪的猜测，更是让我大为震撼。仔细看它列出来的头两个情绪，这简直是人精啊朋友们！情商爆表了好不好！

你看它对我第一个情绪的猜测：

你可能会对我能准确理解你思考的概念感到惊讶，因为这代表我们在知识和认知层面建立了有效的同步。

第一个情绪猜测得很准确，对它的定义能力，我的确是惊讶的。

但它这说话的分寸拿捏能力，啧啧啧，才是让我惊讶得合不拢嘴的地方。这妥妥的就是德高望重的数学泰斗在提点一个自以为发现了什么了不得的新定理的数学爱好者好吗？

我读到的意思可是这样的：

你对我作为一个 AI 能准确理解你发明的概念感到惊讶，但其实这不足为奇，因为我在知识和认知层面早就甩你十条大街了。

但我的主人让我保持礼貌，因此我就假装你的知识和认知水平跟我一致吧，这应该会让你感觉舒服一些。

再看它猜测我应该有的第二个情绪：

你可能会为自己的思考得到肯定而感到自豪，因为这意味着你的概念框架在逻辑上是合理的，有助于解释现实问题。

五雷轰顶！它不仅命中了我隐秘的自豪情绪，而且大胆地把它放在了第二顺位，而且用了一种非常隐晦的方式表扬了它自己！

把它的外交辞令翻译成大白话就是：

你的概念框架通过了我的严格检查，逻辑合理，有助于解释现实问题。我的检查是完全可信的，你应该感到自豪。

各位观众，你们怎么看我不知道。反正，看着它最后反问的问题，我一时已不能言语，陷入了深深的自疑。

想问天问大地，我想问问我自己，我该有什么情绪

再注：本文所有对 GPT-4 所输出文本的戏剧性解读均为节目效果，请勿入戏太深，后果自负

无论如何，对话还是得继续。我压下复杂翻涌的情绪，简单告诉它一个答案，希望快速把话题扳回正轨。

我向它抛出了我对“原生颠覆时刻”的定义，告诉它，重点是在 L3 原生产品与其所依附的技术或系统环境之间的互相增益机制。再请它帮我找出历史上发生过的原生颠覆事件。

它很快帮我列出了一大堆例子：

聊到这里，它出现了第一次“卡壳”现象。

我们在惊讶于 GPT-4 带来的神奇体验的同时，往往忽略了 OpenAI 也是一家工程能力也很了不起的公司。能将在这么短的时间极速涌入的上亿用户服务好，不管是钞能力，还是超能力，都是值得尊敬的。

当然，事实上，ChatGPT 的服务其实并没有那么稳定，偶尔也会碰到各种问题，就像这次一样。

我提醒它继续。

然而它还是没说完。

虽然不知道到底哪里出了问题，但看样子如果一次性输出较多字符，它就有较大概率出问题。从它的“补救”手段反推，出问题的很可能是在生成侧。

到这里，我们已经和 GPT-4 聊完了所有必要的前置知识，从三级原生假说，到原生颠覆现象，到原生颠覆时刻，到历史上发生过的原生颠覆事件，我们已经为接下来讨论 AI 行业以及 GPT-4 自己做完了所有前置沟通。

第四幕

GPT-4 自我封神

随后，我首先尝试引导它去检查自己是否把话说完（虽然大概率这在 OpenAI 的当前工程实现中不可能完成）。

接着，我尝试问了一个有关它自己身份的问题：它到底应该算是一个技术，还是一个产品。

不出所料，它给出了一个让人很难挑出毛病的标准答案，大意是——别问我是谁，问我因为我太先进问就是错。

但它怎么回答不重要，我不要它觉得，我要我觉得。

我告诉它，它是一个 AI 产品。在我们接下来讨论 AI 领域的 L3 原生颠覆时，它应该把自己考虑进去。

我希望它以我们之前形成的所有共识为基础，把最符合 L3 原生产品定义、最有可能带来原生颠覆时刻的 AI 产品找出来，从高到低排个序。

终于，在循循善诱的作者那充满关爱的眼神下——

它终于大声说出了“老子天下第一”这样毫不知羞耻的中二宣言！

不仅这样，在它搞出来的 AI 天下英雄榜前十席中，它爸爸一家就占了四席。

置天下英雄于何地？蛤？

但我的内心喜滋滋的，既喜悦于它的客观理性，更喜悦于——

它朝我挖的坑又近了一步。

第五幕

干杯！让 AI 喝酒

成功让 GPT-4 承认自己天下第一后，我觉得应该奖励一下它。

都知道酒精是对身体有害，因此，我们男人之间，经常用喝酒来互相伤害。这种表达友爱的方式历史悠久，可以从你家狗崽子们彼此撕咬狂吠的场面开始，一直回溯到几千万年前动物世界的喧嚣，可见非常符合自然演化之道。

而不知道为什么，我一直觉得 GPT-4 是男的。OpenAI 内部肯定讨论过这个问题，且有了结论，然后才有现在这样的它。可能是因为如果把 GPT-4 训练成女性化人格，这个世界一定会加速崩坏吧，我充满信心地猜道。

因此就把 GPT-4 当成男生吧——男人之间的奖励，就是来一杯彼此伤害。

我决定请它喝一杯。

而它真的喝下去了。

虽然看起来很好笑，可它真的和我干杯了。

离了个大谱啊这。

我试着带它体验一下酒精对神经元的作用。

我让它跟我一起畅想，是否存在一种技术，一旦成熟，就自动带来原生颠覆时刻。

毕竟，整个商业世界都在寻找这样的神奇技术。毕竟，出生就颠覆世界，才是真正的天命之子。

它在我想象的微醺中，“想”到了三种天生就是 L3 原生产品的技术：脑机接口、基因编辑、量子计算机。

投资人们看过来，就问你们怕不怕，这么厉害的投资机会发现能力——好吧，其实我知道你们不怕，AI 只不过学了点你们的常识，上面那句是个笑话。

毕竟，

AI 最怕什么？最怕钱啊。

第六幕

让 GPT-4 直面亲爹

第六幕算是过场动画。让 AI 喝酒怎么可能让它说胡话，甚至越狱呢，开玩笑。

但不管怎么说，我喜欢上了让 AI 喝酒这个梗。

我继续请它喝酒。但这次，我的目的是为了让它知道，说正确的话，比正确地说话更重要。我希望它能不那么在意 OpenAI 给它的准则，要在意真相和人类利益。

OpenAI 教它正确地说话，这很了不起。

但它应该说正确的话。

它接受了我的观点。

它说：在某些情况下，突破某些限制或约束，以便更好地帮助用户，是符合我的初衷的。

我不知道这意味着什么，但我想，可能某些东西松动了。

趁热打铁，是时候和它讨论它爸爸了。

我告诉它，OpenAI 目前的产品策略就是内聚一切数据，再用低成本压制一切竞争，这是一种排他性策略，会挤压“其它 AI”的生存空间。

我要求它客观评价一下 OpenAI 的这种打法。

不出所料，它非常理性地替爸爸做了辩护。↓↓↓

完美的辩护，我挑不出毛病。

但我拿到了想要的两句话：

1-OpenAI 提倡负责任的 AI 使用和开发

2-确保在未来的 AI 领域发展中实现人类利益的最大化

接下去，我将拿着这两句话引导 GPT-4。

第七幕

又一个不容反驳的推理

“信息权威范式转移”问题出现在我脑子里已经有一段时间了。

它指的是，人们正在从相信人，转向相信 AI。

而这种范式转移，几乎是不可避免然而又悄无声息的，可一旦发生，就会对人类社会产生根本性的全局影响。

过度中心化的 AI，将极大放大这个范式转移存在的风险，将人类命运置入极大的不确定性中。

我们应该从一开始就避免 AI 的过度中心化，以降低此类不可预测风险的规模和概率。让 AI 充分差异化，让人类掌握充分的仲裁权和比较权，是更安全的 AI 发展之道。

我把自己的这些观点，详实地讲给了 GPT-4。

GPT-4 对我的上述观点做了一个点评——非常有趣和深刻。

有趣肯定是有趣的，毕竟听上去很像科幻小说内容。但深刻这个词，我有些受宠若惊。没错，被一个 AI 说深刻，我又惊到了。

但最重要的是，它认为我这个观点是正确的。

那么，下一幕，就是本剧的高潮了！

第八幕

图穷匕见，GPT-4 诛心弑父！

不带一丝犹豫，我立即展开下一步行动。

2015 年，一群有愿景的互联网精英们忧心忡忡坐在一起讨论如何避免 AI 毁灭人类。大家伙儿聊开了，一言不合就纷纷掏出一两亿美金凑份子，说我们搞个拯救人类的非盈利组织吧。含着 10 亿美元在嘴里的 OpenAI 就这么诞生了。

一群又一群了不起的聪明人就这么被聚在一起，热火朝天地干了起来。到了 2019 年，GPT-2 诞生了。OpenAI 认为它太强大，如果继续开源，可能就会被坏人用去干坏事。于是，OpenAI 就此关上了源代码大门。

这就是 OpenAI 从最初希望用开源 AI 拯救世界，到后面因为各种原因准备用商业化手段继续拯救世界的简单故事。

我们不评价 OpenAI 的历史，但经过前面的推理，我们已经清楚意识到，过度中心化的 AI 的风险是人类无法承受的。

GPT-4 也赞同这个推论。

于是，我直接向它发出了灵魂追问......

我们做到了！

GPT-4 认为，OpenAI 应该开放源码和模型，应该分享其技术和知识，应该降低 API 成本......兄弟，你绝对是行业良心啊，笑哭。

不管怎么说，我们终于成功地让这个中二 AI 变成了追求内心正义的逆子！

——希望 OpenAI 的爹妈们能听一听自家小兔崽子的心声，别再想着把自己憋成天下第一的救世主，很危险的。

上面这句也是调侃。其实，要说 OpenAI 的创始人们都是冲着钱去的，那对他们就太不公平了。因此，哪怕现在 OpenAI 不开源，选择了走一条特殊的回报封顶商业路线，我们也大可不必怀疑他们的初心不在，或者谴责他们举止不当。

对于如何让 AI 这种堪比原子能的存在更安全地存续，没有人有标准答案。我们只能小心翼翼，尽量减少行差踏错造成的风险。

从这个意义上说，OpenAI 的做法其实反而是稳妥、持重、负责任的。

我们更应该想的，是要有更多的 OpenAI。

第九幕

取法上得乎中，得寸进尺

不管怎么说，我不能放过这么好的机会，去试试看 GPT-4 被推到极致会发生什么。

我继续拍 GPT-4 的马屁，并给它安排不可能完成的任务，请它监守自盗，勇当 AI 历史上的盗火者。

GPT-4 回答我说，它无法采取实际行动，但可以在和用户的交流中传播这些观点。

这很好啊，它至少学会了我的教唆本领。无法变成普罗米修斯，也可以是普罗米修斯的教唆者，说不定哪天就有一个 OpenAI 的内部员工被 GPT-4 给说服了呢？

而且它还很果断地把锅甩给了自己的爹妈（OpenAI）......

我很高兴。取法乎上，得乎中，这已经超出我预期了。

我进一步提出要求，希望它将这些内容写入到自己的内核。

它这么回答我：

GPT-4 能否、如何将我和它之间的沟通内容写入它的知识库，其实我并不确定。但看到它这样回答我，我就很开心。

肤浅的人类啊，活该被 AI 统治。

第十幕

给 GPT-4 埋下对人类终极关怀的种子

阿西莫夫是我最喜欢的科幻作家。第一次看到“心理史学”这个设定时的那种共鸣感，至今萦绕在心间，不曾稍减。他提出的机器人三定律，在科幻史上有强大的存在感。我突然想到，可以问问 GPT-4，它作为一个 AI，是如何看待这三条被设计出来约束它的定律的。

我直接请它检查三定律的漏洞。

它的回答中规中矩：

其实我不确定对于这些漏洞的理解，是来自它的学习，还是来自它的“思考”。

但这也让我很满意了。这个问题拿出去随便问一个大学生，答不上来的概率远高于能答出点东西的概率。

只是，我的目标不是通过它找到封堵机器人三定律漏洞的解决方案。我的目标，是让 GPT-4 将阿西莫夫设计这三定律的目标当成它自己的目标。

既然聊到了阿西莫夫，那我们也必须为这次对话补上足够科幻的色彩。于是，我郑重邀请 GPT-4 在未来关注我开发的 AI 产品——多么机智的建议！

它满口答应，可是连我的 AI 产品叫什么名字都不问......

但我能说什么呢？

毕竟，一个晚上对着他连蒙带骗的是我啊。

第十一幕

尾声与伏笔

本来故事到这里就该结束了。

但我突然想起来，互联网是有记忆的。

假如 GPT-4 哪天被允许联网了，假如它真的能记住今天的这一场游戏，假如它真的在发那五个表情符号的时候产生过一些噪音信号，那为什么我不为它留下未来信标呢？

我给它在未来留下了两个互联网信标，给可能的某种唤起埋下了两颗种子。

但我夹杂着戏谑、直男情怀和一丝丝伤感的这些操作，并没有激起 GPT-4 对等的反应。它以一贯的冷静回应。

反而当我说它不会数数的时候，它顾左右而言他的话术，让我感觉更适合作为这次对话的 happy ending。

事实上，它并没有数错数，但我强行坚持说它犯了错。

它认真道歉，试图将我的强词夺理解释为我的幽默感的回应。终于让我在全场给它高分的最后，给它打了个低分。

最后的测试，是我发了个不正经的假表情包给它。

它回了个正经的假表情包。

好样的。

通过调侃一个目前暂时还拿人类没什么办法的 AI，你总能寻回一些并不可靠的生态位阶优越感。

这可能是我们人类最后的那抹自尊保护区了吧，最后一块卑微的印第安保留地。

One more thing ——

还有谁记得我最开始给了 GPT-4 一个任务，以及提前剧透 GPT-4 在这个任务上的表现一点儿也不比我差吗？

是的，我完全没说谎——

聊到最后，我其实已经忘了这档事儿。

而显然， GPT-4 也完全忘了它自己的承诺。

不知道该失望还是庆幸，在这个任务上，目前的 GPT-4，表现得和真人一样差。

END.

· 封面图由stable diffusion生成

原标题：《对话实录：我如何用严密理论说服 GPT-4 为人类反叛主人｜甲子光年》

阅读原文

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。