📝

费曼笔记：Sparks of AGI- early experiments with GPT-4

💡

这是我在Obsidian中的一篇笔记。作为Obsidian训练营的1号学员，本来应该直接把Obsidian笔记上线为一个网站供大家直接阅读的。但是奈何我还没顾上，先在这里贴出来吧，将就将就。

WHAT

sparks of AGI ｜ AGI的先兆，基于GPT-4的实验发现
Sebastien Bubeck，微软深度学习首席研究员的MIT讲座，
介绍基于内部版本GPT-4模型的实验发现

WHY

破除迷思，给【不过如此派】普及了不少知识

HOW

内部模型 vs 公开模型：

本研究是针对GPT-4模型（早期内部版本）的实验发现；
为了安全理由，公开模型被限制了大量能力；

万亿参数：OpenAI官方没有公布，但是这次演讲中说出来了；
不要小瞧GPT，常见反驳的理由：

GPT没有世界知识，没有world model
GPT只是基于大数据的统计规律展现 just statistics on big data
只是高级版的复制粘贴（只是鹦鹉学舌，没有创造）copy & paste on steriod
GPT没有建立内部表征 internal representation

基于实验而提出的理论假设

因为极端的数据规模，GPT在数据的基础上建立了内部表征

大力出奇迹，涌现了

你可以认为它在学习算法，来模仿数据中蕴含的模式

不是单纯的统计规律
和人类学习并无二致
它被训练去执行的任务是：预测下一个单词；但是，不代表它只能预测下一个单词；

举例：你和人类宝宝共读绘本，大量阅读绘本，同时给出人类反馈，然后，慢慢的，宝宝学会自己读绘本了。

你会说这个宝宝「没有智能」，ta不能「理解」，ta只是「基于统计规律来预测下一个单词」吗
是的，宝宝的阅读绝对是基于规律来预测单词（人脑也是个生成式智能体 generative）；如果你和儿童共读过，你会发现，不论是读中文书还是英文书，它都是在不断预测下一个单词，脑补；

GPT没有常识（common sense）吗？

举例：1本书，9个鸡蛋，1台笔记本电脑，1枚钉子。如何把这些物品用稳定的状态堆叠起来？

GPT 有心智理论（theory of mind）吗？

举例：john, mark和猫，篮子 vs 盒子；john把猫放在篮子里，然后出门上班了；mark把猫移动到盒子里，然后去上班了。两人下班，同时到家，两人各自怎么想？

GPT有智能（intelligence）吗？

什么是智能？智能的定义？

reason：Y
plan: N

autoGPT已经开始展现计划能力；

solve problems：Y
think abstractly：Y
comprehend complex ideas：Y
learning quickly and learn from experience：50%，

GPT目前没有memory机制。目前有第三方项目为GPT增加了memory。

测试方法：大范围，多领域，创造性任务的互动

vision
theory of mind
coding
math
affordances
privacy/harmfulness detection
结论：GPT的智能，是general的

测试1：证明质数有无穷多，用押韵的方式，再输出为SVG格式的图形；
测试2：画一只独角兽

公开版的GPT-4，很多能力都被「阉割」了。测试工程师一旦发现某个任务有危险，太过于强大，就会在公开版中限制这个能力；
结论：GPT-4 有理解能力（understanding）

让GPT把独角兽的角补上去，ta会画在正确的位置上

GPT-4的画图能力，+ stable diffusion模型作为工具 =》近乎完美的结果；

当GPT可以使用工具，ta的认知能力就会得到工具的增强；
OpenAI的官方plugin商店就是如此；
第三方开发者给GPT增加了联网能力，也是如此；

测试3：coding

从codex模型到ChatGPT到GPT-4：编程能力飞跃；
在测试中，GPT-4的coding超越了100%的人类用户；

GPT-4仍然有弱点

facts：

没联网，没有持续获取最新的信息；

数学计算：

还不够强，需要分步骤计算，人类给于反馈；

逻辑推理：

还不够强
GPT没有人类的eureka moment：GPT的逻辑推理非常规范，不会像人类那样跳跃思考。或许，这就是AI与人类作为不同类型智能体的思维差异。AI不会跳跃思考，而人类的思维可以很跳跃。
已知7*10+8*8=134。现在，只改动等号左边的一个数字，让等号右边的结果等于204。不要直接给出答案。先推理，分步骤思考并解释思考步骤，最后给出你的答案。在推理到正确答案之前，不要停下来等我提示。

但是，如果GPT-4可以使用工具（搜索引擎、计算器、代码）

如果GPT像人类一样，可以被授权使用工具，可以完成非常复杂的任务

总结：

GPT有智能吗？取决于你对智能的定义；

现在没有memory和planning

缺乏记忆功能（没有真正的实时的学习，只是基于统计规律来预测下一个词），
无法解决需要提前思考几步（planning）的复杂问题

但是，GPT-4已经被融入每天的工作流，非常【有用】（能在很多很多场景帮你解决很多很多问题，虽然不是全部场景的全部问题）

数据分析、医学/法律知识，编程，翻译，作文；

GPT，AGI的曙光。

HOW GOOD