📘 GPT学习宝典
  • 🐻 GPT助理
  • 🤯 Prompt大全
  • 🧰 GPT工具箱
  • 👩‍💻 学习资料
  • 📰 费曼日报
🔥 GPT训练营
📝

费曼笔记:Sparks of AGI- early experiments with GPT-4

💡
这是我在Obsidian中的一篇笔记。 作为Obsidian训练营的1号学员,本来应该直接把Obsidian笔记上线为一个网站供大家直接阅读的。但是奈何我还没顾上,先在这里贴出来吧,将就将就。

WHAT

  • sparks of AGI | AGI的先兆,基于GPT-4的实验发现
  • Sebastien Bubeck,微软深度学习首席研究员的MIT讲座,
  • 介绍基于内部版本GPT-4模型的实验发现

WHY

  • 破除迷思,给【不过如此派】普及了不少知识

HOW

  • 内部模型 vs 公开模型:
    • 本研究是针对GPT-4模型(早期内部版本)的实验发现;
    • 为了安全理由,公开模型被限制了大量能力;
  • 万亿参数:OpenAI官方没有公布,但是这次演讲中说出来了;
  • 不要小瞧GPT,常见反驳的理由:
    • GPT没有世界知识,没有world model
    • GPT只是基于大数据的统计规律展现 just statistics on big data
    • 只是高级版的复制粘贴(只是鹦鹉学舌,没有创造)copy & paste on steriod
    • GPT没有建立内部表征 internal representation
  • 基于实验而提出的理论假设
    • 因为极端的数据规模,GPT在数据的基础上建立了内部表征
      • 大力出奇迹,涌现了
    • 你可以认为它在学习算法,来模仿数据中蕴含的模式
      • 不是单纯的统计规律
      • 和人类学习并无二致
      • 它被训练去执行的任务是:预测下一个单词;但是,不代表它只能预测下一个单词;
    • 举例:你和人类宝宝共读绘本,大量阅读绘本,同时给出人类反馈,然后,慢慢的,宝宝学会自己读绘本了。
      • 你会说这个宝宝「没有智能」,ta不能「理解」,ta只是「基于统计规律来预测下一个单词」吗
      • 是的,宝宝的阅读绝对是基于规律来预测单词(人脑也是个生成式智能体 generative);如果你和儿童共读过,你会发现,不论是读中文书还是英文书,它都是在不断预测下一个单词,脑补;
  • GPT没有常识(common sense)吗?
    • 举例:1本书,9个鸡蛋,1台笔记本电脑,1枚钉子。如何把这些物品用稳定的状态堆叠起来?
  • GPT 有心智理论(theory of mind)吗?
    • 举例:john, mark和猫,篮子 vs 盒子;john把猫放在篮子里,然后出门上班了;mark把猫移动到盒子里,然后去上班了。两人下班,同时到家,两人各自怎么想?
  • GPT有智能(intelligence)吗?
    • 什么是智能?智能的定义?
      • reason:Y
      • plan: N
        • autoGPT已经开始展现计划能力;
      • solve problems:Y
      • think abstractly:Y
      • comprehend complex ideas:Y
      • learning quickly and learn from experience:50%,
        • GPT目前没有memory机制。目前有第三方项目为GPT增加了memory。
    • 测试方法:大范围,多领域,创造性任务的互动
      • vision
      • theory of mind
      • coding
      • math
      • affordances
      • privacy/harmfulness detection
      • 结论:GPT的智能,是general的
    • 测试1:证明质数有无穷多,用押韵的方式,再输出为SVG格式的图形;
    • 测试2:画一只独角兽
      • 公开版的GPT-4,很多能力都被「阉割」了。测试工程师一旦发现某个任务有危险,太过于强大,就会在公开版中限制这个能力;
      • 结论:GPT-4 有理解能力(understanding)
        • 让GPT把独角兽的角补上去,ta会画在正确的位置上
      • GPT-4的画图能力,+ stable diffusion模型作为工具 =》近乎完美的结果;
        • 当GPT可以使用工具,ta的认知能力就会得到工具的增强;
        • OpenAI的官方plugin商店就是如此;
        • 第三方开发者给GPT增加了联网能力,也是如此;
    • 测试3:coding
      • 从codex模型到ChatGPT到GPT-4:编程能力飞跃;
      • 在测试中,GPT-4的coding超越了100%的人类用户;
  • GPT-4仍然有弱点
    • facts:
      • 没联网,没有持续获取最新的信息;
    • 数学计算:
      • 还不够强,需要分步骤计算,人类给于反馈;
    • 逻辑推理:
      • 还不够强
      • GPT没有人类的eureka moment:GPT的逻辑推理非常规范,不会像人类那样跳跃思考。或许,这就是AI与人类作为不同类型智能体的思维差异。AI不会跳跃思考,而人类的思维可以很跳跃。
      • 已知7*10+8*8=134。现在,只改动等号左边的一个数字,让等号右边的结果等于204。不要直接给出答案。先推理,分步骤思考并解释思考步骤,最后给出你的答案。在推理到正确答案之前,不要停下来等我提示。
    • 但是,如果GPT-4可以使用工具(搜索引擎、计算器、代码)
      • 如果GPT像人类一样,可以被授权使用工具,可以完成非常复杂的任务
  • 总结:
    • GPT有智能吗?取决于你对智能的定义;
      • 现在没有memory和planning
        • 缺乏记忆功能(没有真正的实时的学习,只是基于统计规律来预测下一个词),
        • 无法解决需要提前思考几步(planning)的复杂问题
    • 但是,GPT-4已经被融入每天的工作流,非常【有用】(能在很多很多场景帮你解决很多很多问题,虽然不是全部场景的全部问题)
      • 数据分析、医学/法律知识,编程,翻译,作文;
    • GPT,AGI的曙光。

HOW GOOD

Logo

serious, patient, unbreakable

ⓒ candobear life-learning community, 2023

WeChatX