Altman神秘预告：憋大招但保密，全面理解生活的AI何时来？



Altman：憋了个大招，但我不能说！

2024/11/05

“营销鬼才”、OpenAI首席执行官Sam Altman又狠狠吊了一下大家的胃口。

本周在知名创投播客Harry Stebbings主持的活动中，Altman在展望AGI愿景时，单单用一句话就调动起了大家的情绪——“太棒了我不能说”：

我一直在想，有没有一种AI能够理解你的整个生活。

它不一定要拥有无限的上下文，但至少应该有某种方式让AI能够全面了解你，能够访问你所有的数据。

当主持人问他最近一个令他感到震惊的成果是什么？他留下悬念：

这个研究结果我无法透露，但它的效果简直令人叹为观止。

他还对自身的职业方向充满信心，认为自己“不祈求上帝，但是上帝与我同在”、“最终似乎总会走向成功”：

我们这里有很多人都对构建AGI充满激情，这种动力让人振奋，当然没有人认为这会是一条轻松且顺利的道路。

不过有句名言：我从不祈求上帝站在我这一边，而是祈求自己站在上帝这一边。

在深度学习的领域，这种感觉就像是站在天使一方，尽管过程中会遇到许多障碍，但最终似乎总会走向成功。因此，深信这一点令我们受益良多。

然而考虑到在“画大饼”这条道路上，即便是和马斯克相比，Altman也是不相上下，非常善于整活玩猜字谜，所以“一个能够全面了解用户生活的AI”真能在近期实现吗？

举个例子，他最近刚刚成功收割了一波流量。当时他发了一条神秘消息： “我听说o2在GPQA的性能测试达到105%”。

但就有网友指出，博士级人类在GPQA的准确率平均只有65%，非专家级的普通人仅有34%。而OpenAI在9月发布的o1模型的测试数据也只有78%，这也是目前唯一在GPQA数据集上超过人类博士的AI模型，可见这个数据集的难度有多高。

而且怎么会出现恐怖的105%，这完全就是不可能的事情，MMLU、MaTH、CPQA、GSM8K、GPQA等基准测试范围怎么可能超出100%呢？

随后Sam Altman自己也发现这个错误，连发两条推文：要命啊，账号错误了......

Altman已经掌握了流量密码，吃瓜群众们感到很无奈......

