Altman:憋了个大招,但我不能说!
2024/11/05

 “营销鬼才”、OpenAI首席执行官Sam Altman又狠狠吊了一下大家的胃口。


本周在知名创投播客Harry Stebbings主持的活动中,Altman在展望AGI愿景时,单单用一句话就调动起了大家的情绪——“太棒了我不能说”:


我一直在想,有没有一种AI能够理解你的整个生活。


它不一定要拥有无限的上下文,但至少应该有某种方式让AI能够全面了解你,能够访问你所有的数据。


当主持人问他最近一个令他感到震惊的成果是什么?他留下悬念:


这个研究结果我无法透露,但它的效果简直令人叹为观止。


他还对自身的职业方向充满信心,认为自己“不祈求上帝,但是上帝与我同在”、“最终似乎总会走向成功”:


我们这里有很多人都对构建AGI充满激情,这种动力让人振奋,当然没有人认为这会是一条轻松且顺利的道路。


不过有句名言:我从不祈求上帝站在我这一边,而是祈求自己站在上帝这一边。


在深度学习的领域,这种感觉就像是站在天使一方,尽管过程中会遇到许多障碍,但最终似乎总会走向成功。因此,深信这一点令我们受益良多。


然而考虑到在“画大饼”这条道路上,即便是和马斯克相比,Altman也是不相上下,非常善于整活玩猜字谜,所以“一个能够全面了解用户生活的AI”真能在近期实现吗?


举个例子,他最近刚刚成功收割了一波流量。当时他发了一条神秘消息: “我听说o2在GPQA的性能测试达到105%”。




但就有网友指出,博士级人类在GPQA的准确率平均只有65%,非专家级的普通人仅有34%。而OpenAI在9月发布的o1模型的测试数据也只有78%,这也是目前唯一在GPQA数据集上超过人类博士的AI模型,可见这个数据集的难度有多高。


而且怎么会出现恐怖的105%,这完全就是不可能的事情,MMLU、MaTH、CPQA、GSM8K、GPQA等基准测试范围怎么可能超出100%呢?


随后Sam Altman自己也发现这个错误,连发两条推文:要命啊,账号错误了......




Altman已经掌握了流量密码,吃瓜群众们感到很无奈......

 分享: