Yann LeCun提出自动机器智能,有望超越GPT-4

2023-03-29 网络 网络 发表于上海

最近,图灵奖得主 Yann LeCun 给一场辩论做了个特别的开场。LeCun认为,「从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。」。而他口中的自回归,正是当前爆红的 GPT 家族模型所

最近,图灵奖得主 Yann LeCun 给一场辩论做了个特别的开场。LeCun认为,「从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。」。而他口中的自回归,正是当前爆红的 GPT 家族模型所依赖的学习范式。

Yann LeCun 延续了他一贯的犀利风格,直言不讳地指出「Machine Learning sucks!」「Auto-Regressive Generative Models Suck!」最后话题自然是回到「世界模型」。

LeCun 一直在强调,与人和动物相比,当前的这些大型语言模型在学习方面是非常低效的:一个从没有开过车的青少年可以在 20 小时之内学会驾驶,但最好的自动驾驶系统却需要数百万或数十亿的标记数据,或在虚拟环境中进行数百万次强化学习试验。即使费这么大力,它们也无法获得像人类一样可靠的驾驶能力。

在 LeCun 看来,目前各种大模型是基于自回归算法的,而这类模型是没有前途的(Auto-Regressive LLMs are doomed)。因为它们虽然表现惊人,但很多问题难以解决,包括事实错误、逻辑错误、前后矛盾、推理有限、容易生成有害内容等。重要的是,这类模型并不了解这个世界底层的事实(underlying reality)。

图片

LeCun 提出了构建「世界」模型的想法,并在一篇题为《A path towards autonomous machine intelligence》的论文中进行了详细阐述。

具体来说,他想要构建一个能够进行推理和规划的认知架构。这个架构由 6 个独立的模块组成:

  • 配置器(Configurator)模块;

  • 感知模块(Perception module);

  • 世界模型(World model);

  • 成本模块(Cost module);

  • actor 模块;

  • 短期记忆模块(Short-term memory module)。

图片

 

Yann LeCun 还在 PPT 中阐述了之前论文里提到的一些细节。

图片

 

图片

 

图片

概率模型在连续域中是难以实现的,而生成式模型必须预测世界的每一个细节。

基于此,LeCun 给出了一种解决方案:联合嵌入预测架构(Joint-Embedding Predictive Architecture,JEPA)。

JEPA 不是生成式的,因为它不能轻易地用于从 x 预测 y。它仅捕获 x 和 y 之间的依赖关系,而不显式生成 y 的预测。

图片

 

通用 JEPA。

 如上图所示,在这种架构中,x 代表过去和当前观察到的,y 代表未来,a 代表 action,z 代表未知的潜在变量,D()代表预测成本,C()代表替代成本。JEPA 从代表过去和现在的 S_x 的表征中预测一个代表未来的 S_y 的表征。

图片

 

生成式架构会预测 y 的所有的细节,包括不相关的;而 JEPA 会预测 y 的抽象表征。

图片

 

 

图片

 

 

图片

在这种情况下,LeCun 认为有五种思路是需要「彻底抛弃」的:

  • 放弃生成式模型,支持联合嵌入架构;

  • 放弃自回归式生成;

  • 放弃概率模型,支持能量模型;

  • 放弃对比式方法,支持正则化方法;

  • 放弃强化学习,支持模型预测控制。

他的建议是,只有在计划不能产生预测结果时才使用 RL,以调整世界模型或 critic。

图片

 

 

迈向自主式 AI 系统的步骤都有哪些?LeCun 也给出了自己的想法:

 

1、自监督学习

 

  • 学习世界的表征

  • 学习世界的预测模型

 

2、处理预测中的不确定性

 

  • 联合嵌入的预测架构

  • 能量模型框架

 

3、从观察中学习世界模型

 

  • 像动物和人类婴儿一样?

 

4、推理和规划

 

  • 与基于梯度的学习兼容

  • 没有符号,没有逻辑→向量和连续函数

原始出处:

https://openreview.net/pdf?id=BZ5a1r-kVsf

https://mp.weixin.qq.com/s/m943KNGUzFqu62lAlyl5-A s机器之心

https://www.shaped.ai/blog/yann-lecun-a-path-towards-autonomous-machine-intelligence

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (0)
#插入话题

相关资讯

European Radiology:结合人工智能,提高术前CT图像恶性肺结节的诊断效率!

最近,基于人工智能(AI)的CT已经得到越来越多的关注。与人工CT评估相比,AI具有更高的准确性,在诊断任务中需要更少的人工干预。

这几天人工智能全面飞起来,惊呆一众!

“AI 的 「iPhone 时刻」已经到来”,在英伟达 GTC 2023 大会上,英伟达 CEO 黄仁勋把这个观点反复说了 3 遍。

AADOCR&CADR 2023:人工智能模型可通过口腔感染指标可预测心血管疾病

本研究表明,人工智能可以更好地预测心血管疾病。未来,随着人工智能的发展,临床上疾病风险预测将有很大的提升。

arXiv:80%的工作会受到GPT-4的影响,20%可能会被完全取代

这篇在arXiv网站预发布的论文得出结论认为,80%的美国劳动力至少有10%的任务会受到类似于GPT-4这样的大语言模型影响,此外有大约19%的美国员工被AI取代的可能性较高,意味着其至少50%的日常

European Radiology:乳腺癌DBT的人工智能筛查

现阶段,使用人工智能(AI)解释钼靶检查已显示出良好的效果,无论是作为阅读放射科医生的决策支持工具还是作为独立的阅读者来说都是如此。

有关人工智能的未来的调研

有关人工智能的未来的调研