“打破10年算法封印”的DeepMind,被GPT-4整尴尬了

微科技 20230610

  • 人工智能
  • 强化学习
  • 排序算法

本文来自微信公众号:量子位 (ID:QbitAI),作者:明敏,原文标题:《GPT-4把DeepMind整尴尬了:你登上Nature的排序优化算法,我两段话就找出来了》,头图来自:unsplash


DeepMind新AI登上Nature才一天,GPT-4就来打擂台了!


只通过两段提示,GPT-4就给出了和AlphaDev如出一辙的排序算法优化方法。



而AlphaDev被DeepMind称作是“重现AlphaGo神来之笔”,发现了提速70%的排序算法。


这下AlphaDev更尴尬了。


让GPT-4“发现”同样操作的老哥直接阴阳:


完全不需要强化学习啊。我能将这个发现登在Nature上吗?



马斯克“路过看到”,也留下了句“因吹斯听”。



所以GPT-4怎么做到的?


2段提示就搞定


带来这个新发现的是一位来自威斯康星大学麦迪逊分校的副教授,名叫Dimitris Papailiopoulos(下面简称D教授)。


他让GPT-4实现这一操作的步骤非常简单,一共就输入了两次提示。


首先,他和GPT-4说:


这有一段排序算法,我觉得它还能进一步优化。你能不能在下面几行,用*注明哪些指令可以删除或者改进?如果不需要修改,就什么都不动。一步一步解释原因,然后回去验证它是对的。



第一步的时候他还强调说,如果有什么新发现,先不要做改变,只是“看着”就好,写出来一些书面改进建议。


要非常详细、非常小心。


然后GPT-4对给出的代码做出了详细解释。



然后D教授给了第二条提示:


继续。如果你有很大的把握,按照上面的提示去做。Temperatur=0(让生成结果确定且一致),尽量避免混淆。



然后GPT-4给出了详细的步骤,最后总结说:


我们发现指令“mov S P”多余可以去掉,其他指令都是必需的。但在删除之后,应将P替换成S。



对比DeepMind新工作AlphaDev在处理同样问题上的思路,不能说毫无关系,只能说一模一样:



DeepMind方面对AlphaDev这通操作,让人想起当年AlphaGo的“第37步”——一种违反直觉的下法却直接击败传奇围棋选手李世石,让观众全都震惊不已。


同样,AlphaDev则是通过交换和复制移动,跳过了一个步骤,以一种看似错误但实际上是捷径的方式达成目标。


据介绍,AlphaDev是一种强化学习算法、基于AlphaZero打造,它的发现并非基于现有算法,而是从最底层的汇编指令开始摸索的。


它的创新主要在于两种指令序列:


(1)AlphaDev Swap Move(交换移动)


(2)AlphaDev Copy Move(复制移动)


原理上,DeepMind的研究员给它设计了一种单人“组装”游戏:


只要能够搜索并选择出合适的指令(下图A流程),正确且快速地排好数据(下图B流程),就能获得奖励。



但这个游戏的挑战不仅在于搜索空间的大小(可组合指令数相当于宇宙中的粒子数),也在于奖励函数的性质,因为一条错误指令就可能会使整个算法失效。


网友:我们总是低估GPT-4的能力


对于GPT-4的“骚操作”,有人表示:即便是资深开发者也低估GPT-4了。



有人感慨说,D教授的操作进一步验证,只要有耐心、懂提示工程,GPT-4能做到的事还有很多。



也有人提出质疑,表示GPT-4能这么做会不会是因为它的训练数据中包含了一些排序算法的优化方法?



不过话说回来,之所以这件事能够引起这么大的关注和讨论,很大一部分原因是AlphaDev登上Nature存在争议。


不少人觉得这也不是什么开创性的研究,DeepMind夸大其词。



不仅是D教授阴阳说“我是不是也能登Nature”,还有网友说自己十几岁的时候优化了快排,这也应该发论文的。


当然也有人认为,AlphaDev本身的创新点更在于,它是利用强化学习来发现新算法的。



你觉得呢?


参考链接:

[1]https://chat.openai.com/share/95693df4-36cd-4241-9cae-2173e8fb760c

[2]https://twitter.com/DimitrisPapail/status/1666843952824168465


本文来自微信公众号:量子位 (ID:QbitAI),作者:明敏

查看全文

点赞

微科技

作者最近更新

  • 拉压力传感器的高精度和高可靠性是如何实现的?
    微科技
    02-14 15:47
  • 传感器仪表选购要点:精确测量,从选择开始
    微科技
    2024-11-28
  • 位置传感器的类型和用途是什么
    微科技
    2024-11-11

期刊订阅

相关推荐

  • 传感器应该推进人工智能实现整体进化

    2018-12-07

  • 华为首款AI音箱:可通过HiLink开放协议控制19个家电品类

    2020-02-21

  • 本田将在CES展出自动驾驶作业车和机器人新品

    2018-12-14

  • 日本新研究:人工智能或能提前一周预测台风

    2019-01-08

评论0条评论

×
私信给微科技

点击打开传感搜小程序 - 速览海量产品,精准对接供需

  • 收藏

  • 评论

  • 点赞

  • 分享

收藏文章×

已选择0个收藏夹

新建收藏夹
完成
创建收藏夹 ×
取消 保存

1.点击右上角

2.分享到“朋友圈”或“发送给好友”

×

微信扫一扫,分享到朋友圈

推荐使用浏览器内置分享功能

×

关注微信订阅号

关注微信订阅号,了解更多传感器动态

  • #{faceHtml}

    #{user_name}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 查看评论 回复

    共#{comment_count}条评论

    加载更多

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} #{reback} 回复

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 回复

  • 关闭
      广告