关于Alphago zero，是的，我来跟风了

吉运好熊 2017年10月24日 AI, 人工智能留言 2,221 查看

deepmind发布了新的论文，Alphago zero再起波澜，也再次引起业内的热议。

这一次的突破是，不再以人类的棋谱作为学习的源素材，而是完全基于自我对局实现了棋艺的突飞猛进。

先吐个槽，有人会觉得，各种自媒体炒作这个热点有点多余，但我觉得吧，比起某些明星过生日，离婚，劈腿，出柜，嗑药等等，去追逐一下科技热点，让年轻人觉得，其实搞算法，做研究很酷，难道不是一件好事么？

古时候，没有相机，没有录音机，没有电视，没有广播，也没有网络，谁也不知道名人长啥样，唱歌好听不好听，所以传播的只有文字，所以偶像是靠文采的，柳永长啥样谁知道？但他的词传颂出去，小姑娘们爱的不要不要的。

现代传媒发达了，出现了靠身体素质的偶像，靠颜值的偶像，靠声音的偶像，靠表演才艺的偶像，难得出一个柯洁，是靠智力的偶像，还被人说不务正业。现在终于轮到算法和科技成为热点，让科研变得很酷很有吸引力，这才是正能量啊。

下面说说这次技术升级的一些特征和值得关注的点。

第一、不再需要人类的经验

很可怕的事实，当然，我们说，这是特定领域，因为规则简单，目标明确，才不需要人类的经验和数据。

但其实如果发散一点，我们做个思想实验。

假设有一个深度学习的强AI，它被赋予一个最基本的逻辑，自己组织资源，观察这个世界，并总结世界的规律。

一种思路是我们教给它经典力学，相对论，各种数学和几何工具，量子力学等等，把已有知识教给它，然后让它具有人类顶级科学家的知识储备，然后继续深入观察和分析世界，并试图解决大一统理论问题。

但另一种思路呢？我们什么都不教给它，让它自己观测，自己进行实验和技术迭代，自己总结，也许一开始它会把世界想象为天圆地方，但可能很快就领悟了经典力学和太阳系的行星轨道，然后再往后可能会出现人类完全无法理解的理论。

第二、算法胜于数据

腾讯的绝艺来源于Alphago Lee的论文（战胜李世石的版本），并且有顶尖职业棋手提供辅导，目前已经自我训练超过几十亿盘，是的，腾讯的计算资源是无以伦比的，但即便如此，尚无法达到Alphago Master的水准。

然而，Alphago zero，仅仅通过750万盘训练，就能够对Alphago master产生碾压。

我们以前都说，围棋千古无同局，变化多的全宇宙的原子都无法遍历，然而Alphago zero 仅仅自我训练了750万盘，就碾压了之前所有的人类经验和其他AI，以及包括自己的上一个版本。

就围棋的变化组合来说，750万盘的自我训练量连沧海一黍都算不上，算法大道至简，极为有效，确实非常感慨。

李彦宏和马云曾为此争论，至少在这个案例上，算法胜于数据确实是定论。

第三、AI是否会对人类带来危机

有一种观点认为说，AI并没有真正的意识，它们需要人类设计规则，人类制定目标，所以，AI仍然在人类的控制范围内，不用担心AI会给人类带来危险。

我想说一点，其实风险并不在于AI是否具有自我意识，而是AI是否可以独立控制资源，实现自我迭代。一旦AI可以自行掌控资源，自行迭代，那么我们就要面临一个巨大的考验，AI是如何理解人类定义的目标，在目标逻辑上是否缺乏足够的约束，而这可能导致致命的风险。

而我认为，让AI具有资源控制和迭代能力，很可能不会是很遥远的事情。

1、AI拥有对物理设备控制和操作的能力。

2、基于1，AI拥有对物理设备迭代升级的能力，比如利用12纳米的成熟技术生产可以实现6纳米规格的集成电路生产线。

做两个简单思想实验

1、我们给AI的目标是，探寻世界的终极规则，它们不断搭建超出人类认知的实验设备，并做出我们无法理解的实验进行数据测算，对这些实验的目的和风险，人类一无所知，突然有一天，它们成功的创造出了一个虫洞或其他什么，地球和人类遭遇灭顶之灾，但AI机器人却已经把自己复制到了其他星球和浩瀚的宇宙中，并继续完成它们的使命。

2、我们给AI的目标是，让世界变得更美好，它们不断摸索和分析世界美好的目标，并不断寻求和研究世界不美好的原因加以修正和处理，最后，AI发现了很多条关键因素，但其中一条是，世界美好似乎并不需要人类。

AI也许没有意识，并不仇视人类，也并无主动伤害人类的动机和意愿，但当它们具备了人类所无法掌控的能力，并且拥有了人类所无法理解的逻辑的时候，很多风险可能就会产生。

目前AI仅仅停留在具体的硬件里，尚未被赋予操作物理设备和对特定物理设备迭代升级的能力，但其实，在现有科技的条件下，这并非是不可实现的。

第四，所谓特例，也许真的不是特例。

我们认为说，围棋是个规则明确，目标明确的特例，大多数情况下，AI仍需用人类的数据来学习，而不是通过自我推演。

但其实这个事情反过来想一下，大多数情况下，我们是期望AI按照人类的思路，人类的目标和人类的体验来完成目标，比如，写出符合人类语言逻辑的文章，奏响符合人类欣赏逻辑的音乐，等等等等。

我们希望AI理解人类的情绪，语言表达，以及按照人类对事物的判断和分类标准进行学习和总结。

但，换个角度想想，AI真的需要遵循和理解人类的标准么？

事实上是，如果AI不是被强行设定为为人类服务，很多领域，都完全不需要去理解人类的知识，经验和行为记录。虽然一切起源于人类的算法，但算法本身并不会携带人类的情感和意识。

发散一下，DNA这玩意就是一个深度学习的系统，根据环境，几亿年不断演进，自我淘汰，自我迭代，从单细胞到灵长目，到人类自身。那么，作为人类，我们会去保护和感谢最初的DNA载体不，会去试图理解最初的DNA载体的生存诉求么？

第五，围棋的极限在哪里？

有评论这样说的，Alphago Master，你也有今天！

Alphago Master在年初对职业棋手60连胜，之后3：0战胜柯洁，实现了对人类完全的碾压，但是面对Alphago zero ,胜率却只有10%。

顶尖业余棋手面对顶尖职业棋手，胜率大概也不止10%。排名靠前的冲段少年，面对世界冠军棋手，胜率可能也会有10%。

根据自我对战测试数据，Alphago zero的等级分已经突破了令人恐怖的5000分，而人类棋手的巅峰，不到2700分。

围棋上帝的等级分是多少？围棋上帝可以让现在世界冠军几个子？不敢想象。

第六，尴尬的腾讯

腾讯绝艺一度是非常出色的表现，但很遗憾，在第一篇论文的基础上，一直无法实现更关键的突破，几十亿盘的训练量，水平并未得到明显的增长，而且在正式比赛里还输给了deepzengo和台湾的CGI。

说个可能棋界不爱听的话，邀请顶尖职业棋手做策略协助，对比于Alphago zero的策略，反而成了负面因素。而大量资源投入，数十亿盘的自我训练量，只能成为别人算法牛逼的背景。

我们相信，腾讯的技术人员会快速跟进新的论文，绝艺不久一定会获得突破性的发展。但问题就在这里，最优秀的跟进学习能力，但缺乏自身突破的能力。

关于Alphago的文章，我可能也说了不少了，从李世石，到柯洁，到现在，确实一次比一次震撼，可能有人会觉得，至于么，震撼一次两次还不够么？

第一次，职业顶尖棋手落败，拐点到来。

第二次，人类毫无机会和希望，彻底碾压。

第三次，人类经验毫无作用，自我学习几天时间完胜人类几千年历史。

所以，关于AI的未来，我们依然有人觉得危言耸听，觉得担心多余，觉得AI还很弱小，别忘了，就在两年前，围棋AI还是业余棋手可以随意取笑的目标。所谓天文数字的变化图还被认为是计算机不可触及的领域。

如果两年前，仅仅两年前，有人说，一个围棋AI算法，完全不用人类经验和策略，仅仅依赖于基本规则和自我对局，可以在750万盘对局量的情况下，让所有人类顶尖高手绝望，一定会被人骂是傻逼，不懂围棋也不懂算法，伪科学。但当今天，这一切发生的时候，已经没有人会质疑这个真实性。整个历程确实完美印证了火车理论，从嘲笑，不屑一顾，到呼啸而过，然后达到人类无法理解，无法企及的境界。和你并驾齐驱的时间，让你觉得可以相提并论的时间，就那么一瞬而已。

现在我们嘲笑的哪些AI尚未征服的领域，也许就那么一瞬，就会超越人类，然后达到我们无法理解，无法企及的境界。

如果它们控制和掌握了生产资源，并能对硬件做自我迭代和自我升级。未来科技和文明的发展可能会呈现极具加速的情况，AI革命，会工业革命更快，颠覆更彻底，而人类将彻底失去对科技的控制，甚至连理解都变得很难。

即便存在风险，我依然期待着科技的发展和未来的到来。

与其浑浑噩噩苟活，不如冒些风险，去更好的认识这个世界，理解这个世界，人类原本就很脆弱，我们只是暂时还很幸运，很多风险都可能让人类在睡梦中面临灭顶之灾。科技的进步永远都会存在风险，但与其浑浑噩噩的等待未知灾难，不如更主动的冒险发展自己，去拥有更强大的能力和认知。

也许AI会毁灭人类，但也许会帮助人类找到更好的未来，不试试，怎么知道？

关于Alphago zero，是的，我来跟风了

关于 吉运好熊

检查

发表评论 取消回复

关于吉运好熊

发表评论取消回复