星期六 , 4月 19 2025

iNews新知科技关注科技，自有新知

推荐内容

首页 / 新知快讯 / 24H看点 / 被AlphaGo击败的李世石，用8年重建崩塌的世界

被AlphaGo击败的李世石，用8年重建崩塌的世界

声波 2024年7月21日 24H看点, 新知快讯留言 321 查看

输给AI，有种感觉是，我整个世界都塌了。

李世石在最近接受《纽约时报》采访时说道。

2016年，这位曾14次获世界冠军的韩国棋士代表人类出战Google的AlphaGo，最终以1:4告败。

他当初在接受邀请时，觉得那会是一次“好玩”的经历：

好玩的前提是我觉得会赢。我从未想过自己会输。

那可能是AI技术在ChatGPT登场前，其中一个最重要的高光时刻。

现在离ChatGPT的发布过去了不足两年，我们已看到多个领域被AI影响，而生活更多方面似乎也被埋下了改变的伏笔，我们总忍不住想要去推测和畅想未来的AI。

也许，比其他领域更早受到AI冲击的围棋界，能帮助我们看到一种已经发生的可能性。

击败人类后，AI在进一步去“人味”

我没有办法再去享受围棋，所以我就退役了。

和AlphaGo对战的三年后，李世石正式宣布退役。

对于5岁就开始学围棋的李世石而言，围棋不仅是竞赛，而是一种艺术，一种棋手个性和风格的延伸，但在AI时代，它却“沦为”了算法的效率游戏。

在这三年间，其实还发生了另一件事。

2017年，DeepMind宣布了新版的AlphaGo——AlphaGo Zero。

AlphaGo诞生自神经网络对人类高手3000多万手数的学习和自我练习，但AlphaGo Zero却是从一开始就脱离“人味”，训练期间不接触任何人类棋谱，单纯靠自己和自己下棋训练。

只用了三天，AlphaGo Zero在迎战AlphaGo时就已经以100:0取胜。

《大西洋月刊》称其为“不需要从人类身上学习任何东西的AI”。

在围棋中，有一种手法看起来简单或无关紧要，但长远却能造成致命威胁，有人会说那就像是“幽灵”般。

而AlphaGo和AlphaGo Zero的棋谱，却难以理解到直接被视为“外星文明投下的一本神秘指南”。

美国职业棋手Michael Redmond于2017年表示，人类学习围棋其中一个重要的手段是搭建一个故事：“那是我们沟通的方式。它是一件非常人性的事。”

这也许也呼应了李世石的观点，在下棋时，棋手也展现了他们作为人的一部分。

Redmond补充说，据他自己的观察，人类棋手初见“AI味”棋路时很可能直接“举手投降”：

AlphaGo下棋的方式，总让人觉得很“非人性”，面对这样的棋局，我们甚至很难投入其中。

李世石作为其中一位最早经受到冲击的围棋高手，久久不能释怀。

他开始执迷于AI。

退役后，除了开设自己的围棋学院、出书和推出基于围棋的桌游外，李世石还开始做关于AI的演讲：

我算是很早开始面对AI的问题，其他人也将会经历。那未必会有开心大团圆结局。

对于他来说，AI最让人担心的地方在于，它可能会改变人类的价值观：

过去，人们会对创造力、原创性和创新充满敬畏，但自从AI出现以来，这些很多都已经消失了。

并不是所有人都同意这个讲法。

人机共创这些年

AI毁灭了围棋圈所有存在的秩序，然后开始重建。

在康奈尔大学研究人工智能的围棋爱好者Jiuheng He说道。

在很多围棋学院里，用AI来学习围棋已经几乎是所有棋手都要经历的过程。

在香港一家围棋学院里，Ng Chee Man会为学生提供iPad来用AI学习围棋。

每次到学生下棋，AI都会展示出“最佳走法”建议，同时，系统也会记录下学生哪些步下得好，哪些不好。

去年，在《美国国家科学院院刊》上刊登的一篇研究指出，自从AI进入围棋圈后，人类棋手的判断能力获得了提升。

早在2016年，在AlphaGo打败李世石前，曾在不公开测试中对决AlphaGo的樊麾也有过类似经历。

虽然落败，但樊麾说AlphaGo让以他一种全新的方式去看待围棋，提升他的技巧，让他的世界排名快速跃升。

2023年的研究则以1950年至2021年积累的棋谱为基础，包含了580万手数的数据。

研究人员发现，在AlphaGo击败李世石前，人类棋手的判断质量在66年中都保持平稳，基本不变，但在2016、2017期间，棋手的判断质量开始爬升。

换言之，人类棋手虽然未必能击败AI棋手，但他们的判断能力的确有所提升。

看到人类棋手能如此快速地适应，将这些新走法融入自己的方法中正式让人非常振奋。

这些结果表明，人类将适应这些发现，并在它们基础上大大地提升自身潜力。

DeepMind首席研究科学家、AlphaGo项目负责人David Silver对这个研究评论道。

曾被AlphaGo于2017年击败的柯洁，也曾于2023年表示自己除了比赛外，已经很少和真人练习了，并认为AI甚至已经成为了围棋创造力的源头：

创造性不是你随便做一件什么不同的事情，创造性必须投入实战并得到检验，现在围棋创新的大部分是AI来完成，我们想下一些和以前不一样的棋，大概率会输，因为AI通过大量实战，得出和之前不同的思维，这才是创造力。

除此以外，另一位职业棋手的表现也尤其引人关注。

韩国棋手申真谞是首位夺得世界冠军的00后棋手，常被棋迷称为“申工智能”，因为他正是通过长时间进行AI训练和研究著称。

今年2月，申真谞于25届农心杯击败中国主将辜梓豪，实现了单赛季六连胜，跨赛季16连胜，超越了其前辈李昌镐。今年3月，他谈论了自己和AI的关系：

我觉得我和AI现在是朋友关系。

我和比我更优秀的AI一起学习。

AI和人类的思路是完全不同的，AI通过数学算法解决问题，借鉴AI的思路使我受益良多。

现在，中国、韩国、日本的职业选手，都会用AI来训练。

“AI味”启示录

正如在生成式AI时代下，一些设计师和作者需要因为作品中包含的所谓“AI味”而进行繁复的自证，在融入AI已久的围棋界也一直在面对“AI味”衍生出来的各种议题。

在现时围棋比赛中，常常都会配有AI推测胜率和AI推荐最好的走法。观众在观赛过程中也因此能获得一种“主动性”，拥有多个观赛的角度。

2022年，中国棋手李轩豪在对决申真谞过程中，很多决策都和AI最优判断预测前三符合，因此被队友杨鼎新质疑其有用AI作弊之疑。

生于95年的李轩豪在用AI训练上“朝九晚九，全年无休，确实很用功”，因此棋路有时会被视作有所谓的“机器味”。

对于质疑，中国围棋协会进行了调查，最终认定这一指控没有证据，杨鼎新作出了处罚。

但用AI作弊的情况也的确存在。

2020年，韩国13岁的职业棋手金恩持被发现在线上比赛中的落子与AI推荐有高达92%的重合。经过调查后，最终认定其作弊（且本人也承认了），被罚禁赛一年。

2022年，中国棋手刘睿智被判定AI作弊，是中国首次正式因AI作弊而被处罚的职业棋手。和金恩持相比，刘睿智已经懂得规避“AI味”，只是在一些关键点用了AI。

为了应对，各国的比赛也是在不断改进反AI作弊机制。

与此同时，也有人利用了“AI味”来击败AI。

2023年，美国业余棋手Kellin Pelrine击败了围棋AI KataGo。

KataGo是现有开源最强围棋AI之一，韩国也会用它来训练棋手。

Pelrine利用了名为FAR AI的程序和KataGo对决了超过100万局，最后FAR AI找到了KataGo的弱点，并在人机对决中践行且获胜了：

那个策略算不上小儿科，但也不是特别难学。

然后，他也用同样的方法击败了另一个比较厉害的围棋AI Leela Zero。

策略关键在于要创造一个大的“圈”来围住对手一组棋，然后可以突然把一子下到另一个不相关的角落，去干扰AI。

Pelrine说，如果是人类棋手，看到那个圈肯定就知道有问题，但AI并不会留意到。

这个弱点看起来有点“取巧”，是不是让AI去进行针对性地训练就能打上补丁？

《自然》上周一篇报道援引了今年一篇预印本论文指出，面对专门找AI弱点的程序，模型的漏洞并非想象中容易修复。

这次被“针对”的还是KataGo。研究人员用三种不同的策略来让KataGo反击能力更强：

让KataGo通过自我对弈学习如何应对攻击；

迭代训练，用攻击程序攻击KataGo，把漏洞反馈给KataGo，让它通过自我对弈或其他方式学习应对，然后再用攻击程序攻击KataGo，往复循环；

从头开始训练一个新的围棋AI系统，采用不同的神经网络模型。

虽然这些训练在一定程度上帮助了KataGo提高防御能力，但攻击程序依旧能发现漏洞，分别以91%、81%和78%的胜率击败KataGo。

这些攻击程序本身不是出色的围棋AI，人类也能轻松击败。

当然，这里的关键不是去比拼到底是人类厉害还是AI厉害。

重点是，对于围棋这个AI曾“颠覆”的领域，并且经过那么多年的应用与改进，其AI依旧存在很多问题。论文作者Adam Gleave说道：

如果我们在像围棋这种单一领域里也没法解决这个问题，那在短期里，想在ChatGPT之类模型修复越狱的可能性似乎很小。

关于声波

发现不同的声音

检查

从黄仁勋再次到访说起

时隔三个月，黄仁勋再次到访北京 …

发表评论取消回复