星期日 , 9月 8 2024
首页 / 新知快讯 / 24H看点 / 被AlphaGo击败的李世石,用8年重建崩塌的世界

被AlphaGo击败的李世石,用8年重建崩塌的世界

输给AI,有种感觉是,我整个世界都塌了。

李世石在最近接受《纽约时报》采访时说道。

2016年,这位曾14次获世界冠军的韩国棋士代表人类出战Google的AlphaGo,最终以1:4告败。

他当初在接受邀请时,觉得那会是一次“好玩”的经历:

好玩的前提是我觉得会赢。我从未想过自己会输。

那可能是AI技术在ChatGPT登场前,其中一个最重要的高光时刻。

现在离ChatGPT的发布过去了不足两年,我们已看到多个领域被AI影响,而生活更多方面似乎也被埋下了改变的伏笔,我们总忍不住想要去推测和畅想未来的AI。

也许,比其他领域更早受到AI冲击的围棋界,能帮助我们看到一种已经发生的可能性。

击败人类后,AI在进一步去“人味”

我没有办法再去享受围棋,所以我就退役了。

和AlphaGo对战的三年后,李世石正式宣布退役。

对于5岁就开始学围棋的李世石而言,围棋不仅是竞赛,而是一种艺术,一种棋手个性和风格的延伸,但在AI时代,它却“沦为”了算法的效率游戏。

在这三年间,其实还发生了另一件事。

2017年,DeepMind宣布了新版的AlphaGo——AlphaGo Zero。

AlphaGo诞生自神经网络对人类高手3000多万手数的学习和自我练习,但AlphaGo Zero却是从一开始就脱离“人味”,训练期间不接触任何人类棋谱,单纯靠自己和自己下棋训练。

只用了三天,AlphaGo Zero在迎战AlphaGo时就已经以100:0取胜。

《大西洋月刊》称其为“不需要从人类身上学习任何东西的AI”。

在围棋中,有一种手法看起来简单或无关紧要,但长远却能造成致命威胁,有人会说那就像是“幽灵”般。

而AlphaGo和AlphaGo Zero的棋谱,却难以理解到直接被视为“外星文明投下的一本神秘指南”。

美国职业棋手Michael Redmond于2017年表示,人类学习围棋其中一个重要的手段是搭建一个故事:“那是我们沟通的方式。它是一件非常人性的事。”

这也许也呼应了李世石的观点,在下棋时,棋手也展现了他们作为人的一部分。

Redmond补充说,据他自己的观察,人类棋手初见“AI味”棋路时很可能直接“举手投降”:

AlphaGo下棋的方式,总让人觉得很“非人性”,面对这样的棋局,我们甚至很难投入其中。

李世石作为其中一位最早经受到冲击的围棋高手,久久不能释怀。

他开始执迷于AI。

退役后,除了开设自己的围棋学院、出书和推出基于围棋的桌游外,李世石还开始做关于AI的演讲:

我算是很早开始面对AI的问题,其他人也将会经历。那未必会有开心大团圆结局。

对于他来说,AI最让人担心的地方在于,它可能会改变人类的价值观:

过去,人们会对创造力、原创性和创新充满敬畏,但自从AI出现以来,这些很多都已经消失了。

并不是所有人都同意这个讲法。

人机共创这些年

AI毁灭了围棋圈所有存在的秩序,然后开始重建。

在康奈尔大学研究人工智能的围棋爱好者Jiuheng He说道。

在很多围棋学院里,用AI来学习围棋已经几乎是所有棋手都要经历的过程。

在香港一家围棋学院里,Ng Chee Man会为学生提供iPad来用AI学习围棋。

每次到学生下棋,AI都会展示出“最佳走法”建议,同时,系统也会记录下学生哪些步下得好,哪些不好。

去年,在《美国国家科学院院刊》上刊登的一篇研究指出,自从AI进入围棋圈后,人类棋手的判断能力获得了提升。

早在2016年,在AlphaGo打败李世石前,曾在不公开测试中对决AlphaGo的樊麾也有过类似经历。

虽然落败,但樊麾说AlphaGo让以他一种全新的方式去看待围棋,提升他的技巧,让他的世界排名快速跃升。

2023年的研究则以1950年至2021年积累的棋谱为基础,包含了580万手数的数据。

研究人员发现,在AlphaGo击败李世石前,人类棋手的判断质量在66年中都保持平稳,基本不变,但在2016、2017期间,棋手的判断质量开始爬升。

换言之,人类棋手虽然未必能击败AI棋手,但他们的判断能力的确有所提升。

看到人类棋手能如此快速地适应,将这些新走法融入自己的方法中正式让人非常振奋。

这些结果表明,人类将适应这些发现,并在它们基础上大大地提升自身潜力。

DeepMind首席研究科学家、AlphaGo项目负责人David Silver对这个研究评论道。

曾被AlphaGo于2017年击败的柯洁,也曾于2023年表示自己除了比赛外,已经很少和真人练习了,并认为AI甚至已经成为了围棋创造力的源头:

创造性不是你随便做一件什么不同的事情,创造性必须投入实战并得到检验,现在围棋创新的大部分是AI来完成,我们想下一些和以前不一样的棋,大概率会输,因为AI通过大量实战,得出和之前不同的思维,这才是创造力。

除此以外,另一位职业棋手的表现也尤其引人关注。

韩国棋手申真谞是首位夺得世界冠军的00后棋手,常被棋迷称为“申工智能”,因为他正是通过长时间进行AI训练和研究著称。

今年2月,申真谞于25届农心杯击败中国主将辜梓豪,实现了单赛季六连胜,跨赛季16连胜,超越了其前辈李昌镐。今年3月,他谈论了自己和AI的关系:

我觉得我和AI现在是朋友关系。

我和比我更优秀的AI一起学习。

AI和人类的思路是完全不同的,AI通过数学算法解决问题,借鉴AI的思路使我受益良多。

现在,中国、韩国、日本的职业选手,都会用AI来训练。

“AI味”启示录

正如在生成式AI时代下,一些设计师和作者需要因为作品中包含的所谓“AI味”而进行繁复的自证,在融入AI已久的围棋界也一直在面对“AI味”衍生出来的各种议题。

在现时围棋比赛中,常常都会配有AI推测胜率和AI推荐最好的走法。观众在观赛过程中也因此能获得一种“主动性”,拥有多个观赛的角度。

2022年,中国棋手李轩豪在对决申真谞过程中,很多决策都和AI最优判断预测前三符合,因此被队友杨鼎新质疑其有用AI作弊之疑。

生于95年的李轩豪在用AI训练上“朝九晚九,全年无休,确实很用功”,因此棋路有时会被视作有所谓的“机器味”。

对于质疑,中国围棋协会进行了调查,最终认定这一指控没有证据,杨鼎新作出了处罚。

但用AI作弊的情况也的确存在。

2020年,韩国13岁的职业棋手金恩持被发现在线上比赛中的落子与AI推荐有高达92%的重合。经过调查后,最终认定其作弊(且本人也承认了),被罚禁赛一年。

2022年,中国棋手刘睿智被判定AI作弊,是中国首次正式因AI作弊而被处罚的职业棋手。和金恩持相比,刘睿智已经懂得规避“AI味”,只是在一些关键点用了AI。

为了应对,各国的比赛也是在不断改进反AI作弊机制。

与此同时,也有人利用了“AI味”来击败AI。

2023年,美国业余棋手Kellin Pelrine击败了围棋AI KataGo。

KataGo是现有开源最强围棋AI之一,韩国也会用它来训练棋手。

Pelrine利用了名为FAR AI的程序和KataGo对决了超过100万局,最后FAR AI找到了KataGo的弱点,并在人机对决中践行且获胜了:

那个策略算不上小儿科,但也不是特别难学。

然后,他也用同样的方法击败了另一个比较厉害的围棋AI Leela Zero。

策略关键在于要创造一个大的“圈”来围住对手一组棋,然后可以突然把一子下到另一个不相关的角落,去干扰AI。

Pelrine说,如果是人类棋手,看到那个圈肯定就知道有问题,但AI并不会留意到。

这个弱点看起来有点“取巧”,是不是让AI去进行针对性地训练就能打上补丁?

《自然》上周一篇报道援引了今年一篇预印本论文指出,面对专门找AI弱点的程序,模型的漏洞并非想象中容易修复。

这次被“针对”的还是KataGo。研究人员用三种不同的策略来让KataGo反击能力更强:

  • 让KataGo通过自我对弈学习如何应对攻击;

  • 迭代训练,用攻击程序攻击KataGo,把漏洞反馈给KataGo,让它通过自我对弈或其他方式学习应对,然后再用攻击程序攻击KataGo,往复循环;

  • 从头开始训练一个新的围棋AI系统,采用不同的神经网络模型。

虽然这些训练在一定程度上帮助了KataGo提高防御能力,但攻击程序依旧能发现漏洞,分别以91%、81%和78%的胜率击败KataGo。

这些攻击程序本身不是出色的围棋AI,人类也能轻松击败。

当然,这里的关键不是去比拼到底是人类厉害还是AI厉害。

重点是,对于围棋这个AI曾“颠覆”的领域,并且经过那么多年的应用与改进,其AI依旧存在很多问题。论文作者Adam Gleave说道:

如果我们在像围棋这种单一领域里也没法解决这个问题,那在短期里,想在ChatGPT之类模型修复越狱的可能性似乎很小。

关于 声波

声波
发现不同的声音

检查

外滩大会从上海出发与世界共振,科技为人是无国界的善意

偌大的会场,一束灯光打在舞台中 …

发表评论

邮箱地址不会被公开。 必填项已用*标注