星期日 , 12月 22 2024
首页 / 新知快讯 / 24H看点 / 谷歌“猜画小歌”背后的5000万组数据,都去了哪儿?

谷歌“猜画小歌”背后的5000万组数据,都去了哪儿?

谷歌“猜画小歌”背后的5000万组数据,都去了哪儿?

自从退出中国搜索引擎市场后,谷歌大概无时不刻都想“卷土重来”。昨天,这家以搜索引擎著称的巨头,用一款微信小程序“猜画小歌”占领了朋友圈“C位”,刷足存在感的同时,还顺便激发了身边一票“灵魂画手”。

比如这样的蒙娜丽莎:

或者这样的美人鱼:

就别难为小歌了好吗……

“猜画小歌”这款小程序基于Google AI来开发,也是谷歌第一款微信小程序。据谷歌官方博文介绍,用户可以和谷歌的AI组队,在有限的时间内进行速写。在每一轮体验中,用户需要在规定时间内勾勒出一幅日常用品的图画(比如狗、钟表或鞋子),AI“小歌”则需要在时间结束前猜出图画中的物体。

当 AI 猜出你图画中的物体时,你就会进入下一轮,你的猜画连胜次数也会相应增加。你还可以分享有趣的素描图,并在体验过程中不断收集新的题目和图画。

据谷歌介绍,“猜画小歌”背后的技术主要是计算机视觉和神经网络,由来自Google AI的神经网络驱动。

当然,在画得停不下来的同时,不少人也充满遗憾,谷歌的这个微信小程序,只是为了在中国刷刷久违的存在感吗?

事情当然没有这么简单。

其实,这个小程序并非在中国首发。早在去年11月,谷歌就上线了一款叫“Quick,Draw!”的线上游戏,也就是“猜画小歌”的网页原版。这款游戏中,玩家也需要在一定时间(20秒内)画出要求的图案,比如骆驼或洗衣机之类的。

这款网页版游戏目前仍然开放体验,如果在中国大陆的你懂得科学上网,可以去感受一下用鼠标画图的难度,绝对比手指画要艰难许多。

当然,谷歌后来表示,发布这个游戏的目的远不止让用户开心,初衷是利用这些草图,让计算机学习如何像人类那样绘画。

大方的谷歌并没有私吞这些网友的智慧结晶。截止今年五月,这款游戏的网页版已经从全球各地收集了5000万份不同的绘画,并且在谷歌上开源了数据库。这些简笔画不仅整理清晰,还被贴心地做好了标注。感兴趣的同学可以去github或者谷歌自取数据集哦。

数据集github 数据集谷歌

这一数据集包含了来自全球100多个国家和地区人们的绘画数据,据谷歌的说法,这些数据也被用来优化了本次微信小游戏“猜画小歌”的开发。但是基于谷歌网站在中国的境况,中国大陆的画作数据遗憾缺失。

但本次微信小程序上线后,中国大陆的数据终于可以补充进来啦,感兴趣的同学也可以坐等数据集的更新了。

那么,这些数据能用来做什么呢?文摘菌深夜咨询了一些科技咖们,得到了很多有趣的猜测:

比如,刚刚从日本回来的Andy同学就认为,可以用来收集abstract reasoning的数据,让机器了解什么是猫;又比如,来自斯坦福的Q同学觉得,这是可以被作为轮廓识别的宝贵数据。

除了这些在人工智能领域中的运用外,以数据新闻著称的海外科技媒体Quartz和两位记者,从更人文的角度,给出了一些不太一样的研究思路:他们希望通过比较世界各地人们绘制基本图形的方式,了解文化对绘画的影响。

这要得益于谷歌完备的数据库,这一数据库不仅包含了来自148个国家和地区的人所画的11.9万个不同的圆,也记录了每个玩家的手指(或鼠标)经过路线的坐标。

通过对其中从66个不同国家收集的100多个圆进行一些简单的几何分析,他们发现,不同国家的人习惯于不同的画圆方向:美国人喜欢逆时针画圆,在近5万个美国人所画的圆中有86%是逆时针画的。日本人则恰恰相反,更惯于顺时针画圆,800个日本人所画的圆中,有80%是顺时针画的。

下图是100个来自不同国家和地区的人所画的圆的随机抽样。

英国人、捷克人、澳大利亚人、芬兰人跟美国人有大致相同的比例,都是逆时针画圆。

法国人、德国人、菲律宾人甚至有更高的比例,大致90%是逆时针画圆。在越南,95%的人逆时针画圆。

Quartz分析的数据库显示,大部分国家和地区的人更倾向于逆时针画圆,唯独两个例外:台湾和日本。

这一研究成果一年前已经发布在Quartz上。如何解释这种差异呢?他们也做出了自己的猜测。

一个显而易见的原因是不同国家的不同语言。人们书写文字的不同方式,从上到下,从左到右,从右到左,是否能够解答他们绘画方式的不同呢?美国、西欧和拉丁美洲人的口语虽有差别,但书写方式大致相同。然而亚洲和中东却有着与上述国家截然不同的书面文字。

下面几幅图展示了一些代表性文字的书写方式:

比如,先来看看日语中的文字。这里展示了日语中三种文字符号:平假名(hiragana)、片假名(katakana)和万叶假名(kanji)。万叶假名基于汉字的表意文字,而平假名和片假名是表音文字。其中,平假名最接近于英文字母,也有最多的圆形笔划,其中大部分圆形笔划都是顺时针方向。

文字あ像英文字母a,是这样书写的:

日语和中文的文字都遵循严格的笔划顺序。整体来看,一个字是从左上到右下的方向书写的。美国罗格斯( Rutgers)大学数学教授书法家黄一知这样解释道:

“如果你画一条水平线再画一条垂直线,就像数字7一样,那么日文和汉字的书写规则就是把这两条线当做一个笔划,中间也没有停顿。”

因此我们的手在落笔的时候会采用顺时针方向,就像汉字“了”,代表着一个动作的完成。

基于中文的文字书写规则,在小孩子刚刚拿起铅笔的时候就深深印在他们脑子里了,这也奠定了台湾人和日本人画圆基于相同的书写方式。

当然,限于当时谷歌在中国大陆的状况,这一研究没有参考中国大陆的数据,但Quartz研究了过往的研究,发现调查结果也印证了这些观点。

在1985年对中国人画圆方式的调查中发现,151位参与者中有72%的人顺时针画圆。研究者指出,这也许是因为在行书(中国书法的一种)中笔划多为顺时针。

有兴趣的同学也可以坐等谷歌更新带有大陆数据的数据集,然后继续这个研究。

三角形绘画方式的相似度,在基于中文的语言中更加显著。97%台湾人、90%日本人和韩国人都是逆时针画三角形。对比来看,美国人一笔划出的三角形,只有一半多一点的比例是逆时针的。

基于汉字的笔划顺序规定对角线的格式,就像一个三角形,是先从右向左再从左向右的。从“人”这个字,就不难发现这种规律。

另外一组国家的例子也可以让人们更好地理解画圆方式的不同。阿联酋、科威特、阿尔及利亚、约旦、沙特阿拉伯、以色列、伊拉克和埃及,这些国家的人在下面画圆方式的分布图中聚集在一起,几乎互相挨着(除了泰国和韩国,这俩国家在中间)

阿拉伯文和希伯来文包含很多曲线,读和写都是从右向左的顺序。在阿拉伯语中,文字的曲线跟随着手的方向,通常是顺时针,这也更好地控制字与字的间隔。

下面是字母“b”和“n”在阿拉伯语中的书写方式:

如果对剩余国家画圆方式观察更仔细一些,就可以发现其他一些规律。举个例子,韩语(朝鲜语)的书写系统中有大量的圆形。1500个韩国人所画的圆有72%是逆时针画的。

你也许以为韩国会跟台湾和日本的结果相似,但韩语的书写规则其实是与中文和日语恰恰相反的:圆形都是逆时针书写的。这就直接导致韩国画圆方式的结果更趋近于其他国家。

在泰国的结果中,有64%的圆是逆时针的,而其文字书写同样也包含着大量的圆形笔划。在42个辅音中,几乎所有都是从一个小圆圈开始写。开头的这个圆圈可以顺时针也可以逆时针,但逆时针的圆是顺时针的两倍多。

下面是发音“m”的泰文:

你也许会问另两种充满圆形的文字,缅甸语和格鲁吉亚语的结果如何。

缅甸同日本和台湾结果相近,仅22%的圆形是逆时针的。这支持了我们所得出的结论,但由于样本只有9个,我们不能这样轻易下结论。相似的,格鲁吉亚只有72个数据,所以不具代表性。

剩余的50个国家倾向逆时针画圆。这些国家几乎所有都在使用运笔从左至右且没有过多圆形笔画的拉丁字母。英语也有笔顺,不过没有那么死板:可能是因为在孩提时期,像大多数使用拉丁字母的国家那样,一遍一遍地逆时针写“c”和“g”。

当然,尽管有许多证据表明文字能够影响人们画图形的方式,但是这一理论也不能解释一切。越南也像美国一样使用拉丁字母,并且有95%的人逆时针画圆,可是使用中文笔画的香港也有82%的人逆时针画圆。

另一种可能的解释是有人是左利手。也许右利手自然地倾向于逆时针画圆,除非书写系统教他们反向(顺时针画圆)。来自“Quick,Draw!”的数据并没有表明用户是左利手还是右利手,惯用手的不同可能显著地影响到他们画图的方式。不同国家的左利手并没有太大的不同,这可能并不能解释台湾地区、日本和其它国家之间的巨大区别。

那么,究竟什么才是正确的做法呢?

Quaritz在文章中也做出了分析,在20世纪70年代,美国为儿童开发的一项名为“torque test”(“扭力测试”)的常见心理学练习,孩子们会得到一张纸,上面有这个:

为了帮助研究人员辨明孩子是左利手还是右利手,孩子们被告知要先后用两只手画圆把X圈起来。如果孩子逆时针画所有的圆(被认为是右利手的证据)则被认为是“非标准”。如果孩子顺时针画了一个圆(与左利手相关)则被认为是“标准”。

美国心理协会主席、扭矩测试的创造者Theodore Blau在1977年发表的论文中认为,顺时针画圆是学习与行为变异的标志。他警告说,标准画圆的孩子们,可能有得精神分裂症的危险。

心理学家们后来反驳了上述观点,并且一些人特别关注文化和教育对儿童绘画习惯的影响。在1997年一项跨文化研究中,调查了不同年龄段的学生——在美国生活的美国学生、在日本生活的日本学生和在美国生活的日本学生,调查结果显示:62名日本一年级学生中,约有半数同学顺时针画圆;三分之一的学生逆时针画圆;五分之一的学生两种方式都用。

但是,几乎全部的六年级学生都是顺时针画圆,这暗示着孩子们写字越多,他们顺时针画圆变得更加明显。相比之下,有64%的美国学生逆时针画圆,这个比例在六年级学生中也只有些许变化。

但是,并不只有日本是这样。在1973年的跨文化研究中,还调查了不同年龄段的美国和以色列儿童是如何画圆的,结果表明也有大量的儿童逆时针画圆。

研究人员指出,对以色列来说结果正好相反,他们用到的最接近圆的字母“ס”,是顺时针写的。随着时间的推移,美国人在画圆的方向上更趋一致,100%的成年测试者逆时针画圆。在以色列,各个年龄段的测试者中有70%顺时针画圆。

这些研究表明,不仅文化和写字方式(书法)塑造了人们绘制抽象形状的方式,而且也表明这种趋势随着时间的推移越来越明显。写得越多,习惯越根深蒂固。出于同样的研究目的,我们在全世界范围内收集了90,000个圆,构造了一个规模更加庞大、数据更加一致的数据集,用以支撑过去在小规模数据研究中得到的结果。

现代汉语笔顺系统是从汉代盛行的隶书系统演变而来的。隶书书写时间太长,而人们想要写的更快,因此隶书演变成行书,一种半草书风格,最终演变成今天的笔画。根据书法家黄一知的说法,使用软毛笔书写能够了解更多的现代中文笔顺规则。

日本人同中国人一样讲究笔顺。在1958年,日本教育部制定了国家级的笔顺准则,建立了统一的标准,避免出现混乱。

“我认为我运笔的方式很有效并且写出的字很漂亮。”日本协会语言中心主任TomoyoKamimura说道,“一些成年人书写笔画顺序完全错误,我们认为他们没有接受教育。”

如今,美国的小孩都在学习印刷体和手写体的方法,这种方法叫做“快乐书写”。该方法提倡使用“魔法C”,一种逆时针曲线,用在“c、g、q、o”等字母中。因此,美国的学校会鼓励小孩子们逆时针画圆,来帮助他们养成以后第一次书写字母时所需的基本运动技巧。

为了测试我们的理论,我们请了一些母语使用日语、阿拉伯语、希伯来语、汉语、泰语和越南语的同事、朋友和家人来画圆圈,虽然这样感觉有点不太好。但他们仍然很高兴地加入了,因为他们除了好奇自己到底是怎么画圆的以外,也渴望了解一个崭新的领域。

诚然,这世界上还有很多我们不懂的事情,但对绘制形状的研究在心理学领域好像已经过时了,除了一个例外,我们发现所有与文化相关的图形绘制研究以及“扭矩测试”(“torque test”),都是在1997年之前开始的。

我们可以合理推断一下,全世界的人越来越多地通过键盘打字来交流。未来某一天书法艺术会被遗忘,但到了那个时候,我们或许还会形成文化差异,只是这个差异与书法艺术无关,与键盘打字有关。

关于 吉运好熊

吉运好熊
清华计算机系

检查

巴菲特年底购股大动作:增持西方石油等多家公司

圣诞节前夕,巴菲特趁近几天美股 …

发表评论

邮箱地址不会被公开。 必填项已用*标注