Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

魏子敏、halcyon作者

你的灵魂画作都去哪儿了?“猜画小歌”背后的5000万组数据

自从退出中国的搜索引擎市场,谷歌大概无时不刻都想”卷土重来“。昨天,这家以搜索引擎著称的巨头公司用一款微信小程序“猜画小歌”占领了朋友圈“C位”,刷足存在感的同时,还顺便激发了身边一票“灵魂画手”。

比如这样的蒙娜丽莎👇

或者这样的美人鱼👇

就别难为小歌了好吗……

“猜画小歌”来自Google AI的一款小程序,这也是谷歌第一款微信小程序。据谷歌官方博文介绍,用户可以和谷歌的AI组队,在有限的时间内进行速写。在每一轮体验中,用户需要在规定时间内勾勒出一幅日常用品的图画(比如狗、钟表或鞋子),AI“小歌”则需要在时间结束前猜出图画中的物体。

当 AI 猜出你图画中的物体时,你就会进入下一轮,你的猜画连胜次数也会相应增加。你还可以分享有趣的素描图,并在体验过程中不断收集新的题目和图画。

据谷歌介绍,“猜画小歌”背后的技术主要是计算机视觉神经网络,由来自Google AI的神经网络驱动。

当然,在画的停不下来的同时,不少人也充满遗憾,谷歌的这个微信小程序,只是为了在中国刷刷久违的存在感吗?

当然没有这么简单。

其实,这只小程序并非中国首发,早在去年11月,谷歌就上线了一款叫“Quick,Draw!”的线上游戏,也就是“猜画小歌”的网页原版。这款游戏中,玩家也需要在一定时间(20秒内)画出要求的图案,比如骆驼或洗衣机之类的。

游戏界面传送门:

https://quickdraw.withgoogle.com/

这款网页版游戏目前仍然可用,如果在中国大陆的你懂得科学上网,可以点击上边的链接进入,感受一下用鼠标画图的难度,绝对比手指画要艰难许多了。

当然,谷歌后来表示,发布这个游戏的目的远不止让用户开心,真正的初衷是运用这些草图,让计算机学习人如何绘画。(意味深长啊)

大方的谷歌并没有私吞这些网友智慧的结晶,截止今年五月,这款游戏的网页版已经从全球各地收集了五千万份不同的绘画,并且在谷歌上开源了数据库。

这些简笔画不仅整理清晰,还被贴心的做好了标注。感兴趣的同学可以去github或者谷歌自取数据集哦👇

数据集github链接:

https://github.com/googlecreativelab/quickdraw-dataset

数据集谷歌链接:

quickdraw.withgoogle.com/data

这一数据集包含了来自全球100多个国家和地区人们的绘画数据,据谷歌消息,这些数据也被用来优化了本次微信小游戏“猜画小歌”的开发。

但是,基于谷歌网站在中国的境况,中国大陆的画作数据遗憾缺失。

不过,本次谷歌微信小程序上线后,中国画手的信息终于可以补充进来啦,感兴趣的同学也可以坐等数据集的更新了。

想到自己的画作还能被收录进入数据库,为人工智能和人类的进步作出一份微薄贡献,是不是有点小激动呢?

那么,这些数据能用来做什么呢?文摘菌深夜咨询了一些科技咖们,得到了很多有趣的猜测:

比如,刚刚从日本回来的Andy同学就认为,可以用来收集abstract reasoning的数据,让机器了解什么是猫;

又比如,来自斯坦福的Q同学觉得,这是可以被作为轮廓识别的宝贵数据。

除了这些在人工智能中的宝贵效用,以数据新闻著称的海外科技媒体Quartz和两位记者,从更人文的角度,给出了一些不太一样的研究思路:他们希望通过比较世界各地人们绘制基本图形的方式,了解文化对绘画的影响。

这要得益于谷歌完备的数据库,这一数据库不仅包含了来自148个国家和地区的人所画的11.9万个不同的圆,也记录了每个玩家的手指(或鼠标)经过路线的坐标。

通过对其中从66个不同国家收集的100多个圆进行一些简单的几何分析,他们发现,不同国家的人习惯于不同的画圆方向:

美国人喜欢逆时针画圆,在近5万个美国人所画的圆中有86%是逆时针画的。恰恰相反,日本人更多习惯于顺时针画圆,800个日本人画的圆中有80%是顺时针画的。

下图是100个来自不同国家和地区的人所画的圆的随机抽样。

英国,捷克,澳大利亚和芬兰人跟美国人有大致相同的比例逆时针画圆。

法国,德国和菲律宾人甚至有更高的比例-大致90%去逆时针画圆。在越南,95%的人逆时针画圆。

Quartz分析的数据库显示,大部分国家和地区的人更倾向于逆时针画圆,唯独两个例外:台湾和日本。

这一项目的成果在一年前发布在Quartz上👇

https://qz.com/994486/the-way-you-draw-circles-says-a-lot-about-you/

*大数据文摘在去年十二月已经发布了Quartz这篇文章的编译版,重刊如下,感兴趣的同学可以继续阅读。

如何解释这种差异呢?Quartz也做出了自己的猜测。

一个显而易见的原因是不同国家的语言。人们书写文字的不同方式,从上到下,从左到右或是从右到左,是否能够解答他们绘画方式的不同呢?美国,西欧和拉丁美洲人的口语虽有差别,但书写方式大致相同。然而亚洲和中东却有着与上述国家截然不同的书面文字。

下面几幅图展示了一些代表性文字的书写方式:

比如,先来看看日语中的文字。这里展示了日语中三种文字符号:平假名(hiragana),片假名(katakana)和万叶假名(kanji)。万叶假名基于汉字的表意文字,而平假名和片假名是表音文字。其中,平假名最接近于英文字母,也有最多的圆形笔划,其中大部分圆形笔划都是顺时针方向:

文字あ像英文字母a,是这样书写的:

日语和中文的文字都遵循严格的笔划顺序。整体来看,一个字是从左上到右下的方向书写的。美国罗格斯( Rutgers)大学数学教授书法家黄一知这样解释道:如果你画一条水平线再画一条垂直线,就像数字7一样,那么日文和汉字的书写规则就是把这两条线当做一个笔划,中间也没有停顿。(可以自己从纸上尝试一下)

因此我们的手会自然而然形成习惯去顺时针动,就像汉字“了”代表着一个动作的完成。

基于中文的文字的书写规则在小孩子刚刚拿起铅笔的时候就深深印在他们脑子里了,这也奠定了台湾和日本的人画圆基于相同的书写方式。

当然,限于当时谷歌在大陆的状况,这款网页游戏没有办法搜集到大陆的信息,这一研究也没有中国大陆的数据,但Quartz研究了过往的研究,发现调查结果也支持了这个发现。

在1985年对中国人画圆方式的调查中发现,151位参与者中有72%的人顺时针画圆。研究者指出,这也许是因为在行书(中国书法的一种)中笔划多为顺时针。

有兴趣的同学也可以坐等谷歌更新带有大陆数据的数据集,然后继续这个研究啦。

三角形绘画方式的相似度在基于中文的语言中更加显著。97%台湾地区的画手和90%的日本人和韩国人都是逆时针画三角形。对比来看,美国人一笔划出的三角形,只有一半多一点的比例是逆时针的。

基于汉字的笔划顺序规定对角线的格式,就像一个三角形,是先从右向左再从左向右的。从“人”这个字,就不难发现这种规律。

另外一组国家的例子也可以让人们更好地理解画圆方式的不同。阿联酋,科威特,阿尔及利亚,约旦,沙特阿拉伯,以色列,伊拉克和埃及在下面画圆方式的分布图中聚集在一起,几乎互相挨着(除了泰国和韩国在中间)。

阿拉伯文和希伯来文包含很多曲线,读和写都是从右向左的顺序。在阿拉伯语中,文字的曲线跟随着手的方向,通常是顺时针,这也更好地控制字与字的间隔。

下面是字母“b”和“n”在阿拉伯语中的书写方式:

如果对剩余国家画圆方式观察更仔细一些,就可以发现其他的一些规律。举个例子,韩语(朝鲜语)的书写系统中有大量的圆形。1500个韩国人所画的圆有72%是逆时针画的。

你也许以为韩国会跟台湾和日本的结果相似,但韩语的书写规则其实是与中文和日语恰恰相反的:圆形都是逆时针书写的。这就直接导致韩国画圆方式的结果更趋近于其他的那些国家。

在泰国的结果中,有64%的圆是逆时针的,而其文字书写同样也包含着大量的圆形笔划。在42个辅音中,几乎所有都是从一个小圆圈开始写。开头的这个圆圈可以顺时针也可以逆时针,但逆时针的圆是顺时针的两倍多。

下面是发音“m”的泰文:

你也许会问另两种充满圆形的文字,缅甸语和格鲁吉亚语的结果如何。

缅甸同日本和台湾结果相近,仅22%的圆形是逆时针的。这支持了我们所得出的结论,但由于样本只有9个,我们不能这样轻易下结论。相似的,格鲁吉亚只有72个数据,所以不具代表性。

剩余的50个国家倾向逆时针画圆。这些国家几乎所有都在使用运笔从左至右、且没有过多圆形笔画的拉丁字母。英语也有笔顺,不过没有那么死板:可能是因为在孩提时期像大多数使用拉丁字母的国家画圆那样一遍一遍地逆时针写“c”和“g”。

当然,尽管有许多证据表明文字能够影响人们画图形的方式,但是这一理论也不能解释一切。越南也像美国一样使用拉丁字母,并且有95%的人逆时针画圆,可是使用中文笔画的香港也有82%的人逆时针画圆。

另一种可能的解释是有人是左利手。也许右利手自然地倾向于逆时针画圆,除非书写系统教他们反向(顺时针画圆)。来自Quick,Draw!的数据并没有表明用户是左利手还是右利手,惯用手的不同可能显著地影响到他们画图的方式。尽管如此,不同国家的左利手并没有太大的不同,这可能并不能解释台湾地区、日本和其它国家之间的巨大区别。

那么,究竟什么才是正确的做法呢?

Quaritz在文章中也做出了分析,在20世纪70年代美国为儿童开发的一项名为“torque test”(“扭力测试”)的常见的心理学练习中,孩子们会得到一张纸,上面有这个。

为了帮助研究人员辨明孩子是左利手还是右利手,孩子们被告知要先后用两只手画圆把X圈起来。如果孩子逆时针画所有的圆(被认为是右利手的证据)则被认为是“非标准”。如果孩子顺时针画了一个圆(与左利手相关)都被认为是“标准”。

美国心理协会主席、扭矩测试的创造者Theodore Blau在1977年发表的论文中认为,顺时针画圆是学习与行为变异的标志。他警告说,标准画圆的孩子们,可能有得精神分裂症的危险。

心理学家们后来反驳了上述观点,并且一些人特别关注文化和教育对儿童绘画习惯的影响。在1997年的一项跨文化研究中调查了不同年龄段的,在美国生活的美国学生、在日本生活的日本学生和在美国生活的日本学生:62名日本一年级学生中,约有半数同学顺时针画圆;三分之一的学生逆时针画圆;五分之一的学生两种方式都用。

但是,几乎全部的六年级学生都是顺时针画圆,这暗示着研究者们孩子写字越多,他们顺时针画圆的变得更加明显。相比之下,有64%的美国学生逆时针画圆,这个比例在六年级学生中也只有些许变化。

但是,并不只有日本是这样。在1973年的跨文化研究中调查了不同年龄段的美国和以色列儿童是如何画圆的,结果表明,也有大量的儿童逆时针画圆。

研究人员指出,对以色列来说结果正好相反,他们用到的最接近圆的字母“ס”,是顺时针写的。随着时间的推移,美国人在画圆的方向上更趋一致,100%的成年受试者逆时针画圆。在以色列,各个年龄段的受试者中有70%顺时针画圆。

这些研究表明,不仅文化和写字方式(书法)塑造了人们绘制抽象形状的方式,而且也表明这种趋势随着时间的推移越来越明显。写的越多,习惯越根深蒂固。出于同样的研究目的,我们在全世界范围内收集了90,000个圆,构造了一个规模更加庞大、数据更加一致的数据集用以支撑过去在小规模数据研究中得到的结果。

如果英语是你的第一语言,你可能已经忘记了小时候上学时,艰难地握着铅笔,笨拙地按照要求的结构临摹大小写字母。在某些语言中,这些规则不是可以忘却的记忆,而是书写的首要条件。比如,在日本和中国,笔顺是工整书写的重要部分,甚至可以象征着教育程度。

现代汉语笔顺系统是从汉代盛行的隶书系统演变而来的。隶书书写时间太长,而人们想要写的更快,因此隶书演变成行书,一种半草书风格,最终演变成今天的笔画。根据书法家黄的说法,使用软毛笔书写能够了解更多的现代中文笔顺规则。

日本人同中国人一样讲究笔顺。在1958年,日本教育部制定了国家级的笔顺准则,建立了统一的标准,避免出现混乱。(如今这些规则被放宽了。)

“我认为我运笔的方式很有效并且写出的字很漂亮”,日本协会语言中心主任TomoyoKamimura说道。“一些成年人书写笔画顺序完全错误,我们轻视他们那样书写,我们认为他们没有接受教育。”

如今,美国的小孩逐步被传授印刷体和手写体的方法,这种方法叫做“快乐书写”。该方法提倡使用“魔法C”,一种逆时针曲线,用在“c,g,q,o”等字母中。因此,美国的学校会鼓励小孩子们逆时针画圆,来帮助他们养成以后第一次书写字母时所需的基本运动技巧。

什么塑造了我们?

我们有无数种微妙的方式,不知不觉地将文化带进我们的世界:绘画的方式,手势的意义以及模拟真实世界的声音。而这是海量数据的核心乐趣所在。

为了测试我们的理论,我们请了一些母语使用日语、阿拉伯语、希伯来语、汉语、泰语和越南语的同事、朋友和家人来画圆圈,虽然这样感觉有点不太好。但他们仍然很高兴的加入了,因为他们除了好奇到底自己是怎么画圆以外,他们也渴望了解一个崭新的领域。

诚然,这世界上还有很多我们不懂的事情。于此同时,对绘制形状的研究在心理学上好像已经过时了。除了一个例外,我们发现所有与文化相关的图形绘制研究以及“扭矩测试”(“torque test”)都是在1997年之前的。

我们可以合理推断一下,全世界的人越来越多通过打字来交流,然而尽管某一天书法的艺术会被遗忘,但到了那个时候,也许我们已经形成了一个全新的以键盘为主导的文化差异呢。

大数据文摘
大数据文摘

秉承“普及数据思维,传播数据文化,助⼒产业发展”的企业⽂化,我们专注于数据领域的资讯、案例、技术,形成了“媒体+教育+⼈才服务”的良性⽣态,致⼒于打造精准数据科学社区。

产业猜画小歌
3
相关数据
计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

暂无评论
暂无评论~