2020/12/11 10:54

杨学俊校对文婧编辑

人工智能的人文主义，如何让AI更有爱

一、数字鸿沟凸显，老年人成为“数字难民”

近日，两则关于老年人的新闻在网络刷屏，引人深思。

11月23日，一则视频在网上热传，湖北宜昌一位老人冒雨到村代收点交医保，现场工作人员却告诉她不收现金，只能使用手机支付。而不久前，为激活社保卡，一名94岁的老人被抬到银行进行人脸识别，老人膝盖弯曲，十分吃力，实在让人不忍直视。

管中窥豹，时见一斑。事实上，两位老人的处境正是万千中国老人的缩影。如今，无论是网购、外卖、打车，还是就医、理财、买菜，智能化应用都为我们提供了不少便利，却也把不少老年人拦在了智能时代之外，让他们沦为“数字难民”。

根据中国互联网络信息中心2018年的报告，六成中老年人不会在网上缴纳手机费；七成左右的中老年人不会网上购物、导航；四分之三左右的中老年人不会用打车软件，或缴纳水、电、煤气等生活费用；而会网上挂号、订火车票机票、订宾馆等便利服务的中老年人所占比例更是很低。已经有相关的研究机构关注到这个问题，清华大学人因与工效学研究所打算在北京地区开展教老人用智能手机的活动时介绍，由于流程的线上化，老年人的出行和医疗是目前两大最常见的痛点。

曾有媒体对老年人使用科技产品的习惯做了简单调查，能够熟练使用手机进行打车、导航、挂号、缴费的老年人凤毛麟角，“学手机”这件事大多数时候是老年人自我摸索，或互相传授经验。但事实上，并非所有的老年人都有能力靠自学来积极拥抱互联网。根据最新发布的《中国互联网络发展状况统计报告》显示，使用技能缺乏、文化程度限制和设备不足是非网民不上网的主要原因。这些原因中的任何一条，都在老年人群体中突出存在。

这些真实发生的事件提醒着我们，老年群体与年轻一代的“信息鸿沟”在进一步扩大。事实上，除了老年人，还有任何由于功能障碍而无法独立正常生活的人也是如此。根据皮尤研究中心2016年的一项调查，不使用互联网的残疾人的几率是没有残疾的人的三倍。同时，残疾人订购家庭宽带或购买电脑，智能手机或平板电脑的可能性也低20％。在很多国家，这部分群体由于生活不便以及社会排挤歧视等问题，逐渐将自己隐藏起来远离现实中的公共场所。如今，随着互联网的普及，他们继续远离网络生活，被迫沦为社会的边缘人。事实上，这部分群体并非少数——全球大约有10亿人身患残障，关注他们的需求、解决他们的问题，是科技同样要兼顾到的领域。

当前，社会对于解决老弱病残融入数字生活问题的途径，通常采用将智能化技术与传统服务有机结合的方式，比如多地火车站设无健康码通道，为一些不擅长操作手机的人提供了一条便捷的通道；不少医院保留人工服务窗口，同时配有导医、志愿者等现场为老年人服务，让他们体会到温暖；一些政府和企业合作，提供更多智能化适老产品和服务，让老年人/残障人士能用、会用、敢用、想用，帮助和鼓励他们更好适应并融入互联网社会，共享数字时代带来的便利和乐趣……

不过，从长远看，一个成熟的智能社会应该是不需要人为的干预，每一个人都能过上“傻瓜式”智能生活、包括老弱病残都能无障碍享受技术便捷的时代。毕竟科技发展的最终目标是让技术来适应人，而不是让人去适应技术。那时，人工智能将赋能万物，成为和空气、水一样的存在，每个人都能平等有尊严地享受智能生活。

二、对人工智能的人文反思成为焦点

若以“傻瓜式”智能蓝图为目标，就需要人工智能技术发展以人为本、造福民生。

人本人工智能（Human-centered AI，简称 HAI）是指从“以人为本”的视角重新审视人工智能技术，要求设计算法之初就必须意识到它们是由人类组成的更大系统的一部分。所谓人工智能的人文化，是强调科学家或科学共同体的道德义务，督促他们创造出有道德的人工智能体。这种人工智能体关怀人和人类社会的利益，以人为主体，重视人的价值，尊重人的尊严和权力，与人类一起迈向自由、平等和解放。

那么，怎样把人类的价值观和伦理规则植入人工智能，并且为它设立恰当的目标呢？

首先，从源头上堵住不利于人类社会发展的人工智能体出现。规范人工智能科学家的行为，在技术研发前引入伦理委员会机制，预测风险，并在程序设置中加以控制，重要的是找到使用人工智能造福人类的人。

至于将人类哪些价值观注入人工智能，使其更好地为人类服务呢？这其中包括以人为本，珍视人的生命、保护人的尊严，尊重人的自由和平等的价值观；技术进步最终受益者应是全人类、全社会的公正的价值观；人类和大自然之间的关系必须秉承和谐原则的价值观等。

其次，人工智能体的设计，尤其是机器人的设计和应用必须遵循阿西莫夫的“机器人三大定律”，并以此为法则，在“不伤害”原则的前提下，培养人工智能体与人类的良好交互能力。“机器人三大定律”首要原则是不能伤害人类，或者保护人类不受伤害; 其二是听命与人，但不得违反第一原则; 其三是保障自身安全，但同时不得违背上述两点原则。三大定律定位了作为人工智能体的机器人，仅仅是人类在自身发展过程中创造的一个工具。不管机器人有无意识，有无自我决策能力，它都必须遵守“不伤害”的原则，这是应用伦理学秉承的核心原则，而其产生的最大诉求就是为了人类社会运转更经济、更有效率。

克劳福德和卡洛（Crawford&Calo）提出了人工智能的社会系统分析途径，他们指出人工智能的设计者和研究者不仅需要评估人工智能对社会、文化和政治环境的冲击和影响，而且需要评估社会、文化和政治环境对人工智能的影响。社会系统分析工具的构建涉及哲学、社会学、人类学和科学技术研究等相关学科，需要对人类社会与技术变革的交互影响进行综合权衡。科学家需要给予人工智能以人类的思考方式、思维模式；给予人工智能以感受人类的情感的能力，使其能感受人类的情感变化，对人类情感变化做出一定的反应；给予人工智能以人类的文化底蕴，使其能够理解人类的文化，从而与人类进行一定的文化互动，丰富人类的精神生活；给予人工智能识别不同文化背景人的能力，对不同文化背景的人采用不同的交流方式，与其进行不同的文化互动；给予人工智能以表达情感的能力，能对人类进行一定的情感干预，使人类保持积极向上的心态；从听从指令到能察觉出人类的潜在需求，进而自动的为人类所需服务。

再次，政府的管控不能缺位，要保证研究结果获得分享，不让某个团体单独受益。当一项能够给人类带来很大便利的技术投放市场时，政府、私人企业和学术界谁来控制它，就成为一个必须明晰的课题。政府的管控是否缺位、及时，引导是否正确、到位，都是制约人工智能发展偏离轨道的重要因素。最后，人类要保持对大自然的敬畏之心，对理性抱有谨慎的信心。要知道，我们目前拥有的这些难以置信的感觉，相对于宇宙和自然界来说，还仅仅是沧海一粟，我们没理由狂妄自大，而应时刻提醒自己，科学探索无止境，技术使用有禁区。

近几年，国际人工智能和机器人领域的科学家的一系列行动表达了他们对智能机器及自主系统的伦理关切。他们共同商议人工智能及自主系统的未来走向，推动制定相关规范。例如， 2016 年，电气电子工程师协会（IEEE）发布关于人工智能及自主系统的伦理考虑的全球倡议；2017 年，生命未来研究所牵头制定的“阿西洛马人工智能 23 条伦理原则”面向全球发布。

这其中的思想与前文内容大致相同，尤其是“阿西洛马人工智能 23 条原则”，其意义在于给了我们这样的启示：伦理已经成为新兴科学和技术发展以及人工智能社会应用的内生变量，为人工智能的跨学科研究提供了成功合作的基本条件。

三、人本智能产品设计：从机器思维到设计思维

随着人本人工智能概念的普及，技术发展已经不再是驱动产品开发与设计的唯一力量，而需要将更多非技术因素纳入考量，人工智能产品的设计与开发，正逐渐从技术驱动迈向以人为本。技术只有转化为产品，才能改变人们的生活，而这个转化过程就是智能产品的设计过程，同时，这个过程也面临不小的挑战。

人本智能产品设计所面临的主要挑战是弥合机器思维和设计思维之间的差距，以实现从技术驱动到以人为本的转变。设计思维的主要内容是以人为中心，通过头脑风暴、社会化思考、可视化思考、原型实践等手段，帮助设计师深入观察用户行为，探索解决方案，优化设计概念。设计思维有助于解决问题，定义不清晰或未知的复杂问题。

机器思维区别于设计思维，很少感性地思考用户的需求，而更致力于利用现有资源在工程指标上取得更优异的表现。以机器学习为例，机器思维可以相应地映射为以下五个阶段：分析、合成、构思、调整和验证。除了单纯的验证环节，机器思维主导的设计活动还会关注一个设计思维很少关注的阶段，即维护。因为人工智能方案常常会在使用过程中进行细节的调整与改动，所以还需要花费更多精力来维护当前的设计方案，同时观察它在实际使用过程中的表现，并寻求优化甚至是突破。

另外，设计思维与以机器学习为代表的机器思维在解决问题的方式上存在明显差异。设计活动以人为中心，所有的设计思维和实践都需要围绕设计对象的利益相关者展开，如用户、制造者、销售者等。而机器思维的中心则转移到了需要解决的工程任务上，更关注技术的具体指标、输入输出、算法解决方案等。人本智能产品设计需要在每个阶段将两种思维方式有机结合，将机器思维过程按照设计思维的五个步骤进行相应的映射与总结。

当前，在以机器学习为代表的新一代人工智能热潮中，各大科技公司和研究机构纷纷发布各类人工智能平台、开源工具、数据集和开源算法。伴随着这股技术普及的热潮，设计团队得以发挥自身优势，从以人为本的视角探索这一新兴技术能够为用户带来的价值。

2018年，李飞飞在斯坦福大学启动了“以人为本的人工智能项目”，这一项目的宗旨是“推动人工智能的研究、教育、政策和实践，以造福全人类”，致力于三个方向的工作：1、推进和发展下一代人工智能科学（着重与脑科学和认知学交叉）；2、研究和预测人工智能对人类社会和生活的影响；3、设计和实践以人为本的人工智能技术和应用。

同年，麻省理工学院也设立了一个人本人工智能的研究项目集群（Human-Centered AI Collection），其目标为：1、人工智能系统必须通过向人类学习来不断改进；2、创造一种有效和可实现的人类机器人交互体验。该项目包括计算机视觉、半监督数据注释、自然语言和非语言交流、强化学习和虚拟现实环境中人类行为的现实模拟等，这一项目将人本智能产品设计的范畴拓展为多学科交叉问题，涵盖机器学习、心理学、经济学等领域。

与此同时，学者们也着力探索设计在人本智能从技术到产品转化过程中所发挥的具体作用。以机器学习产品为例，关注人本的用户体验设计方法可以弥补机器思维的缺陷，更全面地帮助设计师识别设计机会，根据使用场景和目标用户选择合适的算法。此外，体验设计能够为机器学习的数据获取和迭代过程规划合理的路径，如界定需要被记录的用户行为、利用界面设计更便利地获取交互行为数据以帮助系统进行学习。

四、以人为本的人工智能技术所展开的应用举例

这些年来，一些国内外具有人文关怀的人工智能技术不断取得突破，有效服务到了有需求群体。

1、语音识别技术

这些年来，以语音识别技术为支撑的智能音箱大受消费者欢迎。Google Home，亚马逊的Echo系列以及苹果的HomePod等智能家居音响为数字语音助理注入了新的活力。它们不仅仅是排队播放喜爱的播客的一种省事方法，对于在特定方面有残疾的人来说，他们简直是福音。

比如，语音助手能够帮助盲人减少在网上搜索的时间，在线同进行多任务处理并做更多的事情。另外，智能家居音响与智能家电配合使用时，可以发挥更强大的作用。比如视力丧失和有身体疾病的人可以轻易打开灯光，而不必慢慢摸索墙壁开关，并且可以使用语音命令调节温度。

研发人员已经开发了家居音响和语音助理的更多用途。一位业余爱好者结合了Raspberry Pi开发板和亚马逊的第三方语音识别平台Alexa语音服务，为电动轮椅添加了语音控制功能。

事实上，智能家居设备只是语音识别技术应用的很小一部分，它还能实现从语音到文本和文本到语音。比如Ente Vioceitt是一个面向言语障碍人士的应用程序，该程序是特别为那些从中风和脑损伤中恢复过来，以及受大脑麻痹，帕金森病，唐氏综合症和其他慢性健康疾病影响的人所设计的。它能够不断学习说话者的发音，从而优化转化出来的音频和文本。

与此同时，谷歌的DeepMind部门正在利用人工智能为有听觉障碍的用户生成闭路字幕。在2016年与牛津大学的研究人员进行的一项联合研究中，DeepMind的算法观测了超过5,000小时的电视并分析了17,500个单词，从而构建了一个模型。该模型的效果显著优于唇语专家，在200个随机选择的视频片段中成功翻译了46.8％的单词，远远超过专业人员的12.4％。

2、图像自动识别

屏幕读取程序可帮助盲人和视力障碍人士获取网站信息，但大多数网站都包含有图像，而并非每个图像都配有恰当的标题或替代文字。

有一种解决方案是依赖人工智能技术，对图像自动分类。Facebook已经开发了可向视力受损用户描述图像的字幕工具，谷歌的Cloud Vision API可以理解图像中的单个对象的上下文。例如，它可能会将一张南瓜灯笼的图像标记为“南瓜”“雕刻”“万圣节”和“假日”。

另一个强大的计算机视觉平台，微软的Seeing API，这是一款 iPhone 应用，试图分析周围环境并通过语音为视力缺陷者带来帮助。通过使用神经网络技术，这款应用不仅可以翻译文本，而且可以识别人物和货币、扫描产品条形码。还可以对整个场景或者导入的图像进行简单的描述。有些功能甚至不需要联网即可实现。

3、自动驾驶

自动驾驶汽车和其他的自动驾驶交通工具为因病或年老而不便出门的人群提供了前所未有的自由。对于那些只能在家中活动的人来说，谷歌Waymo、优步、Drive.AI、丰田、通用等公司开发的自动驾驶技术的好处在于，大大扩大了他们的活动范围。据Sense公司称，四分之一的残疾人每天会因与外部世界和社会隔绝而感到孤独，自动驾驶可以帮助他们增进社交生活。

另外，自动驾驶技术也可以帮助这些人找到工作。根据鲁德曼基金会的资料，自动驾驶汽车有望帮助多达200万残疾人士解决上班问题。

2018年，在亚利桑那州凤凰城启动了自动驾驶技术公开测试的Google Waymo已经将无障碍因素融入其汽车设计中。该团队正在试验为盲人用户设计的音频信号，以及用盲文标记的汽车仪表板按钮。

4、服务机器人

机器人的应用领域非常广泛，在家庭机器人中，有一个重要功能是照顾、帮助老弱病残者。日本的本田、三菱和韩国的科学技术院都在设计可以帮助老弱病残者从一个房间进入另一个房间的机器，这样的机器还能帮着喂食、喂水、开关电视，甚至在必要时还可以帮着打电话叫医生。

今年年初，据外媒报道，IBM日本公司最近与四位合作伙伴，开启了一项全新的联合项目，这个项目的研究成果是，可以让加载人工智能技术的手提箱形状机器人引领、指导视障碍人士。据了解，这一项目的灵感来源于一名叫做Chieko Asakawa的IBM日本公司研究院，而她正是一位视力有问题的人。这一项目是由IBM日本公司负责开发，他们还将在这款机器人上面整合来自于IBM合作伙伴的专业技术，比如Alps Alpine Co.的触觉技术、欧姆龙的图像识别、清水公司的定位导航系统和三菱汽车的技术。这几家公司在2019年12月份就成立联合组织，共同研发此款机器人，他们预计在三年内将其实现商业化。据悉，此款机器人在未来将会在机场、商场以及室内设施中先行亮相，然后再通过进一步的改进实现户外应用。

以上的案例，都是人工智能技术如何从人的角度考虑，帮助老弱病残者正常生活。尽管人工智能在无障碍运用方面取得了令人鼓舞的进步，但仍然有很长的路要走。开发者们也需要时刻记住，他们不仅仅是为自己设计，而是为更广泛的人群设计。人工智能只有不断融入人文关怀，促进改善各种社会关系使之和谐，人们对人工智能未来发展的忧虑才会逐步消失，人工智能才能升华飞跃为人文智能。诚如马云所言，过去的机器是人类的工具，未来的机器是人类的合作伙伴。我们要明白机器不可能有智慧、使命、价值观和文化体系，人类最大的优势在于对文化的把握、对愿景的思考，以及巨大的想象力。未来，不是机器换人，而是机器扩人、机器升人、机器化人。

THU数据派

THU数据派"基于清华，放眼世界"，以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯，定期组织线下活动，分享前沿产业动态。了解清华大数据，敬请关注姐妹号“数据派THU”。

产业智能家居语音识别图像自动识别自动驾驶服务机器人人本人工智能

相关技术

感知

李飞飞人物

李飞飞，斯坦福大学计算机科学系教授，斯坦福视觉实验室负责人，斯坦福大学人工智能实验室（SAIL）前负责人。专业领域是计算机视觉和认知神经科学。2016年11月李飞飞加入谷歌，担任谷歌云AI/ML首席科学家。2018年9月，返回斯坦福任教，现为谷歌云AI/ML顾问。10月20日斯坦福大学「以人为中心的AI计划」开启，李飞飞担任联合负责人。11月20日李飞飞不再担任SAIL负责人，Christopher Manning接任该职位。

来源：个人主页维基百科

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来（Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)），自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展，但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个：首先，在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境，从而进行实时推论。第二，信息性决策需要准确的感知，目前大部分已有的计算机视觉系统有一定的错误率，这是自动驾驶导航所无法接受的。

来源：机器之心

机器学习技术

机器学习是人工智能的一个分支，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论，机器学习与推断统计学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法。

来源：Mitchell, T. (1997). Machine Learning. McGraw Hill.

人工智能技术

在学术研究领域，人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体（intelligent agent）

来源：Russell, S., & Norvig, P. (2003). Artificial Intelligence: A Modern Approach.

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术，包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等；而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。人脸识别是一项热门的计算机技术研究领域，它属于生物特征识别技术，是对生物体（一般特指人）本身的生物特征来区分生物体个体。

来源：维基百科

自动驾驶汽车技术

自动驾驶汽车，又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人，是自动化载具的一种，具有传统汽车的运输能力。作为自动化载具，自动驾驶汽车不需要人为操作即能感测其环境及导航。

来源：维基百科

虚拟现实技术

虚拟现实，简称虚拟技术，也称虚拟环境，是利用电脑模拟产生一个三维空间的虚拟世界，提供用户关于视觉等感官的模拟，让用户感觉仿佛身历其境，可以及时、没有限制地观察三维空间内的事物。用户进行位置移动时，电脑可以立即进行复杂的运算，将精确的三维世界视频传回产生临场感。

来源：维基百科

语音助理技术

虚拟助理（virtual assistant）是一种能替个人执行任务或服务的软件代理（software agent）。有时候“聊天机器人”泛指虚拟助理，亦或专指网络聊天使用的软件机器人（有时候更专指娱乐而非实用的网络聊天）。但也可以指一种职业，或者企业组织，其乃是透过网络执行远端服务。

来源：维基百科

计算机视觉技术

计算机视觉（CV）是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

来源：机器之心

神经网络技术

（人工）神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型，那时候研究者构想了「感知器（perceptron）」的想法。这一领域的研究者通常被称为「联结主义者（Connectionist）」，因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型，它们都是前馈神经网络：卷积神经网络（CNN）和循环神经网络（RNN），其中 RNN 又包含长短期记忆（LSTM）、门控循环单元（GRU）等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习，但也有一些为无监督学习设计的变体，比如自动编码器和生成对抗网络（GAN）。

来源：机器之心

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域，它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性，目前的语音识别系统只能在一定的限制条件下获得满意的性能，或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

来源：What is Automatic Speech Recognition?

强化学习技术

强化学习是一种试错方法，其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划（Dynamic Programming）。流行的强化学习方法包括自适应动态规划（ADP）、时间差分（TD）学习、状态-动作-回报-状态-动作（SARSA）算法、Q 学习、深度强化学习（DQN）；其应用包括下棋类游戏、机器人控制和工作调度等。

来源：机器之心