昨日(5 月 21 日),清华大学「智能人机交互研究中心」成立仪式在清华大学李兆基科技大楼举行。这是继「知识智能研究中心」、「基础理论研究中心」后,清华大学 AI 研究院第三个研究中心。
清华大学副校长、清华大学 AI 研究院管委会主任尤政院士和清华大学 AI 研究院院长张钹院士出席成立仪式,共同为中心揭牌。
尤政院士在致辞中表示,成立智能交互研究中心是清华大学推进人工智能发展的重要举措,也是清华大学 AI 研究院的里程碑事件。
图说:智能交互中心成立仪式合影
「人工智能的重要需求来自人机交互。」张钹院士在致辞中表示,⼈机交互核⼼问题是⾃然⾏为的意图理解,而解决这一核心问题必须要经过跨学科的研究。
为了更好汇聚清华大学在智能人机交互方面多学科的优势研究力量,清华大学 AI 研究院决定成立智能人机交互研究中心(英文:Intelligent Human Computer Interaction Research Center,简称 THUII,以下简称「智能交互中心」)。
史元春教授(清华大学计算机系「长江学者」特聘教授、清华大学全球创新学院 GIX 院长)被聘请为智能交互中心主任,高文教授(中国工程院院士、北京大学博雅讲席教授、信息科学技术学院院长)和戴国忠研究员(中科院软件所人机交互技术与智能信息处理实验室首席研究员)被聘请为智能交互中心学术顾问。
图说:尤政院士(左)、张钹院士(右)为史元春教授(中)颁发聘任证书
研究团队聚集了计算机系、心理学系、生物医学工程系、美术学院、工业工程系、社会科学学院等 6 个院系的专家学者。
三大使命
计算设备、传感器、数据和算法日益增多增强,马克•维瑟憧憬的普适计算时代已经到来。人们可能访问的计算设备和数据增多了,人机关系也变得更加丰富了。交互技术已经成为终端和应用创新的核心竞争力。
但普适计算时代下的自然交互存在诸多挑战,比如,用户心智模型的不可见性,传感器数据噪声,以及需要适应个体、环境的差异性等。
智能人机交互需要解决用户认知机理建模、用户行为的计算表征、交互意图的理解算法、自然界面生成方法以及情景感知等问题,为用户与计算设别间自然高效的信息交换提供理论基础和优化方法。
因此,智能交互中心的成立,有了三大使命:
一、开展基础理论。在人机交互、智能交互方面,探索自然交互的科学问题,建立通过智能技术实现自然交互的理论基础;
二、构建开放平台。建设典型自然交互应用中的用户心理和行为数据库,提供脑机交互实验系统,建成清华大学智能交互开放平台;
三、促进交流合作。举办开放的、国际化的与智能人机交互相关的学术活动,增进学术交流;普及智能人机交互技术,促进产学合作。
尤政院士表示,智能人机交互研究中心将以促进清华和国家人机交互研究与发展为宗旨,打造具有广泛影响力的学术研究、交流中心、智能交互平台与原创技术推广中心,更好地服务于国家和清华的人工智能发展战略。
八个研究内容
史元春教授对智能交互研究中心的八个研究内容做了介绍:
(一)自然交互行为的意图理解:在自然交互界面上,用户不再是严格地通过离散明确的交互操作完成交互,而是通过连续、非确定的多模态数据表达交互意图。
在解释用户的交互意图时,既可以使用「黑盒子」的机器学习方法,也可以利用「白盒子」的基于用户行为建模的方法。后者中的用户建模,其本质是通过计算的方法来刻画用户的行为能力,对于理解用户意图和探索自然交互的计算原理具有重要的科学意义。
在意图推理任务中,贝叶斯方法具有优势。
(二)多模态交互感知:多模态交互行为的智能感知是自然交互的基础。该研究内容的核心是识别具有高可用性的自然输入动作,创新成本可控、易于部署的感知技术。
(三)认知心理:认知心理学是对人类感知觉信息加工处理过程及其机制的探索,是人机交互设计与优化的基础和关键支撑。对积极心理的深入研究,有望为提升人机交互自然性提供重要的指导建议。
(四)情感计算与情感交互技术:是和谐人机交互的核心技术之一。
清华大学团队针对海量网络数据,在情感认知特性的可计算性、跨模态异构数据的情感建模、美学认知的建模、面向网络用户的情感交互等方面开展了深入研究。
(五)脑-机接口:基于大脑神经解码提供了新的智能交互方式,在残疾人康复、健康人群增强等方面具有重要的科学意义和应用前景。
(六)人因与工效学:具体包含生理人因学、认知人因学和组织人因学。
(七)人机融合的智能增强:研究人与机器两类智能体的双向耦合机制,突破阻碍人与机器智能双向沟通的技术瓶颈,构建可互相适应、协同工作的异构智能持续反馈回路,实现人与机器自然、生动、自适应的智能融合。
(八)交互设计:立足于艺术设计和人工智能技术的有机结合,从用户体验的角度出发,探索新技术所带来的可能性。
四个开放平台
智能人机交互研究中心成立仪式后,史元春教授还发布了四个智能交互开放平台:智能文本输入开发套件 ITIS、人机互启发式英文写作系统 ESODA、情感交互数据库 ACP、视觉脑机交互实验系统 VBCI。
易鑫博士、陶品副研究员、贾珈副教授、王毅军研究员分别对四个开放平台做了介绍。
(一)智能文本输入开发套件 ITIS:
ITIS 针对文本输入任务中对用户输入意图的准确推理问题,从用户输入行为建模、输入意图推理算法、人机交互设计和技术评测四个方面提供数据和方法的支撑,推进文本输入这一基础而重要的人机交互任务在新一代交互场景下的体验显著提升。
其包含真实用户在多交互平台上的文本输入原始数据、智能文本输入意图推理算法、多交互界面上可直接使用的文本输入技术方案和文本输入技术评测任务集。
(二)人机互启发式英文写作系统 ESODA:
「人工智能 AI『陪』您一起写作!让天下没有难写的论文!」
该产品专注于研究人机智能互启发式的 AI+Writing 全新写作交互技术,为学者从事英文学术论文写作提供智能化的新平台。
拥有 3300 万条优质英文学术论文例句,涵盖计算机、工程学、物理学、天文学、生物学、生态学、神经科学、地球科学、能源科学、医疗卫生、动物学等众多学科领域,更可根据用户自定义论文集作建立个性化学术领域,向作者提供英文写作句法、词汇搭配及替换的智能化专业建议。
通过智能化感知与交互技术,由用户向机器自然的传达英文写作意图,同时让计算机的智能计算结果优雅地为用户提供协助,实现人机智能互启发式的高效语言组织,帮助到广大学者进行更准确、更专业地完成论文写作。
(三)情感交互数据库 ACP:
包含多模态情感计算数据库、心理健康数据库、美学计算数据库。
其中,多模态情感计算数据库包含语音、文本、图像情感交互数据。
语音情感交互数据库:包含 753 万句基于人机语音交互系统采集的语音情感数据,具有类别和维度的情感标签,特征包括语音、文本、用户属性和地理位置。
文本情感交互数据库:包含 178 万用户的 10 亿条文本,以情感类别为标签,特征包括文本、图像、表情符、用户属性、用户网络角色和社交关系。
图像情感交互数据库:包含约 35 万带情感的图片,特征包括图片的发布时间、标题、标签、描述等。
心理健康数据库中不仅有中文用户的数据、还有英文用户的数据。
中文用户心理健康数据库:包含 2 万用户的 50 万条文本,标注了抑郁倾向、压力源和压力水平,包括文本、图像、表情符、用户属性、社交关系等特征。
英文用户心理健康数据库:包含 2800 用户的 60 万条文本,标注了抑郁倾向,包括文本、图像、表情符、用户属性、社交关系等特征。
美学计算数据库中则涉及服装美学和图像美学。
服装美学数据库:包含男女装各分类图片 13 万张,以美学维度坐标值和美学类别为标注,数据包含颜色、材质、版型、场合、季节等特征。
图像美学数据库:包含约 12 万带有美学评价的图片,以美学评价词作为标签,特征包括图片特征和美学相关的文本描述。
(四)视觉脑机交互实验系统 VBCI:
通过视觉诱发电位脑机接口技术将大脑意图转化为控制指令,为用户提供视觉神经编解码的通用软硬件系统框架,帮助用户快速实现个性化视觉脑机交互应用的方案设计、参数优化、以及性能测试验证。
VBCI 集成了视觉刺激呈现、脑电采集、脑电分析、控制反馈四大功能模块,兼容 NeuroScan、Neuracle、Wearable Sensing 等多种脑电采集设备,可根据用户需求构建个性化脑电控制指令集,提供多种视觉诱发脑电检测算法,实现脑开关、数字拨号、文字输入、机械臂控制等应用。
「除了促进我们研究院自己的分析研究、同行的交流,我们希望通过开放平台能够扩大合作的可能和成果影响的面,我们也希望能够带动产业进步。」史元春教授这样阐释发布开放平台的出发点。
她还表示,「开放平台今天是第一次,未来会有更多。」
智能交互中心官网:http://ai.tsinghua.edu.cn/thuii/