近日,由国家广播电视总局、国家互联网信息办公室和四川省人民政府指导,中国网络视听节目服务协会、成都市人民政府主办的中国网络视听大会在成都举办。在主题为“AI改变视频未来”的智能视频高峰论坛上,爱奇艺技术团队发布了全球首个AI手语主播。该产品将AI技术与爱奇艺自制的3D虚拟偶像-奈奈进行结合,通过语音识别新闻中播报的内容,自动转换成手语,为听障人士提供全新的观影体验,引爆了2018中国网络视听大会。
爱奇艺副总裁谢丹铭表示:“爱奇艺希望把快乐传递给更多的人,不仅仅是一般人,也让听力有障碍的特殊人群可以享受到更丰富的娱乐体验。”
2017年统计数据显示,我国听障人群数量达到2780万,占中国人口总数的1.67%。放眼世界,世界卫生组织发布的数据显示,全世界有共计约3.6亿人听力具有不同程度的损失。尽管听障人群能够凭借手语进行交流,但实际生活中仍然面临一些亟待解决的问题。首先,对于听障人士来说,他们的第一语言是手语,虽然受教育的听障人士也能够使用文字进行交流,但是对于他们来说,手语是更容易于使用和接受的交流方式。其次,目前大部分公共服务并没有配备专门的手语翻译人员,听障人群的日常生活仍存在障碍,并且目前市面上也缺乏专门给听障人士观看的视频节目。
此次爱奇艺推出AI手语主播,旨在通过科技手段探索语音与手语之间智能转换,探索帮助听障人群在不同实际场景中实现信息共享的途径。
此次 AI手语主播的亮相,也是爱奇艺在视听技术研发领域的长期积累的一次展示。AI手语主播的工作原理是通过自动语音识别技术(ASR),准确识别视频中的语音并转换为文字,然后NLP技术将文字转换为手语内容,之后通过虚拟偶像进行输出。整个产品把虚拟偶像和爱奇艺的ASR、NLP等AI技术进行结合,从而达到自动手语翻译的效果;通过爱奇艺AI的语义理解能力,AI手语主播能够对健听人自然语言进行理解,并且智能翻译为手语表达;及其深度学习和训练则后续不断优化翻译效果。值得一提的是,这也是爱奇艺自制的虚拟偶像-奈奈的首次落地,“AI + 虚拟偶像”的结合则给AI翻译赋予了形象丰富的3D虚拟形象,不仅直观地展示手语,可定制的形象也让这项技术能够适应不同场景的需求。
爱奇艺AI手语主播技术负责人李海介绍,AI手语主播会率先在爱奇艺自制节目上进行落地,为听障人士带来更多元、定制化的娱乐观看体验。未来,AI手语主播会与新闻播报、天气预报、手语学习等场景相结合,服务于听障人群的生活需求。AI手语主播的落地,将为听障人群更好地享受视听服务,参与社会生活提供便利。
爱奇艺致力于通过AI技术,不断创新与完善用户体验,让用户随时随地都能够享受视频带来的快乐。