Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

全球首个AI手语主播亮相,让听障人士平等享受视频带来的快乐

近日,由国家广播电视总局、国家互联网信息办公室和四川省人民政府指导,中国网络视听节目服务协会、成都市人民政府主办的中国网络视听大会在成都举办。在主题为“AI改变视频未来”的智能视频高峰论坛上,爱奇艺技术团队发布了全球首个AI手语主播。该产品将AI技术与爱奇艺自制的3D虚拟偶像-奈奈进行结合,通过语音识别新闻中播报的内容,自动转换成手语,为听障人士提供全新的观影体验,引爆了2018中国网络视听大会。

爱奇艺副总裁谢丹铭表示:“爱奇艺希望把快乐传递给更多的人,不仅仅是一般人,也让听力有障碍的特殊人群可以享受到更丰富的娱乐体验。”

2017年统计数据显示,我国听障人群数量达到2780万,占中国人口总数的1.67%。放眼世界,世界卫生组织发布的数据显示,全世界有共计约3.6亿人听力具有不同程度的损失。尽管听障人群能够凭借手语进行交流,但实际生活中仍然面临一些亟待解决的问题。首先,对于听障人士来说,他们的第一语言是手语,虽然受教育的听障人士也能够使用文字进行交流,但是对于他们来说,手语是更容易于使用和接受的交流方式。其次,目前大部分公共服务并没有配备专门的手语翻译人员,听障人群的日常生活仍存在障碍,并且目前市面上也缺乏专门给听障人士观看的视频节目。

此次爱奇艺推出AI手语主播,旨在通过科技手段探索语音与手语之间智能转换,探索帮助听障人群在不同实际场景中实现信息共享的途径。

此次 AI手语主播的亮相,也是爱奇艺在视听技术研发领域的长期积累的一次展示。AI手语主播的工作原理是通过自动语音识别技术(ASR),准确识别视频中的语音并转换为文字,然后NLP技术将文字转换为手语内容,之后通过虚拟偶像进行输出。整个产品把虚拟偶像和爱奇艺的ASR、NLP等AI技术进行结合,从而达到自动手语翻译的效果;通过爱奇艺AI的语义理解能力,AI手语主播能够对健听人自然语言进行理解,并且智能翻译为手语表达;及其深度学习和训练则后续不断优化翻译效果。值得一提的是,这也是爱奇艺自制的虚拟偶像-奈奈的首次落地,“AI + 虚拟偶像”的结合则给AI翻译赋予了形象丰富的3D虚拟形象,不仅直观地展示手语,可定制的形象也让这项技术能够适应不同场景的需求。

爱奇艺AI手语主播技术负责人李海介绍,AI手语主播会率先在爱奇艺自制节目上进行落地,为听障人士带来更多元、定制化的娱乐观看体验。未来,AI手语主播会与新闻播报、天气预报、手语学习等场景相结合,服务于听障人群的生活需求。AI手语主播的落地,将为听障人群更好地享受视听服务,参与社会生活提供便利。

爱奇艺致力于通过AI技术,不断创新与完善用户体验,让用户随时随地都能够享受视频带来的快乐。

爱奇艺技术产品团队
爱奇艺技术产品团队

爱奇艺做一家以科技创新为驱动的伟大娱乐公司,用大数据指导内容的制作、生产、运营、消费。并通过强大的云计算能力、带宽储备以及全球性的视频分发网络,为用户提供更好的视频服务。

产业手语主播爱奇艺ASR语音识别
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

爱奇艺机构

2010年4月22日正式上线,推崇品质、青春、时尚的品牌内涵如今已深入人心,网罗了全球广大的年轻用户群体,积极推动产品、技术、内容、营销等全方位创新。企业愿景是做一家以科技创新为驱动的伟大娱乐公司。于2018年3月29日在纳斯达克上市。

http://iQIYI.COM
推荐文章
暂无评论
暂无评论~