Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

作者:李亚洲、李泽南

9102年,你已经是个大春节了,你要自己学会用AI了

贴春联、发压岁钱、看春晚,这已经是老编度过的 25 个春节的老套路了。虽然老家拥挤的网络影响了抢红包的速度,但作为人工智能从业者,在猪年的春节期间我们还是发现了越来越多人工智能技术的身影。

2019 年,AI 为我们「渐渐无趣」的春节增色不少……它不仅可以帮助人们送出新年祝福,也能为人高效传递信息。在繁忙的春运期间,人工智能也能帮助人们更快地回到家乡。已到大年初三,让我们看看已有哪些公司的新技术融入了传统节日吧。

百度 AI「刷脸」生成春联

在 1 月 28 日小年夜的晚会上,百度推出了智能春联工具。基于人脸识别自然语言处理人工智能技术,这项技术可以凭借用户的人脸特性,为你生成充满创意的个性化春联。当然,用户也可在这个小工具中输入名字、甚至任何一段话,获取属于自己的专属春联。

在智能春联的背后,是计算机视觉自然语言处理等 AI 技术。据介绍,百度通过先进的视觉技术让 H5 具有刷脸能力,通过其中的人脸检测、属性分析和人脸融合等,可对图片中的人脸进行检测,分析人脸对应的年龄、性别、颜值、微笑指数、是否佩戴眼镜等信息,并通过以一个词语概括人脸的特性;进而将图片中的人脸与指定模板图中的人脸进行融合,得到新的图片。这些技术的难度在于,需要对各种角度的人脸进行检测,并且能够提取人脸的五官特征,以便生成与原始人脸相似,但也和模板人脸神似,且毫无违和感的新图片。

上传百度 AI 技术生态部总经理喻友平的照片生成的对联

思必驰《经典咏流传》

小年夜,在朋友圈刷屏的还有中央电视台《经典咏流传》节目中出现的一款「读诗成曲」在线互动小工具。据统计,节目播出后的 90 分钟内,超过 14 万人次参与合成自己的歌,H5 转发量超过 10 万。

在这款互动小工具中,用户仅需要朗读一段诗词,就可以听到用自己声音演唱的经典诗词唱段。据机器之心了解,这款火热的小工具背后是思必驰提供的个性化歌声合成、语音识别等独家 AI 技术支持。

而其中尤其关键的是个性化歌声合成技术。据思必驰介绍,歌声合成技术是在语音合成(TTS-Text to Speech)技术上衍生出来的,其关键区别在于韵律预测模型的不同。在普通 TTS 系统中,通常有个韵律模型来根据句子的内容和语调环境预测每个音素(音节)的时长和音高曲线。在歌声合成中,这个韵律模型则更换成由乐谱来预测每个音素(音节)的时长和音高的歌曲韵律模型。最终的生成过程仍然跟语音合成类似,将韵律参数和频谱参数结合,生成歌声。

经典春晚也时髦

Oben 虚拟主持人

「虚拟主持人」现在已经可以主持春晚了。1 月 29 日,央视网络春晚在 CCTV3 播出,世界首个人工智能虚拟主持人团队正式登台。央视名嘴撒贝宁、朱迅、高博、龙洋的个人人工智能(PAI)主持人——「小小撒」、「朱小迅」、「高小博」、「龙小洋」全程主持央视网络春晚,为我们带来了全新体验。

虚拟主持人可以 24 小时直播,而且支持多种语言。"小小撒"一出场,撒贝宁就忍不住打量了一番:"感觉就像照镜子一样。"

据 ObEN 介绍,想让真实主持人进入虚拟世界并非想象中那么复杂。在节目开始之前,技术人员对撒贝宁等主持人进行了面部扫描,并输入了半小时的录音数据以生成形象和声音模型。在表演中,任何输入的文字都可以用撒贝宁的声音读或唱出来,甚至还有中日英韩四种语言。随着训练数据越来越多,小小撒会掌握更多技能,甚至了解撒贝宁的喜好、说话方式等,在更多方面上与本人更加相似。

科大讯飞春晚智能文稿唱词系统


据讯飞听见官方微博信息,讯飞听见为 2019 年中央电视台的春节联欢晚会提供了字幕制作支持。央视技术团队采用了讯飞听见的智能文稿唱词系统,通过最新的智能语音转写技术,原先 1 小时的节目只要 5 分钟就可以完成字幕制作,而且准确率高达 95%。

机器之心了解到,讯飞听见智能文稿唱词系统是科大讯飞专门面向广播、电视、新媒体等工作者,在录音整理成文稿和字幕制作时,解决过程繁琐效率低下等问题,推出的一款以语音转写、文本翻译等为核心的字幕与文稿制作的产品。在语音支持种类方面,讯飞听见智能文稿唱词系统支持中、英、粤、维四个语种的字幕制作,还支持中英、汉维互译,本地部署翻译引擎,确保数据安全。

春节作为最传统的节日,已经成为了人工智能这样最先进技术的实验现场。

优必选机器人 Walker 春晚伴舞

在今年的春晚舞台上,我们再次看到了优必选机器人的精彩亮相。央视春晚深圳分会场上,优必选 大型仿人服务机器人 Walker 为明星韩雪、关晓彤、王嘉、魏大勋、台风少年团参与的歌舞节目《青春畅想》当起了伴舞。

据了解,这是自 2016 年以来,优必选机器人第三次亮相央视春晚。今年,为了保证 Walker 圆满完成春晚任务,优必选直接、间接动用了大概 100 人以上的人力,并安排了 40 多人的研发团队在春晚节目现场支持,其中的技术团队包括视觉、导航、通信、伺服舵机、运动控制、结构、电子、交互等,每一部分的负责人都在彩排准备现场随时待命,手机也要保持 24 小时开机待命状态,最终保证春晚顺利进行,让大家能看到首个中国企业自主研发的大型仿人机器人。

百度春晚 AI 红包互动

如果你看过去年的春晚,就能注意到百度曾经展示了港珠澳无人车技术。今年的春晚上,作为央视 2019 春晚独家网络互动平台,百度则展示了惊艳的人工智能体验,在互动形式、互动奖品中都透露着浓浓的 AI 元素。

首先,在今年红包互动中,百度首次加入了语音搜索抢红包,参与者可以通过说出关键词「欢乐幸福年」的方式来获得红包;其次,在奖品上百度免费向春晚观众派送数量可观的小度智能硬件。按照百度副总裁王路的话说,百度希望让每一位参与春晚互动的观众都能体验到无所不在的人工智能,让春节、春晚也迈入人工智能时代。

春晚之前是团圆

阿里机器人主持央视春晚彩排直播

除了春晚当天,其实彩排与前期准备也应用了很多 AI 技术。1 月 31 日,央视新闻频道在报道 2019 年春晚彩排直播时,启用了一位特殊的「主持人」——由阿里巴巴人工智能实验室自主研发的机器人「天猫精灵福袋」(以下简称「福袋」)与真人主持搭档出镜,为观众共同揭秘 2019 年央视春晚台前幕后的故事。

据介绍,今年央视新闻将在春晚彩排直播中全程使用机器人主持,「福袋」不仅需要需要根据节目设计回答主持人的提问,与真人进行互动,完成「唱歌跳舞」等指定动作,还会与春晚演播室前方的记者进行直播连线,甚至还将在直播中参与用户的有奖互动环节。

在直播中,机器人「福袋」展现的「主持能力」虽然还比不上主持人的反应敏捷,但在人工智能大数据的加持下,对「春晚金句」和各种典故的熟练运用,也让央视的工作人员感到十分惊喜。主持人王言表示,虽然这并不是首次和机器人搭档主持,但福袋的表现依然让他感到惊讶,「过去使用的一些机器人,都是为节目量身定制的,但这一次我们使用的是『公开版』,在这么重大的直播前我也只和福袋见了两次面,就能配合的这么好,真的是没想到。」他还跟现场进行技术支持的阿里巴巴工程师笑着说:「如果科学家们再『努力』一点,可能我就要下岗了。」

微软央视联手让 AI 为你唱歌

春晚之前是团圆,我们总会回忆起以前节日里不可或缺的团圆时刻,那么 AI 能理解当时的心情吗?不久之前,央视新闻官方微博发布了一个 HTML5 网页《你的生活 AI 为你唱作》,我们借助它体验了一把 AI 为自己歌唱的感觉。用户只要上传 1 到 4 张最爱的、最喜欢回忆的照片,AI 就能以说唱的形式为你作词、为你谱曲。

你的生活 AI 为你唱作:http://cctvsongbot.newscctv.net/index.html

小编体验发现,在上传图像后,我们可以选择两种语音进行创作,即央视主持人康辉与微软智能女声晓晓。其实生成的「歌曲」更像是一种带背景音乐的 Rap,不过歌词都非常有意思。例如我们上传机翼和天空的照片,歌词就会体现出「自由」的主题;又如上传高山草甸的图像,歌词会先描述广阔金色,再上升到畅想未来,真的是很有情怀了~

整体上 H5 会利用微软的技术对图像进行识别计算、制作抒情诗,并从央视现有曲库中挑选匹配的曲目,进行合并从而创作歌曲,最后再由央视主持人或微软智能女声演唱。因此从技术的角度来看,微软可能会利用 CNN 抽取图像特征,再将特征传入 LSTM 等时序模型生成抒情诗,最后利用 NLP 编码抒情诗、并检索对应的曲目,最后生成歌曲。

此外,这个 H5 也会特别关注隐私性,其承诺所有图像及创作结果都只在 H5 服务器保留 7 天,且央视和微软不会用于其它任何目的。

支付宝刷脸坐高铁

大年初三,随着返城期即将到来,人工智能技术在春运期间也能展现自己的能力。在刷脸、二维码等技术的基础上,广深高铁于春运开始第一天就宣布:乘客自 1 月 21 日起可通过手机上的支付宝小程序直接刷码进站——忘带身份证也没问题了!这也就意味着,使用手机就能乘火车了,像扫码坐公交地铁一样方便。更为便捷的是,乘客无须事先网络购票或在售票窗口排队购票,出行当天可直接使用支付宝刷码进站。

为了有效打击黄牛党,以往坐火车,在购票、进站等环节都需要用到身份证进行认证。而支付宝在实名制的基础上,加上「刷脸」认证技术和金融级的安全技术能力,可以确保乘客为本人购票。据铁路部门的推算,使用人工智能技术验证的整个过程耗时仅需 3 秒,相比之前现场核验身份等流程,平均节省时间 15 分钟以上。

目前,广深城际铁路全线各站都已支持支付宝扫码乘车。乘车前,乘客打开支付宝 APP,搜索「广深城际扫码通」,按照系统提示刷脸完成身份认证即可开通相关功能。出行当天就能直接使用支付宝刷码进站,无需到窗口和自动售票机排队购票或提前在网上购票。旅客刷码进站成功后,将会收到一条短信,告知最近一班火车的车次、座位号。进站时按照二等座全程费用预扣费,到达目的地后,系统会按照实际产生的票价计费,十分方便。

产业人工智能
1
相关数据
科大讯飞机构

科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,长期从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究并保持了国际前沿技术水平;积极推动人工智能产品研发和行业应用落地,致力让机器“能听会说,能理解会思考”,用人工智能建设美好世界。2008年,公司在深圳证券交易所挂牌上市。

http://www.iflytek.com
Microsoft机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
思必驰机构

思必驰是国内领先的对话式人工智能平台公司,拥有全链路的智能语音语言技术,自主研发了新一代的人机交互平台(DUI),和人工智能芯片(TH1520);为车联网、IoT、以及众多行业场景合作伙伴提供自然语言交互解决方案。 思必驰拥有上千项知识产权,是国际上极少数拥有自主知识产权、中英文综合语音技术的公司之一;与阿里、腾讯、小米、富士康、OPPO、长虹、顺丰、龙湖地产等企业达成战略合作;旗下人工智能产业基金累计投资20+家生态企业。

http://www.aispeech.com/
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。

https://www.alibabagroup.com/
百度智能云机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://www.baidu.com
暂无评论
暂无评论~