Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

mit.edu来源miggy编译

咳两声就能锁定新冠!MIT收集20万咳嗽样本,用AI辨别无症状感染者,准确率100%

10月25日,喀什地区疏附县24日发现1例新冠肺炎无症状感染者后,新疆迅速对其密切接触者、密切接触者的接触者进行核酸检测,截至10月25日14时,检测出137人呈阳性,经专家诊断,均为无症状感染者

后疫情时代,无症状感染者正成为疫情复发最大的威胁。没有任何胸闷发热症状,你和同伴可能很难区分是否感染了新冠。

人工智能可以,只要你给TA听听你的咳嗽声

在最近发表在《IEEE医学与生物学工程学杂志》上的一篇论文中,麻省理工学院的研究人员表示,他们已经开发出可以识别COVID-19感染者咳嗽声的AI

论文地址:

https://www.embs.org/ojemb/articles/covid-19-artificial-intelligence-diagnosis-using-only-cough-recordings/

据论文显示,研究小组开发了一种AI模型,该模型通过分析你的咳嗽录音,可以将无症状感染者与健康的人区分开来。所有人都可以通过网络浏览器以及手机和笔记本电脑等设备自愿提交的录音。

研究人员称,该模型由他们一直以来进行的“咳嗽检测阿尔兹海默早期症状”演变而来,疫情以来,研究者通过“网络众筹”的方式,已经在全球搜集了20多万的咳嗽样本,建立了有史以来最大的“咳嗽数据库

通过这些咳嗽样本和录入的相关感染、性别、情绪数据,对该模型进行了声音训练。

目前,该模型识别出确诊为Covid-19的人的咳嗽的准确率98.5%,其中,利用咳嗽声识别无症状感染者的准确度高达100%。 

麻省理工的研究小组正在努力将该模型整合到一个用户友好的应用程序中,如果获得FDA的批准并被大规模采用,该程序将有可能成为一种免费、便捷、无创的预筛查工具,以识别可能对Covid-19无症状的人。

用户可以每天登录,录下咳嗽声到他们的手机中,并立即获得有关他们是否可能被感染的信息。

麻省理工学院自动识别实验室的研究科学家布莱恩·苏比拉纳(Brian Subirana)与麻省理工学院自动ID实验室的Jordi Laguarta和Ferran Hueto联合完成了这项研究。 

从阿兹海默症检测到新冠检测 

其实这项算法并非为新冠定制。

早在疫情爆发之前,这个研究小组已经在咳嗽的手机录音中训练算法,以准确诊断肺炎和哮喘等疾病。麻省理工学院的团队正在以类似的方式开发AI模型,以分析强迫咳嗽记录,以查看它们是否可以检测出阿尔茨海默氏症的体征,这种疾病不仅与记忆力下降有关,而且还与神经肌肉退化(如声带减弱)有关。 

他们首先训练了一种通用的机器学习算法或称为ResNet50神经网络,以区分与不同声带强度相关的声音。研究表明,声音“ mmmm”的质量可以表明一个人的声带有多弱。Subirana在包含了1000多个小时语音的有声读物数据集上训练了神经网络,以从“ the”和“ then”等其他词中挑选出“ them”一词。 

该小组训练了第二个神经网络来区分言语中明显的情绪状态,因为已证明阿尔茨海默氏症患者以及神经系统较弱的人表现出某些情绪,例如沮丧或平淡无奇,比他们表达快乐还是冷静的情绪更高。

研究人员通过在大型演员数据集上训练情绪情感分类器(例如中性,平静,快乐和悲伤)来开发情绪语音分类器模型。 

然后,研究人员在咳嗽数据库上训练了第三个神经网络以辨别肺和呼吸功能的变化。 

最后,该团队将这三个模型结合在一起,并叠加了一种算法来检测肌肉退化。该算法通过实质上模拟音频蒙版或噪声层,并区分强咳嗽(通过噪声可以听到的咳嗽)与较弱的咳嗽,来做到这一点。

通过新的AI框架,该团队提供了包括阿尔茨海默氏症患者在内的音频记录,发现与现有模型相比,它可以更好地识别阿尔茨海默氏症的样本。

结果表明,声带强度、情绪、肺和呼吸功能以及肌肉退化是诊断该疾病的有效生物标志物。 

当冠状病毒大流行开始蔓延时,Subirana想知道他们针对阿尔茨海默氏症的AI框架是否也可以用于诊断Covid-19,因为越来越多的证据表明感染的患者会经历一些类似的神经系统症状,例如暂时性神经肌肉损伤。 

“说话和咳嗽的声音都受到声带和周围器官的影响。这意味着当讲话时,部分讲话就像是咳嗽,反之亦然。这也意味着我们很容易从流利的言语中衍生出一些东西,人工智能可以简单地从咳嗽中发现一些信息,包括人的性别、母语甚至情绪状态。实际上,您的咳嗽中蕴含着情感。” Subirana说。

“所以我们认为,为什么我们不尝试探究这些阿兹海默症的生物标志物(以及看它们是否与Covid相关)”。 

20万+咳嗽样本,已知最大的咳嗽研究数据集 

在4月,研究小组着手收集尽可能多的咳嗽记录,包括来自Covid-19患者的咳嗽记录。

他们建立了一个网站,人们可以通过手机或其他支持网络的设备记录一系列咳嗽。参与者还填写了他们正在经历的症状的调查表,无论他们是否患有Covid-19,是否通过官方测试,通过医生对其症状的评估或是否经过自我诊断而得到了诊断。他们还可以记录自己的性别,地理位置和母语。 

迄今为止,研究人员已经收集了70,000多条录音,每条录音包含多个咳嗽声,总计约200,000咳嗽音频样本,Subirana说这是“已知最大的咳嗽研究数据集”。确认患有Covid-19的人(包括无症状的人)提交了大约2500份录音。

该团队使用了2,500个与Covid相关的记录,以及他们从集合中随机选择的另外2500个记录来平衡数据集。他们使用了4,000个样本来训练AI模型。然后将其余的1,000个记录输入模型中,以查看它能否准确区分出Covid患者和健康个体的咳嗽。 

令人惊讶的是,正如研究人员在论文中所写的那样,他们的努力揭示了“阿尔茨海默氏症和新冠咳嗽算法之间惊人的相似之处”。 

他们发现,在原本用于阿尔茨海默氏症的AI框架内无需进行大量调整,他们就能找到针对Covid-19的四种生物标志物的模式-声带强度、情绪、肺和呼吸功能以及肌肉退化。该模型从Covid-19确诊的人中识别出98.5%的咳嗽,并准确地检测到了所有无症状的咳嗽。 

Subirana说:“我们认为这表明,即使您没有症状,当您拥有Covid时,您产生声音的方式也会改变。” 

100%检测到无症状感染者 

Subirana强调,这种AI模型的优势不在于检测有症状的新冠患者,不管他们的症状是由于Covid-19还是其他症状(如流感或哮喘)引起的。该工具的优势在于它能够分辨无症状新冠感染者的咳嗽和健康的咳嗽。  

MIT的团队正在与一家公司合作,根据他们的AI模型开发免费的预检应用程序。他们还与世界各地的多家医院合作,收集更大,更多样化的咳嗽记录集,这将有助于训练和增强模型的准确性。

正如他们在论文中提出的那样,“如果预筛查工具始终在后台并且不断改进,那么泛滥症就可能成为过去。” 

最终,他们设想可以将他们开发的音频AI模型集成到智能扬声器和其他听音设备中,以便人们可以方便地(也许每天)对他们的疾病风险进行初步评估。

相关链接:

https://news.mit.edu/2020/covid-19-cough-cellphone-detection-1029

https://techcrunch.com/2020/10/30/cough-scrutinizing-ai-shows-major-promise-as-an-early-warning-system-for-covid-19/

https://www.engadget.com/ai-covid-19-cough-detection-from-recordings-213858299.html

大数据文摘
大数据文摘

秉承“普及数据思维,传播数据文化,助⼒产业发展”的企业⽂化,我们专注于数据领域的资讯、案例、技术,形成了“媒体+教育+⼈才服务”的良性⽣态,致⼒于打造精准数据科学社区。

产业MIT机器学习神经网络
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

情感分类技术

情感分类是对带有感情色彩的主观性文本进行分析、推理的过程,即分析对说话人的态度,倾向正面,还是反面。

推荐文章
暂无评论
暂无评论~