2020/11/04 17:10

汪雨晴校对文婧编辑

仅次于癌症将成人类第二大杀手，面对抑郁症AI能做些什么？

近几年，关于抑郁症自杀的社会新闻层出不穷，让这个在过去一直被大众忽视的疾病逐渐浮出水面。上个月，话题#抑郁症成仅次于癌症的人类第二大杀手#登上微博热搜，大众终于对患抑郁症群体有了较直观的认识：抑郁症属于情感性精神障碍疾病，常伴随焦虑发生。临床体现为“三低”——情绪低落，兴趣减退，动力不足，且持续至少2周以上。抑郁还可能增加某些健康问题的风险，如心脏病。据世卫组织预测，到2020年，抑郁症将代替癌症成为世界第二大疾病，大约有8%的男性和15%的女性在他们的一生中会患上抑郁障碍, 严重影响生活质量, 并且其中有近 15%的人选择了自杀。此外，还有相当多的患者根本没有意识到自己患有抑郁症，更没有进行过诊治。因此, 对抑郁症患者进行早期识别诊断, 并及时给予治疗十分重要。近几年，人工智能变得越来越“聪明”，并开始在医疗领域取得一些成果。那么，人工智能技术能够在治疗抑郁症方面发挥什么作用吗？

一、发病预测

人工智能技术针对抑郁症的发病预测，目前主要是使用不同的机器学习方法，对可以反映抑郁症倾向的因子及各种疾病标志物来做出判断。目前, 应用于抑郁症的机器学习算法主要为传统机器学习, 如支持向量机、随机森林、K-近邻算法、浅层人工神经网络等。但近年来随着深度学习的发展, 卷积神经网络、自动编码器、深度置信网络等开始逐渐被应用于抑郁症研究中。利用机器学习建立抑郁症预测模型的基本原理为采集抑郁症风险因素、生物标记物等数据, 然后对这些数据进行预处理得到归一化的数据集, 按一定比例分为训练集和测试集, 利用训练集对机器学习算法进行训练, 最后用测试集对模型进行性能评估, 并在验证评估过程中对模型进行不断优化。

机器学习的优势在于对数据中潜在规律的挖掘。因此, 建立预测模型的第一步是收集数据。目前，研究的数据主要有年龄、性别、药物滥用等社会人口学资料, 临床收集的躯体症状、心理状态资料,医学仪器采集的脑电信号(Electroencephalography, EEG)、脑部核磁共振成像(Magnetic Resonance Imaging, MRI)、眼动数据、心率变异性参数等生理信号数据。其中基于脑电信号和脑部核磁共振成像的应用最为广泛, 但是由于MRI等生理信号的采集成本较高, 故研究者们逐渐探索采集成本低却能很好预测抑郁症的数据，比如语音、表情等。

另外，随着科技的进步，采集数据的方式也变得越来越多元化。除了MRI等生理信号的采集，还有包括基于问卷收集调查资料, 通过各类传感器采集健康数据, 从网络平台上获得公开数据等。随着近年来物联网技术的发展，使得各种可穿戴设备承载大量的健康信息, 很多研究者将这些数据通过机器学习应用于抑郁症领域，包括应用智能手机传感器APP来获取日活动度、睡眠情况、社会交流情况等数据来预测个体的抑郁情况。另外，移动互联网的普及让大量用户通过 Facebook、Twitter 等社交网络平台进行情感表达、日常沟通, 这些数据同样为研究者通过将自然语言处理技术、情感分析与机器学习结合来对用户的心理健康、情感障碍进行研究提供了机会。

例如2014年，中国科学院心理所计算网络心理实验室负责人朱廷劭发起了心理地图PsyMap项目。PsyMap通过网络爬虫整合微博树洞留言信息后，再通过AI对留言进行分析筛查，最后，再由志愿者对有自杀意向的人进行心理危机干预，试图在他们走向终结之前挽救生命。从2017年正式上线至2019年10月，心理地图PsyMap共计给4222人发送了干预私信；2018年，由荷兰阿姆斯特丹自由大学人工智能系教授黄智生开启了“树洞计划”。树洞计划寻找濒临危险的抑郁症患者的逻辑跟心理地图相差不大，都是利用AI进行筛查、分级，而后介入。但树洞计划的自杀危险程度分级更为明确，十级为最高级，即自杀正在开始；九级则是有明确的自杀计划。随后几级以悲观厌世的程度依次递减，在6级以下，志愿者一般不会直接介入。黄智生表示，运用知识图谱技术，AI机器人可通过监控留言分析一个人的情绪。几乎每个月，救援团都能救回50条生命，一年时间里，救援团阻止了约800次自杀。

不需要挖掘社交平台上的数据，而是借助了计算机视觉和机器学习的方法也能用来预测抑郁症指标。2017年，由哈佛大学和佛蒙特大学共同主导的一个项目以166位 Instagram 用户为研究样本，共分析了他们分享在平台上的43,950张照片，其中71张涉及患有抑郁症病史。据研究人员发表在EPJ Data Science上的论文显示，他们使用了机器学习工具成功识别出抑郁症的标志，并使用颜色分析、元数据组件和面部检测算法，从43,950张Instagram 照片中计算提取统计特征，而每张照片的色调、亮度以及使用的滤镜都是其重要的分析维度。研究结果表明，患有抑郁倾向的用户更倾向于发布更多照片，且颜色多为蓝色、灰色和深色；其次，他们使用的滤镜也更少；另外，患有抑郁倾向的用户也更喜欢发布人脸特写照片，但与健康的用户相比，其分享的每张照片出现的人脸数量更少。这可能表明，抑郁症患者更喜欢在小范围的社交环境中和人交往。同时，研究结果还表明，在利用机器学习分析了这些照片得到的模型之后，所得模型的表现优于普通医师诊断抑郁症的平均成功率。

除了采集语音、文字、图像等数据进行研究，机器学习与神经影像结合也取得了一定进展。一项研究将ML与MRI相结合预测抑郁症的发作，通过采集33名10~15岁少女各脑区的灰质、皮质厚度数据，采用支持向量机技术预测5年内抑郁症发作概率，总体准确率达到70%（敏感性69％，特异性70％。而韩国有研究者使用随机森林模型发现，家庭关系、社会关系和家庭收入的满意度对于构建抑郁症发病风险的预测模型很重要，说明使用调查数据预测抑郁症的未来发作有潜力。

总之，针对抑郁症的发病预测，目前主要是使用不同的ML方法对生理、行为数据进行分析。当前，此类研究还处于尝试阶段，未正式投入临床应用，但已显示出巨大潜力，未来可为抑郁症的一级预防提供支持。

二、早期识别

早期的抑郁症状很容易与单纯的情绪低落相混淆，不易被察觉，导致患者错失治疗的最佳时机。现阶段研究主要方向是将ML方法与脑电、语音信息、手机使用行为、可穿戴设备采集的信息以及文本自动分析技术相结合，对抑郁症人群进行早期识别。

例如2016年，南加州大学的研究人员开发了一款机器学习工具，它能够检测出某些语言相关的诊断标准，来评估患者的抑郁症情况。这款工具名为SimSensei，它在医生问诊过程中监听患者语言表达过程中的心理和神经性紊乱异常状况，这些异常很难被问诊者所察觉。研究者表示：“我们评估了253位实验对象的自动评估元音空间，证明了新的检测手段检测到抑郁症和创伤后应激障碍患者的元音空间有显著减小。我们证明了在测试部分交互或数量有限的语音数据时，新技术是健壮的，印证了该方法的实用性。最后，我们成功地显示了该测试结果在不同个体和不同发音速率上的统计鲁棒性。”

2017年，来自 IBM 的计算精神病学和神经成像研究小组团队开始尝试利用机器学习预测人患精神疾病的风险。该项目以 2015 年发表的研究作为基础，通过对 59 名普通人的语言方式追踪、分析，并对语言连贯性进行评分，确定潜在患病风险。59 位参与者在随后两年中，有 19 名出现了精神障碍，而 AI 预测的精确度达到 83%，这背后的判断依据，是 AI 技术发现处于精神疾病风险的人在说话时使用了较少的所有格代词，并且连贯句子较少，这可能是精神疾病的一部分前兆。不过，关于对于语言的分析是否能够适用于所有语种，以及不同病症是否会有不同的语言倾向，有待进一步研究。

2018年，斯坦福大学人工智能实验室与视觉实验室负责人李飞飞带领团队公布一种基于机器学习的抑郁症症状严重程度测量方法，该方法使用了视频、音频和文本数据集，以及因果卷积神经网络模型，通过表情和语音诊断一个人是否患了抑郁症，准确率超过80%。不仅如此，该模型还能部署到手机上，从而让更多的人能够进行诊断。值得一提的是，这项研究成果还入选了NIPS NeurIPS 2018医疗健康机器学习（ML4H）Workshop。

在抑郁症群体中，儿童是一个比较特殊的存在。据统计，大多数自闭症儿童的父母都是在孩子出生后1到3年才发现孩子的变化，在美国，这个年龄中位数为4.3岁。但是，大量研究表明，在综合征完全显现之前，进行早期干预可以降低ASD的严重程度，并改善儿童的大脑和行为发育。有没有一种方法可以缩短儿童出现症状到确诊中间的时间差呢？

2020年，一家位于加利福尼亚的公司推出一种新的自闭症谱系障碍（ASD）诊断工具Cognoa，它能在出现相关迹象的几周内做出ASD诊断，远快于当前的标准。Cognoa的技术来自斯坦福大学医学院儿科学副教授Dennis Wall实验室，依据于父母调查，家庭录像和临床医生问卷等数据。研究者表示，该工具的算法是根据来自数百个不同性别、种族和种族背景的实际案例的数据进行训练的，它不仅可以加快诊断时间，而且可以消除当前系统固有的许多偏差。

最近，该公司在美国各地的14个地点完成了一项关键的双盲临床试验。目前，关键试验的结果尚未公布，但该公司表示，此试验“已超过了FDA同意的目标基准”，在性别和种族上都是准确的。另外，这项研究于2019年7月至2020年5月进行，在今年春季新换大流行期间通过远程医疗对部分儿童进行了远程评估。在远程管理上，该工具的性能也一样好。公司计划在未来几个月内提交完整的研究报告以供发表，不久将正式提交FDA。如果获批成功，Cognoa将成为首个自闭症谱系障碍诊断工具。

目前，AI在抑郁症的早期识别方面取得了可观进展，可以降低人群中抑郁症早期筛查的假阴性率，为疾病早期诊断治疗提供更多可能。但同时也存在一定的误诊率，需要临床医师进一步诊断，因此不可完全依赖于AI的分析结果，需视应用场景而定。

三、辅助诊断

目前抑郁症的诊断是以精神科医师的精神检查为主，这虽然无法用技术替代，但为了实现更加客观、高效的诊断，AI技术逐步应用于对抑郁症患者的辅助诊断。其中，ML与MRI技术的结合，可以辅助诊断抑郁症，同时也可以反映抑郁症的严重程度。基于体素-相关向量机模型的诊断准确率为85%，敏感性为84%，特异性为85%，基于体素-特征形态-相关向量机模型的诊断准确率为90%，敏感性为93%，特异性为87%，后者虽提高了总体预测准确性，但提升幅度未超过5%。

国内也有研究者利用不同的ML方法，对脑电图、眼动追踪信息、皮肤电数据进行分析，准确度均在65%以上。将这3种模式组合用作分类器的输入，发现通过logistic算法获得的准确度最高为79.6％，在整体上提高了诊断准确性。例如，望里科技的AI抑郁评测系统利用脑电、眼动、皮电等信息采集的生理数据，对抑郁症进行客观的评估。通过复杂的数据运算，该系统可以寻找将抑郁症患者与健康人群进行有效区分的计算机模型。通过与北京大学第六医院的科研合作，目前望里科技的抑郁辅助诊断评估分类准确率已达到81%。据悉，未来该系统将拓展到自闭症、精神分裂、老年痴呆、暴力倾向等问题的研究和产品开发。并且，望里科技还在上述系统的基础上开发了自杀风险评估系统，这一产品被运用于服刑人员的心理管理，帮助狱警了解并管理服刑人员心理健康状况，达到预防服刑人员自杀的目的。该产品在教育、医疗领域也有应用的潜力。

AI技术也可以用于量表开发，促进情感障碍的高效鉴别诊断。通常，双相情感障碍与抑郁症难以鉴别，有研究者利用机器学习的RF模型来优化情感障碍评估量表，进而开发出更为简洁的中文双相情感障碍诊断清单，并将其应用于临床实践，便于对双相情感障碍和抑郁症进行快速有效的鉴别诊断。

四、治疗

1、疗效预测

事实上，机器学习在抑郁症诊疗中最突出、普遍的应用之一，就是其在药物治疗结果上的使用。因为抑郁症的发病机制目前仍不清楚，在过去50年抑郁症的药物治疗中，大约有 70%的病人是症状改善，还有30%的抑郁症病人是药物不起作用。如果检索在抑郁症诊疗中应用机器学习的期刊就会发现，大部分的论文都将重点放在了精神药物治疗上。

其中一项著名的研究利用机器学习对相关症状进行聚类，随后建立了一个机器学习模型来评估几种主要抗抑郁药物的疗效。结果发现了三组症状，并发现研究涉及的几种抗抑郁药的疗效存在统计学上的显著差异。这表明医生在给抑郁症患者开药时，应该根据患者所表现的具体症状对症下药。

除了对药物疗效进行预测，也可以通过ML方法对物理治疗的疗效进行有效预测。

2、心理治疗

当前，对于抑郁症的常规治疗方式是以心理治疗为主，药物治疗为辅。而利用人工智能技术对患者进行心理治疗，则是通过构建虚拟场景、虚拟人物，结合心理治疗师对抑郁症患者进行认知行为治疗、人际心理治

接受治疗的患者和VR环境的影像

2016年，英国伦敦大学学院等机构研究人员与西班牙同行开展一项研究，让15名年龄在23岁至61岁间的抑郁症患者配戴虚拟现实头盔，并通过与虚拟现实场景中的虚拟人物互动开展相关治疗。研究人员表示，虚拟现实头盔能让患者“代入”一个虚拟化身，在虚拟环境中与其中人物进行互动。试验中，研究人员让患者化身与一个情绪低落的虚拟小孩交流，学会如何向小孩表达同情心。在程序设定下，这个小孩会对患者化身的讲话产生积极反应，逐渐停止哭泣。然后研究人员让患者反过来“代入”到小孩身上，从小孩的视角来观察整个交流过程。每名患者接受3次这样的虚拟现实治疗。结果显示，完成疗程的一个月后，有9名患者的症状出现缓解迹象，其中4人的抑郁症严重程度下降十分明显。

借助虚拟现实技术开展心理治疗时，还可利用ML算法开发心理智能聊天机器人。例如2019年，Flow宣布推出其聊天机器人治疗师来治疗抑郁症。该款名为Flow的聊天机器人治疗师，每天与用户进行对话，并提供自助技术、情绪跟踪、精选视频、冥想和心理锻炼。它帮助用户了解为什么睡眠、锻炼、营养和冥想是抑郁症康复的主要支柱，并收集情绪数据以行为疗法为模型，提供个性化的反应。

随着5G的普及，相信虚拟现实技术能够突破硬件条件的限制，在治疗抑郁症方面有更多应用能够落地。尽管这种方式不能取代心理治疗师的角色，但仍提供了一种经济高效的治疗方案，同时也可以作为心理治疗的辅助工具在临床应用。

五、人工智能技术在抑郁症应用中存在的问题

目前，以抑郁症为代表的精神类疾病大多病因未明，遗传因素、社会心理因素、素质因素都可能与发病有关。业内有一句经典的比喻：现在人类对大脑的认知水平就好比在黑夜的足球场角落点了一支蜡烛。这形象地说明了当下人类认知的困境，而依赖人类输入知识进行判断的人工智能自然也受此影响。除此之外，在研究过程中还面临以下问题：

1、样本代表性较差

目前大部分基于人工智能对抑郁症诊疗的研究普遍样本量较小，不能很好地反映总体抑郁症人群的特征。如何实现智能手段对疾病的预测、鉴别、诊断、治疗，需要足够的样本数据充分覆盖每个群体的特征进行计算，避免出现由于抽样误差导致的数据偏倚。

2、智能设备相关的伦理问题

智能手机为代表的移动设备虽然为患者带来了诸多好处，但对加强隐私保密措施的研究仍然有限。尽管患者的信息通常是匿名的，但数据重新识别技术仍然对个人信息构成潜在威胁。由于抑郁症患者的特殊性，临床信息的泄漏可能会导致情绪创伤、恶化病情。因此，未来的政策应着重于隐私问题的解决，在数据的有益利用与个人隐私之间取得平衡。

3、临床应用面临的困难

因临床数据越来越复杂，研究人员必须处理不同类型、不同来源的大数据，如人口数据、图像数据、遗传信息数据、社交网络数据等。临床数据的多样性增加了设计算法和建立推理模型时的复杂程度和困难程度，因此大多数研究仅停留在模型建立等理论基础上，还未将大数据分析的成果转化为临床应用。

而至于AI+精神健康商业化发展，更是有很长的路要走，尤其是目前企业探索的部分诊疗方式正饱受质疑。其中，通过情绪识别来监控情绪并判别心理状态这一做法所受到的质疑最大。因为在高速运转的社会中，饱经规训的人们并不会把情绪明晃晃地写在脸上。为探讨情绪识别算法与真实情感的相关度，美国心理科学协会曾委托五位来自该领域的杰出科学家进行了数据收集和科学证明。最终，五位科学家给出的论文显示，情绪的表达方式多种多样，很难从一组简单的面部运动中可靠地推断出一个人的感受，表情与心情之间没有坚实的科学依据证明有直接关联。这也是为什么微软、谷歌、IBM、亚马逊等公司尚未将情绪识别算法投入诊疗市场的原因之一。

另外，患者的接受度也对人工智能的应用提出了考验。无论是心理咨询还是精神科问诊，都要求患者主观上对咨询师/医生充分信任，积极配合治疗。但目前，人类对AI的心理检测接受度普遍不高，这是由于心理检测中涉及很多主观判断，如焦虑、心境低落等等。人类医师具备共情能力，更易被患者认为“听懂了我的话”，而人工智能则易被视为“冷冰冰的机器”，难以获得信任。

所以，很多从业者认为，尽管AI对于抑郁症的诊疗研究，已在影像、智能穿戴、文本识别等方面有了突破，但它应该是最后的防线，而不应该是前线。真正能让抑郁症患者从阴霾中走出来的不是科技，而是有触感的关怀。而对于患者而言，自己的努力也非常重要，毕竟就像鲁迅所说，“人类的悲欢很多并不相通”，再专业的救助也很难做到完全将心比心，最终还是需要靠自己走出来。

THU数据派

THU数据派"基于清华，放眼世界"，以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯，定期组织线下活动，分享前沿产业动态。了解清华大数据，敬请关注姐妹号“数据派THU”。

产业抑郁症

相关向量机技术

相关向量机（Relevance Vector Machine，简称RVM）是Micnacl E.Tipping于2000年提出的一种与SVM（Support Vector Machine）类似的稀疏概率模型，是一种新的监督学习方法。

来源：百度百科

计算机视觉技术

计算机视觉（CV）是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

来源：机器之心

知识图谱技术

知识图谱本质上是语义网络，是一种基于图的数据结构，由节点(Point)和边(Edge)组成。在知识图谱里，每个节点表示现实世界中存在的“实体”，每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲，知识图谱就是把所有不同种类的信息（Heterogeneous Information）连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。知识图谱这个概念最早由Google提出，主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎，知识图谱可用来更好地查询复杂的关联信息，从语义层面理解用户意图，改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候，搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月，家庭情况等等。

来源：机器之心

神经网络技术

（人工）神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型，那时候研究者构想了「感知器（perceptron）」的想法。这一领域的研究者通常被称为「联结主义者（Connectionist）」，因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型，它们都是前馈神经网络：卷积神经网络（CNN）和循环神经网络（RNN），其中 RNN 又包含长短期记忆（LSTM）、门控循环单元（GRU）等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习，但也有一些为无监督学习设计的变体，比如自动编码器和生成对抗网络（GAN）。

来源：机器之心

随机森林技术

在机器学习中，随机森林是一个包含多个决策树的分类器，并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而"Random Forests"是他们的商标。这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林（random decision forests）而来的。这个方法则是结合Breimans的"Bootstrap aggregating"想法和Ho的"random subspace method" 以建造决策树的集合。

来源：维基百科

卷积神经网络技术

卷积神经网路（Convolutional Neural Network, CNN）是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层（对应经典的神经网路）组成，同时也包括关联权重和池化层（pooling layer）。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比，卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路，卷积神经网路需要考量的参数更少，使之成为一种颇具吸引力的深度学习结构。卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据，它可以被认为是以一定时间间隔采样的一维网格，又如图像数据，其可以被认为是二维像素网格。

来源：Goodfellow, I.; Bengio Y.; Courville A. (2016). Deep Learning. MIT Press.维基百科

准确率技术

分类模型的正确预测所占的比例。在多类别分类中，准确率的定义为：正确的预测数/样本总数。在二元分类中，准确率的定义为：(真正例数+真负例数)/样本总数

来源：Google ML Glossary

逻辑技术

人工智能领域用逻辑来理解智能推理问题；它可以提供用于分析编程语言的技术，也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑（Propositional Logic ）以及一阶逻辑（FOL）等谓词逻辑。

来源：机器之心

支持向量机技术

在机器学习中，支持向量机是在分类与回归分析中分析数据的监督式学习模型与相关的学习算法。给定一组训练实例，每个训练实例被标记为属于两个类别中的一个或另一个，SVM训练算法创建一个将新的实例分配给两个类别之一的模型，使其成为非概率二元线性分类器。SVM模型是将实例表示为空间中的点，这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后，将新的实例映射到同一空间，并基于它们落在间隔的哪一侧来预测所属类别。

来源：Wikipedia

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话，通过图灵测试。聊天机器人可用于实用的目的，如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统，但大多简单的系统只会撷取输入的关键字，再从数据库中找寻最合适的应答句。

来源：维基百科

因果卷积技术

因果卷积首次是在 WaveNet（van den Oord et al., 2016）论文中提出，从直观上来说，它类似于将卷积运算「劈」去一半，令其只能对过去时间步的输入进行运算。对于一维卷积来说，因果卷积可以简单将一般卷积的输出移动几个时间步而实现。

来源：机器之心

假阴性技术

假阳性是指模型因为种种原因将应该分类成特定情况的人/物错误地分类到了其他分类的情况。

自然语言处理技术

自然语言处理（英语：natural language processing，缩写作 NLP）是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言；自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

来源：维基百科

物联网技术技术

物联网（英语：Internet of Things，缩写IoT）是互联网、传统电信网等信息承载体，让所有能行使独立功能的普通物体实现互联互通的网络。物联网一般为无线网，而由于每个人周围的设备可以达到一千至五千个，所以物联网可能要包含500兆至一千兆个物体。在物联网上，每个人都可以应用电子标签将真实的物体上网联结，在物联网上都可以查出它们的具体位置。通过物联网可以用中心计算机对机器、设备、人员进行集中管理、控制，也可以对家庭设备、汽车进行遥控，以及搜索位置、防止物品被盗等，类似自动化操控系统，同时通过收集这些小事的数据，最后可以聚集成大数据，包含重新设计道路以减少车祸、都市更新、灾害预测与犯罪防治、流行病控制等等社会的重大改变，实现物和物相联。

来源：维基百科百度百科 MBA智库

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合，这些对象与同一个簇中的对象彼此相似，与其他簇中的对象相异。“物以类聚，人以群分”，在自然科学和社会科学中，存在着大量的分类问题。聚类分析又称群分析，它是研究（样品或指标）分类问题的一种统计分析方法。聚类分析起源于分类学，但是聚类不等于分类。聚类与分类的不同在于，聚类所要求划分的类是未知的。聚类分析内容非常丰富，有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

来源：百度百科

阿呆科技机构

望里科技致力于用技术手段探索和理解人类大脑，帮助人们改善精神健康。

https://www.wangli-tech.com/wonderlab_website/index.html