机器之心原创
编辑:张倩
这些应用或许没有那么「重磅」,但却越来越有温度。
关注 AI 领域的小伙伴可能留意到了一个现象:真正能帮上人的应用越来越多了。
比如,在生产领域,甘肃的牧民早就开始用 AI 在数羊、相牛了;在信息无障碍领域,越来越多的听障、语障人士开始借助 AI 听到外界的声音(语音转文字),然后再借助 AI 将自己的声音传递出去(文字转语音)。
这些富有人情味儿的案例让人们看到了 AI 在改善人类生存境遇方面所蕴含的希望。
但其实,AI 所能帮助的不只是人,还有我们周围的整个环境以及生活在其中的各类生灵,雪山之王——雪豹就是这一技术的受益者之一。
图源:https://www.britannica.com/animal/snow-leopard
一度濒危的雪山之王——雪豹
雪豹是一种大型猫科动物,分布于青藏高原、帕米尔高原、天山山脉、阿尔泰山脉及我国西部和中亚东部的其它高山地区。作为高山生态系统和中亚山地生态系统的旗舰物种,雪豹的存亡就是高原生态建设成效的晴雨表。
然而,受人类活动、气候变暖、非法偷猎等因素的影响,雪豹曾在上世纪 70 年代被世界自然保护联盟列为濒危物种,并在之后的很长一段时间内都处于这种生存状态(2017 年才被降级为「易危」)。
对于动物保护人员来说,雪豹的保护困难重重。首先,从活动范围来讲,由于所处生境的猎物密度极低,雪豹的家域面积极大,雄性雪豹的家域可达上千平方千米,这使得划定雪豹的保护范围成为难点。其次,从生活习性来看,雪豹喜欢「爬高」,经常在 3000-5000 米的雪线附近活动,而且昼伏夜出,这使得寻觅雪豹的行踪变得极其困难。
雪豹的捕猎画面。图源:www.wildfilmsindia.com
红外相机助力寻踪,但新的问题接踵而至
在人迹罕至的雪豹栖息地,红外相机成了动物保护人员观察和记录雪豹行踪的重要手段。它可以在不同的气候条件下 24 小时持续工作,而且不会打扰雪豹。根据拍摄到的影像,动物保护人员可以对每只雪豹斑点的形状大小等特征进行个体识别,进而建立模型,估计出雪豹的种群数量等信息。
2016 年,红外相机首次拍到雪豹四胞胎的画面。
图源:https://www.buzzfeednews.com/article/jasonwells/rare-snow-leopard-quadruplets-caught-on-camera
但这种做法存在两大难点。首先,红外相机拍到的影像数据量太大,一个项目点每年回收近百万张照片,仅靠人工识别要消耗大量的时间和人力。其次,这些影像识别起来没有那么容易,雪豹自身的「保护色」与高原裸岩高度相似,肉眼「找不同」的方式难度很大。
因此,虽然红外相机充当人类的「眼睛」已经解放了不少人力,但照片处理又给整个工作流程限了速,使得影像数据很难及时地应用于雪豹保护决策。
看到这里,很多技术人员可能会说,这还不简单,做个 AI 识别模型不就行了?但对于没有技术背景的普通动物保护人员来说,如果不借助专业团队的指导和专门的工具,这件事可能很难做到。比如数据要怎么处理?要选用哪类模型?训练用什么策略?模型训练出来怎么部署?而这些正是昇腾 AI 的技术团队和他们开发的 AI 工具所擅长的。他们用基于昇思 MindSpore 深度学习框架打造的国产开源模型,帮助雪豹保护人员进行红外相机照片的处理,大大提高了处理效率。
昇腾 AI:你只管拍,剩下的交给我
昇腾 AI 给雪豹保护团队所提供的帮助,体现在数据标注、数据清洗、数据转换、模型选择、模型训练和模型使用等各个环节。
在数据标注阶段,昇思 MindSpore 团队通过线上指导等方式,辅助雪豹保护团队使用华为云 AI 标注平台开展物种标注工作,并邀请了 61 位志愿者来一同完成这项任务。
项目中涉及的物种类别。
在数据清洗和转换阶段,昇思 MindSpore 团队首先从所有数据中审查和纠正出「脏」数据,然后再开发一套格式转换工具,将标注数据的格式转换为训练可用的 COCO 数据集格式。通常,这样的数据仍存在一些不规则的地方,在训练前还需要对其进行一系列的数据预处理操作,再「喂」给模型进行训练。目前,这些数据预处理方法都是基于昇思 MindSpore 提供的接口实现的。
在模型选择阶段,考虑到红外相机照片中的动物通常难以拍得清晰、完整,常出现一道模糊的身影、画面边缘露出的半个脑袋、或者动物借助保护色隐匿于复杂背景中等情形,所以昇思 MindSpore 团队没有选择图像分类模型,而是使用了能够确定目标位置的目标检测模型,而且是经过昇思 MindSpore 框架创新开发的 YOLO 目标检测模型,该模型可以很好地平衡精度和检测速度,因此能更好地扩展部署到野外的端侧设备。
在模型训练阶段,为了能使模型达到更好的效果,同时也配合照片打框标注的进度,昇思 MindSpore 团队选择了分阶段训练的策略,通过增加数据集、微调参数不断优化模型,这种方式有助于及时发现训练过程中存在的问题并进行针对性的调整。
实验结果表明,已经训练出的模型在准确度方面值得信赖:能够识别包括雪豹、赤狐、岩羊在内的 10 个在三江源红外数据中常见的物种或物种类别;在验证集中整体识别准确率约为 92%,在测试数据中整体识别准确率约 75%。其中,模型对雪豹的召回率最好,两项数据均在 95% 以上。
模型训练成功后,昇思 MindSpore 开源运营团队配合 AI 模型的不同使用场景开发了单张推理和批量推理两套工具,前者提供了上传单张红外照片、返回并展示其识别结果的展示界面,后者则可以批量处理红外照片,以表格和标注了识别结果框的照片的形式返回一批照片的识别结果。模型文件和两套工具代码均已开源,可以供更多有需求的人和机构使用。开源的模型也支持使用者在已有模型的基础上增加自己的数据,进一步进行模型训练。
把 AI 交到每个人手上
其实,昇腾 AI 所开源、开放的东西远不止上面提到的那些。为了让更广泛的群体因 AI 获益,他们甚至开放了一整套基础软硬件平台,硬件包括 Atlas 系列硬件,软件包括异构计算架构 CANN、全场景 AI 框架昇思 MindSpore、昇腾应用使能 MindX 以及 AI 应用使能 ModelArts 等。
昇腾计算架构。图源:《昇腾计算产业发展白皮书》
这些软硬件已经在医疗、交通、金融、互联网、制造、能源、运营商等多个行业的多个场景得到应用,比如工业质检、输电线路巡检、高速自由流收费稽核等等。
昇腾和南方电网合作打造的输电线路智能巡检解决方案,比传统的纯人工巡检安全、高效、准确率高。原来需要 20 天才能完成的现场巡视工作,输电监控指挥中心现在仅需 2 小时就可完成,巡检效率提高了 80 倍,而且大大保障了巡检员的人身安全。
值得一提的是,这些软硬件的开放也给普通的开发者提供了用 AI 解决社会问题的机会。
助力大学生创新
在去年 10 月的第七届中国国际「互联网 +」大学生创新创业大赛总决赛上,来自湖南大学的十几位学子基于昇腾 AI 基础软硬件平台打造出了「MobiUS 昇腾芯:应急救援移动无人机基站边缘智能系统」,可用于洪水等灾情的及时救援。
助力上海疫情查询
在今年上半年上海疫情期间,昇腾社区的开发者也积极参与了战疫行动,开发了疫情查询开源项目并开源了全部源代码,方便上海市民实时了解疫情走势,加快求助、物资、互助等信息的流通。
助力科学家科研
产业、公益之外,科研也是昇腾 AI 重点支持的一大领域。在去年 9 月份发布的 1.5 版本中,昇思 MindSpore 首次探索将科学计算与深度学习结合,推出了面向电磁仿真、药物分子仿真等 8 大科学计算行业的 MindScience 系列套件,包含业界领先的数据集、基础模型、预置高精度模型和前后处理工具等,加速行业应用开发。
结语
在第三次人工智能浪潮席卷初期,我们花了很长的一段时间去刷新各项记录,很快就陷入了一味追求 SOTA 的内卷局面,很多研究可能只有零点零几的提升。在这场狂热之后,大家也开始重新反思做技术的初衷。
昇腾 AI 等国内外企业的一些落地案例,尤其是有「温度」的落地案例让我们看到,这些技术团队已经摸索到了一些有价值的新方向,而且正在引导、帮助普通人去利用他们开发的工具做一些对社会有益的事情。可能不久之后,我们每个人都可以使用 AI 解决生活中的各种难题,甚至为保护这个世界贡献一份力量。
参考链接:
https://www.huawei.com/cn/tech4all/stories/snow-leopard
https://mp.weixin.qq.com/s/yTUwGfwevV49NNXiG_Ox-g
https://www.elecfans.com/d/1825952.html