Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

涉水视觉:从关键技术到智能装备

智能领域的数据主体依然是视觉、听觉、文字等模态。其中,视觉是核心赛道,也是目前智能应用的主战场。当前,视觉研究主要关注于空气和真空中,而占地表面积、天气现象甚至生命组织很大比例的各类水体中的视觉却未成体系。

水是生命之源,江河湖海之中、云雾雨雪之时也都是智能领域的重要蓝海,有着极多的应用场景。视觉的基础是光学,光在水体及跨介质中的传播机理是涉水成像的本质,也是涉水视觉研究的根基。坚持践行 “涉水光学” 和 “涉水视觉”,李学龙教授在《电子学报》撰写了 42 页五万字的长文 “涉水视觉”,展示了人工智能赋能的水下视觉。在未来,我们能否通过机器视觉和光学成像结合的技术手段,透过雨雾、穿越湖海,走进这片智能 “蓝海”?

图片李学龙. 涉水视觉. 电子学报, 2023 https://doi.org/10.12263/DZXB

涉水视觉是基于光与水的物质相互作用及跨介质传播机理,通过构建专用光学硬件与视觉算法的技术体系,解决涉水环境下视觉影像信号智能处理与分析,及先进智能涉水视觉装备研制相关的工程问题,探索机器视觉在涉水环境中应用的科学。作为临地安防(Vicinagearth Security,vicinagearth = vicinage earth)体系中水下安防的重要支撑,涉水视觉对于我国领水的防卫、保护、生产、安全、救援具有重要的意义。

图片

海洋中含有十三亿五千多万立方千米的水,约占地球上总水量的 97%,其中蕴含了大量的重要资源未被探索与开发,是地球上最重要的涉水环境。除了常见的江河湖海等典型的水体,陆地上的云雪雨雾等天气条件也会创造复杂的涉水环境,甚至于其它星球上也可能会存在如地外海洋一类的涉水环境。

图片

                                                海水颜色认知的主要历程(图片来自于网络)

因此,对涉水环境进行探索与研究是一项十分重要的课题。光作为探测涉水环境的重要手段,解析光探测结果的涉水视觉对于海洋生态、碳平衡、气候变化、海洋热力学、恶劣环境探测等问题具有重要研究意义。

涉水视觉技术的发展影响了我们对涉水环境的认识与涉水资源的开发。而常见的涉水环境中包含诸如悬浮颗粒物、可溶有机物、浮游动植物等各种复杂的元素,且其中的光线传播路径常常涉及多种介质。因此,光在涉水环境中传播机理要比在空气中更为复杂,研究光与水及其所含物质相互作用及光的跨介质传播机理是涉水视觉的基础。图片

                       光与水的物质相互作用及跨介质传播机理

本文从「为什么大海是蓝色的?」这一具有普适意义的问题出发,系统介绍了水对光的吸收、散射、衰减作用机理,对涉水视觉任务造成的影响,以及现有的涉水图像处理与解析方法。基于水体光学特性及成像退化机理,本文介绍了团队在探索涉水成像和图像解析等涉水视觉关键技术及装备方面的成果,先后研制了全海深超高清相机海瞳、全海深 3D 相机、全海深高清摄像机等,形成了从色彩、强度、偏振、光谱等全方位、体系化的水下观测解析装备研制能力,填补了全海深光学视觉技术的空白。

涉水视觉研究面临的困难

视觉影像信号智能处理与分析领域面临多重挑战,包括复杂环境、物体检测和识别困难、数据获取与标注复杂、大数据和高分辨率、水下视觉问题、实时性需求、数据隐私与安全、跨域泛化。

首先,涉水环境通常受到多种复杂因素的影响,包括波浪、潮汐、光照变化和水质变化等。这些因素导致涉水影像的质量在时空上变化巨大,进一步使得物体检测、跟踪和识别任务更加复杂。物体的形状、颜色和纹理可能会因水域介质的光学特性而受到干扰,增加了物体检测和识别的难度。为了进行监督学习,必须对这些数据进行准确的标注,包括物体和环境属性的精确标记,但是要求标注者具备高度专业知识和经验。

其次,现代高分辨率摄像技术生成了大量的涉水影像数据,其数据频率较高,这增加了数据处理和管理的挑战。处理这些大数据集需要高性能计算资源和有效的数据管理策略,以确保及时的数据分析和存储。水下环境中的影像和视频通常受到光线在水中的散射和吸收的影响,导致图像模糊和颜色失真。这增加了水下图像和视频分析的复杂性,需要开发专门的算法来克服这些问题,以提高图像质量和物体识别性能。

再次,在某些关键应用场景中,如洪水预测和海上救援,系统必须能够实时处理涉水影像数据。这需要高效的算法和硬件加速,以确保系统具备即时响应和实时决策制定的能力。此外,考虑到一些影像可能包含敏感信息,如个人身份或敏感地理位置,数据的隐私和安全性成为不可忽视的问题。因此,必须采取措施来保护数据的隐私和安全性,同时遵守法规和伦理要求,这也增加了数据处理和存储的复杂性。

最后,不同涉水环境中收集的数据可能存在差异,例如,海洋环境与内陆水域的差异。因此,模型需要具备跨域泛化的能力,以在不同场景中表现出良好的泛化性能。这需要大规模、多样化的数据集和强大的迁移学习技术的支持。

因此,为了应对上述挑战,需要开展跨学科研究和技术创新,将机器视觉机器学习、光学、海洋学等多个领域的知识结合起来,推动涉水视觉相关应用的发展。

涉水视觉研究进展

图片

机器视觉是智能时代的 “眼睛”,其基于传感器捕获的图像为智能设备执行其功能提供操作指导,涉及到光学照明、光学成像、信号处理图像处理图像增强、多模态认知计算及图像智能解析算法等多种技术。

随着计算机视觉技术的不断发展,越来越多新的视觉算法及技术被提出,在目标侦查、智慧城市、资源勘探等多个领域都已经有很成熟的工程化应用。但是当前常见的机器视觉和智能系统研究主要围绕空气和真空介质中的视觉任务展开,对涉水前端成像机理和过程研究不够深入,对涉水图像和视频的智能化处理与分析研究未成体系。

涉水视觉技术仍然停留在利用传统处理方法进行识别,仅通过对颜色、外形等特征对目标进行辨识。

当前端采集设备应用于涉水环境时,由于水对光的反射、折射、吸收、散射等作用,对成像结果的能见度、分辨率、对比度等影响很大,尤其是在复杂的水环境下,造成目标图像出现偏色、褪色、畸变、对比度低、亮度分布不均匀等情况,很难对目标图像进行准确辨识,无法直接用于处理及分析。

随着近些年智能信号处理技术的跨越式进步,现今的视觉技术,利用光电成像系统采集图像信息,经过智能技术的处理,对目标特性进行识别、分析及判断,与深度学习、计算成像、3D 视觉、嵌入式视觉系统等技术紧密结合,然而前端成像设备和后端分析算法间的关系常常被忽略,在涉水视觉领域因前端光线传播机理复杂而影响更甚。

图片

                     (a)单介质涉水图像色彩偏移及(b)色彩矫正后的图像图片

                       (a)单介质涉水图像模糊及(b)去模糊后的图像

理想的完备涉水视觉系统是通过光学的装置和非接触的传感器,在光传播路径的局部或整体的一切水体中,自动地接收并处理一个真实物体的图像,通过前后端的感算结合高效准确地获得所需信息。

涉水视觉是基于光与水的物质相互作用及跨介质传播机理,通过构建专用光学硬件与视觉算法的技术体系,解决涉水环境下视觉影像信号智能处理与分析,及先进智能涉水视觉装备研制相关的工程问题,探索机器视觉技术在涉水环境中应用的科学。其作为临地安防体系中水下安防的重要支撑,对于我国领水的防卫、保护、生产、安全、救援具有重要的意义。

(1)全海深超高清相机 ——“奋斗者” 号万米载人潜器电视直播核心装备。2020 年 10 月,所研制的全海深超高清相机作为万米深潜直播的核心装备,实现了国际上首次万米直播。

图片

                       全海深超高清相机

(2)“海瞳” 相机 —— 我国首套自主研制的全海深高清相机。2017 年 3 月,研制的 “海瞳” 相机随天涯号着陆器多次下潜到万米深度,最大潜深 10909 米,记录的相关视频影像资料为马里亚纳海沟深渊的海洋生物,物理海洋等多学科研究提供了重要的原始数据。获得了诸多珍贵海洋观测资料,填补了多项海洋科研领域空白。首次记录下了位于 8152 米深处的狮子鱼,是当时国际上观测到鱼类生存的最大深度。

(3)小型全海深高清摄像机。2020 年 4 月至 6 月期间,研制的小型全海深高清摄像机,搭载 “海斗一号” 无人潜水器上,作为唯一搭载的光学成像设备,进行了我国首次作业型无人潜水器的万米海试,最大下潜深度 10907 米,刷新了我国潜水器最大下潜深度纪录。

图片

                        “海瞳” 相机

临地安防(Vicinagearth Security)

临地安防技术体系属于前沿交叉学科与技术领域,面对低空立体交通、灾害救援、港口水下监控、海洋牧场等一系列应用场景,涵盖低空安防、水下安防及跨域安防,是临地空间中防卫、防护、生产、安全、救援等需求的多元化、跨域化、立体化、协同化、智能化技术体系。该技术体系不独立于现有的众多其他学科领域 / 技术体系,包含相干光探测、稳定探测、多模态认知计算、群体智能决策、涉水光学以及跨域遥感等六大研究 / 技术方向的同时,更广泛地面向空天地海井网,涉及航空航天、深空深海、机械电子、信息 / 量子通讯、新材料、能源动力等众多学科与技术领域的交叉融合,对国防安全、社会稳定、经济发展具有重要意义。

图片

与传统临近空间或近地空间不同,临地(Vicinage earth, Vicinagearth)空间是指从海平面以下 1000 米(阳光穿透水深极限,南海平均水深)到海平面以上 10000 米(民航航线高度)的水域、地面及空域。其中,海平面以下 100 米(大陆架平均水深)到地面以上 1000 米(低空空域开放高度)是其核心区),基本覆盖人类主要生产生活,以及现代战争低空超低空及水下作战空间。其中,Vicinage 源于古法语 / 拉丁语的 visnage/vicinus,同 neighbor。

作者介绍

图片

李学龙,西北工业大学校学术委员会副主任、光电与智能研究院(iOPEN)教授,关注临地安防、图像处理、成像。E-mail: li@nwpu.edu.cn

参考阅读:

1. 李学龙. 涉水光学. 中国科学: 信息科学, 2022, doi: 10.1360/SSI-2022-0398.

http://engine.scichina.com/doi/10.1360/SSI-2022-0398

2. 李学龙. 临地安防(Vicinagearth Security), 2022, 18(11), 44-52.

https://dl.ccf.org.cn/article/articleDetail.html?type=xhtx_thesis&_ack=1&id=6219452051015680

工程临地安防涉水视觉
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据管理技术

数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程,其目的在于充分有效地发挥数据的作用。

监督学习技术

监督式学习(Supervised learning),是机器学习中的一个方法,可以由标记好的训练集中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练集是由一系列的训练范例组成,每个训练范例则由输入对象(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。

遥感技术

遥感(remote sensing)是指非接触的、远距离的探测技术。一般指运用传感器/遥感器探测物体的电磁波辐射、反射特性。遥感通过遥感器这类对电磁波敏感的仪器,在远离目标和非接触目标物体条件下探测目标。

迁移学习技术

迁移学习是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。 迁移学习对人类来说很常见,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

物体识别技术

计算机视觉领域的一个分支,研究物体的识别任务

信号处理技术

信号处理涉及到信号的分析、合成和修改。信号被宽泛地定义为传递“关于某种现象的行为或属性的信息(如声音、图像和生物测量)”的函数。例如,信号处理技术用于提高信号传输的保真度、存储效率和主观质量,并在测量信号中强调或检测感兴趣的组件。我们熟悉的语音、图像都可以看做是一种信号形式。因此,对于语音、图像的增强、降噪、识别等等操作本质上都是信号处理。

图像增强技术

图像增强技术用于增强图像中的有用信息,它可以是一个失真的过程,其目的是要改善图像的视觉效果,针对给定图像的应用场合。它通过有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果,满足某些特殊分析的需要。

群体智能技术

集群智能(Swarm Intelligence),是指在某群体中,若存在众多无智能的个体,它们通过相互之间的简单合作所表现出来的智能行为,集群机器人便是集群智能一类。它由Gerardo Beni和Jing Wang于1989年在细胞机器人系统的背景下引入。

机器视觉技术

机器视觉(Machine Vision,MV)是一种为自动化检测、过程控制和机器人导航等应用提供基于图像的自动检测和分析的技术和方法,通常用于工业领域。

暂无评论
暂无评论~