Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

范登平作者学习时报来源

如何精准识别伪装场景

11月27日,中央党校权威刊物《学习时报》(全党唯一一份专门讲学习的中央级报纸)的科技前沿版,特别刊登了南开大学教授范登平先生的文章《如何精准识别伪装场景》。该文深入浅出地介绍了伪装场景理解技术的最新进展,展现了很强的专业价值与前瞻性,目前在党政领导干部内反响不错。

相信随着这一前沿科技的持续发酵,将会逐步跨越专业界限,进入大众视野,成为推动科技军事和社会进步与创新的重要力量。

图片

在自然界,有不少动物都能够利用周边环境,将自己很好地隐藏起来。例如,变色龙在遇到危险时,会根据周围环境改变身体颜色,以融入场景,实现隐身。同样,人类为了保护重要目标,也会利用伪装技术。特别是在军事领域,伪装技术已超越了简单的迷彩服和丛林隐蔽,借助虚拟现实人工智能机器学习等高科技手段,创造出更为逼真、复杂的伪装效果。近年来,伪装技术的广泛应用显著提升了目标隐蔽性,极大地增加了侦察与打击的难度,即便是精确制导武器也面临严峻挑战。加之战场环境中的迷雾、烟雾等自然因素,更是让伪装效果更加逼真。面对这一复杂局面,如何有效识别并理解伪装目标成为一个关键的作战挑战,而伪装场景理解技术的应运而生,让伪装场景得以发现和理解。它专注于解析那些主动或被动融入环境的具有伪装特性的对象,如同变色龙般在场景中“消失”的奥秘。这一技术融合了认知学、心理学及人工智能等前沿学科,成为“新一代人工智能”技术体系中的一把利剑,不仅为军事领域带来了革命性的突破,更预示着在深海监控、精准医疗等多个领域将展现出巨大的应用潜力,为我国构筑起强大的技术应用壁垒。


(一)

美国艺术家阿博特·塞耶和英国动物学家休·科特分别在1909年和1940年从生物学的角度研究了伪装的特性。他们发现,“伪装”作为自然界中一种常见的生物行为,能够帮助生物在栖息环境中进行自我保护或者主动狩猎,从而为其提供重大的生存优势,并通过自然进化得以强化。一般而言,生物个体会巧妙利用色彩、拟态、运动等模式组合,将自己完美地藏匿于所在的栖息环境之中,使其难以被发现。

自那时起,研究者们开始尝试在近百张含有伪装目标的图像中定位伪装目标。以色列科学家Tankus等人在1998年利用诸如十字算子等手工设计特征在近100张含有伪装目标的图像上进行凸度估计,而印度科学家Sengottuvelan等人在2008年则采用共生矩阵等方法进行探索性图分析来定位场景中的伪装区域。然而,这些方法主要依赖逐像素或局部区域的计算方式来定位伪装目标,对全局信息的把控相对较弱。由于伪装目标极易受到局部特征干扰而产生定位偏差,且传统方法难以充分融合全局和局部特征,导致这些检测效果并不理想。

由于伪装数据的匮乏,科学家对伪装任务的探索一度停滞不前。直至2020年,当时在阿联酋起源人工智能研究院(IIAI)工作的我国科学团队首次将研究焦点转向了图像伪装目标检测任务。该团队率先发布了首个数据规模高达1万张的伪装目标检测数据库COD10K,并基于人类在场景中先搜索后识别的认知规律,设计了首个搜索识别网络(SINet)来高效地检测伪装目标。由于成果的前瞻性,英国权威杂志《New Scientist》进行了专题报道,称“人工智能技术可以发现伪装目标了”。中国人工智能学会也对SINet系列技术进行了鉴定,将其评定为国际领先水平。

同年,英国皇家学会院士、计算机视觉领域最高荣誉Marr奖得主安德鲁·兹泽曼教授团队在牛津大学构建了第一个MoCA视频伪装目标检测数据库,并提出利用移动特征来检测视频中的伪装目标,取得了良好的效果。至此,图像和视频伪装目标检测这两项原创性工作,成为伪装场景理解的基础任务。

伪装目标检测任务相比传统目标分割更为困难,原因在于伪装目标的边缘微弱,特征传递时易发生梯度消失,且主体对象多样,表现出不同纹理,导致特征在不同维度空间的表现形式不同,目标特征变化显著。科学家针对边缘不确定性和主体纹理多样性问题,为了能够精确地分割伪装目标,提出了基于边缘梯度的建模方法以及基于不确定性图的建模方法等新思路。


(二)

自2020年以来,在伪装目标检测任务的基础上,来自中国、美国、欧洲、日本、澳大利亚、加拿大、中东等国家和地区的顶尖科研团队,利用卷积神经网络图神经网络、搜索识别系列策略和生成提示技术等构建了一系列子任务,包括图像伪装目标检测、伪装目标等级排序、多模态伪装目标检测、伪装个体分割、参考式伪装目标检测、海洋伪装目标计数、植物伪装检测、伪装数据生成等。这些子任务为伪装场景理解提供了助力,形成了百花齐放的局面。

随着伪装场景理解中各项子任务的蓬勃发展,其应用前景也逐渐明朗。这些应用包括军事打击、深海监控、精准医疗、工业缺陷检测等。

在军事领域,目标天然具有伪装性,这使得伪装场景理解技术成为典型应用场景。伪装场景理解系统可以集成到无人机平台上,执行高空侦察和监视任务。无人机能够覆盖广阔的区域,对地面目标进行持续的监视。搭载的高精度感知系统能够穿透伪装,识别出敌方的防空系统、移动车辆和其他重要目标。此外,无人机还可以利用其高机动性,对特定目标进行精准追踪,并在必要时引导精确打击武器进行攻击。

在海洋环境中,伪装场景理解系统可以搭载在无人潜航器上,用于探测和追踪水下生物。通过集成声呐和光学传感器,该系统能够在复杂的水下环境中准确识别出特定目标,为海洋生态和海洋安全提供实时情报。这将为伪装场景无人系统在海洋技术链布局奠定基础,进一步提升军事作战感知能力,为军事指挥官提供实时、准确的情报,确保在现代战争中发挥关键作用。

在精准医疗领域,尤其是在早期疾病的筛查中,病变区域和周围的组织较为接近,呈现出同质性,传统的技术手段很难识别出来。而伪装场景理解技术恰恰适合找出这样的同质疾病区域,有利于医疗辅助诊断,提高检测率。

在工业缺陷检测领域,典型的应用包括亚马逊的Lookout Vision制造缺陷检测技术、谷歌的Visual Inspection AI电路板检测技术、腾讯的屏幕划痕缺陷检测技术等。伪装场景理解技术也天然地适合检测这些微弱的工业级缺陷,通过其高级图像分析能力,能够更精确地识别出难以察觉的瑕疵,为工业质量筛查发挥重要作用,进一步提升了整体检测水平和生产线的智能化程度。

除了以上应用场景外,对大自然中生物伪装特性的深入理解同样具有深远的科学意义。这一研究有望在众多基础科学领域催生出一系列重要应用成果,包括但不限于伪装仿生材料的开发、机器人避障技术的提升、文娱艺术的创新以及农业病虫害预警系统的优化等。


(三)

作为未来科技发展的重要方向,伪装场景理解技术因其高度的复杂性和挑战性而备受关注。我国的研究团队已经在这一领域取得了显著的进展,积累了大量的核心研究数据,掌握了相关的基础技术,并制定了评价标准。目前,国内已经形成了一个相当规模的隐性视觉感知技术研究社群,其整体研究水平已经处于国际领先地位。

进一步推动伪装场景理解技术的发展,必须采取一系列积极的措施。首先,加大资金投入,设立专项研究基金。支持伪装场景理解基础技术的研究和发展,以探索更多的原理机制,推动技术的不断创新和突破。同时,通过设立奖励机制,激励科研团队取得原创性成果,提升国际竞争力。其次,重点扶持“黄大年式科研团队”。具有创新精神和实力的科研团队是推动伪装场景理解技术发展的关键力量,重点扶持那些具有显著成果和潜力的科研团队,为他们提供充分的资源和支持,激发他们的创新活力。最后,加强国际合作与交流。伪装场景理解技术需跨学科合作,应积极与国际知名科研机构和企业建立合作关系,共同研究与应用,促进技术进步。同时,推动伪装场景理解技术的多元化应用,探索更多具有创新性和实用性的应用场景,实现技术原理与应用场景的良性互动。

(作者系南开大学计算机系主任、教授)

产业伪装技术人工智能
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

虚拟现实技术

虚拟现实,简称虚拟技术,也称虚拟环境,是利用电脑模拟产生一个三维空间的虚拟世界,提供用户关于视觉等感官的模拟,让用户感觉仿佛身历其境,可以及时、没有限制地观察三维空间内的事物。用户进行位置移动时,电脑可以立即进行复杂的运算,将精确的三维世界视频传回产生临场感。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

图神经网络技术

图网络即可以在社交网络或其它基于图形数据上运行的一般深度学习架构,它是一种基于图结构的广义神经网络。图网络一般是将底层图形作为计算图,并通过在整张图上传递、转换和聚合节点特征信息,从而学习神经网络基元以生成单节点嵌入向量。生成的节点嵌入向量可作为任何可微预测层的输入,并用于节点分类或预测节点之间的连接,完整的模型可以通过端到端的方式训练。

腾讯机构

腾讯,1998年11月诞生于中国深圳,是一家以互联网为基础的科技与文化公司。我们的使命是“通过互联网服务提升人类生活品质”。腾讯秉承着 “一切以用户价值为依归”的经营理念,为亿万网民提供优质的互联网综合服务。 腾讯的战略目标是“连接一切”,我们长期致力于社交平台与数字内容两大核心业务:一方面通过微信与QQ等社交平台,实现人与人、服务及设备的智慧连接;另一方面为数以亿计的用户提供优质的新闻、视频、游戏、音乐、文学、动漫、影业等数字内容产品及相关服务。我们还积极推动金融科技的发展,通过普及移动支付等技术能力,为智慧交通、智慧零售、智慧城市等领域提供有力支持。

http://www.tencent.com/
相关技术
目标检测技术

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。

推荐文章
暂无评论
暂无评论~