Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

南京理工团队推出基于AI增强热力学建模预测3D场景红外辐射特性的新框架

图片

编辑 | ScienceAI

在现代军事科技中,虚拟战场构建技术对武器研发和战术决策具有深远影响。

然而,传统三维红外场景模拟面临计算资源消耗大、动态目标与环境交互建模困难、算法验证不足等挑战。

近期,南京理工大学的研究团队在《International Journal of Heat and Mass Transfer》发表了一项突破性研究《A novel framework for predicting 3D scene infrared radiation characteristics through AI-enhanced thermodynamic modeling》。

论文提出了一种名为 3DICPF(三维红外特性预测框架)的新方法,通过结合人工智能(AI)与热力学建模,显著提升了红外场景模拟的效率与精度。本文将深入解析这一框架的核心技术、实验结果及其在军事与工程领域的应用潜力。

图片

论文链接:https://www.sciencedirect.com/science/article/abs/pii/S0017931024012626

1. 研究现状

红外辐射特性反映了物体表面温度、材料发射率及环境条件等综合信息,在低能见度或强雷达干扰环境下具有独特优势。通过分析目标与背景的热对比,红外成像可揭示发动机热量、运动轨迹等关键信息,为实时战术决策提供支持。然而,现有的红外场景模拟方法主要面临以下难点:

1)数值计算方法需输入完整的物体参数(如几何形状、材料属性、环境条件),计算复杂度高且难以适应动态战场需求。

2)基于生成对抗网络(GAN)等 AI 方法虽能快速生成红外图像,但多局限于二维(2D)场景,且易出现像素错位、色彩失真等问题。战场红外数据的获取成本极高,而数据驱动算法在有限样本下难以学习复杂物理机制(如热阴影效应),导致生成结果缺乏物理真实性。

3)目前的红外场景快速渲染方法基本都大大简化了温度场计算过程,通过避免计算域划分和数值计算流程,在牺牲计算精度的基础上实现红外特性快速预测。

2. 本文主要创新

该论文提出的 3DICPF 框架,通过改进三维温度场预测网络结构,结合蒙特卡洛算法,能够基于输入的可见光图像、红外图像、气象参数条件,快速预测目标在对应条件下的三维红外特性。

3DICPF 的创新之处在于融合数据驱动与理论算法,基于AI快速完成计算域划分和温度场数值计算。通过模块化设计降低数据依赖,实现快速、高精度的三维红外场景生成。

通过优化网络结构设计,优化网络智能生成计算域、预测温度场的能力;通过采用蒙特卡洛算法实时渲染红外特性,避免AI算法因数据不足导致的阴影预测失真问题。其核心流程分为三阶段:

图片

图示:3DICPF 结构示意图

1)计算域智能划分(CDIPM)

该模块通过目标检测三维重建,快速构建目标的网格计算域,采用 YOLO 算法识别图像中的坦克等军事目标,并结合 FaceNet 进行模型匹配。若目标已知,则直接从数据库调用三维网格;若未知,则通过单目三维形状重建网络(SVSR)生成目标几何结构。

该网络参考集合结构拓扑关系优化外形重构过程(Deep learning framework-based 3D shape reconstruction of tanks from a single RGB image),能够基于单张可见光图像,通过分部件预测与精细调整,生成高精度三维网格,解决了传统方法中局部粘连和结构扭曲问题。

2)温度场智能预测(TIPM)

该模块结合当前时刻的红外图像与气象参数,预测目标的三维温度场。利用Mesh Transformer(MT)网络,将二维温度图像与三维几何信息融合,通过图卷积网络(GCN)和 Transformer 技术建模热传导方程,直接预测网格节点的温度分布。

采用条件多注意力生成对抗网络(CMAGAN),根据气象参数(温度、风速、湿度、太阳辐射)变化生成未来时刻的二维温度图像,再通过MT网络扩展为三维温度场。双网络结构降低了数据需求与训练复杂度。

这两个网络分别参考了如下两篇文章:《Thermo-mesh transformer network for generalizable three-dimensional temperature prediction with mechanism-based representation》;《Fast prediction of complicated temperature field using Conditional Multi-Attention Generative Adversarial Networks (CMAGAN)》

3) 红外场景融合与渲染(ISFRM)

该模块基于蒙特卡洛光线追踪技术,模拟目标与背景的辐射交互。基于前置步骤得到的坦克三维温度场,将其结合三维模型的 UV 划分格式得到其二维温度纹理,调用数据库中对应条件下的背景温度纹理,计算目标和背景的辐射传输过程。

结合表面自辐射、环境反射辐射及大气衰减效应,计算探测器接收的红外辐射强度。引入红外双向反射分布函数(IBRDF)精确建模反射过程。集成渐晕、光电转换、调制传递函数(MTF)等物理效应,利用 Unreal Engine 4 实现实时渲染,生成多视角红外图像。

3. 预测结果

 结果表明 YOLO 模型对坦克目标的检测精度达 99%,召回率 95%;MT 网络的节点温度平均误差为 0.648K,结合 CMAGAN 后整体 MAE 为 1.24K;框架生成的 3D 红外图像与数值模拟结果相似度(SSIM)达 88.13%,长波与中波红外图像均能准确反映目标与背景的热对比。3DICFP 预测模型坦克在对应实验条件下的红外特性,预测精度达到 88.13%,单个场景红外特性的预测平均耗时仅 84.39s,兼顾了预测时间和预测精度。

图片

图示:3DICPF 框架预测的红外场景和实测场景对比

3DICPF 框架通过 AI 与物理模型的深度融合,为三维红外场景模拟提供了高效、低数据依赖的解决方案。其模块化设计与分步预测策略,既保留了数值方法的物理真实性,又发挥了 AI 的高效推理能力。

随着算法优化与数据积累,该技术有望在军事仿真、智慧城市、环境监测等领域实现更广泛应用,推动 AI 与物理科学交叉研究的进一步发展。

理论红外场景三维温度场预测AI for Science人工智能
相关数据
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

YOLO技术

YOLO 模型最早是由 Joseph Redmon 等人在 2015 年发布的,并在随后的两篇论文中进行了修订。

生成对抗网络技术

生成对抗网络是一种无监督学习方法,是一种通过用对抗网络来训练生成模型的架构。它由两个网络组成:用来拟合数据分布的生成网络G,和用来判断输入是否“真实”的判别网络D。在训练过程中,生成网络-G通过接受一个随机的噪声来尽量模仿训练集中的真实图片去“欺骗”D,而D则尽可能的分辨真实数据和生成网络的输出,从而形成两个网络的博弈过程。理想的情况下,博弈的结果会得到一个可以“以假乱真”的生成模型。

目标检测技术

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。

三维重建技术

三维重建是指利用二维投影或影像恢复物体三维信息(形状等)的数学过程和计算机技术。

生成对抗技术

生成对抗是训练生成对抗网络时,两个神经网络相互博弈的过程。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。

推荐文章
暂无评论
暂无评论~