近日,创新奇智(AInnovation)在国际权威图像分割竞赛Cityscapes上获得实例分割评测的第一名,以明显优势刷新实例分割任务世界纪录,超越NVIDIA(英伟达)、Facebook、Uber、香港中文大学、商汤、搜狗、科大讯飞等几十支强劲的国际企业和科研机构。
迄今为止,在短短5个月时间内,创新奇智已连续在世界顶级人脸检测竞赛WIDER FACE、物体检测竞赛 PASCAL VOC、图像分割竞赛Cityscapes中取得三连冠的佳绩,充分彰显了创新奇智在计算机视觉识别领域的技术实力和算法创新能力。
图片来源:Cityscapes官网
Cityscapes 数据集
Cityscapes评测数据集在2015年由奔驰公司推动发布,是目前公认的机器视觉领域内最具权威性和专业性的图像分割数据集之一。在Cityscapes评测数据集之中,共分为像素级分割和实例分割两个子任务,其中相较于像素级分割,实例分割的难度要更大,也是计算机视觉领域最重要、最具挑战的任务之一。
在Cityscapes实例分割任务所对应的数据集中,包含了5000张精细标注的图像和20000张粗略标注的图像,其中包含50个城市的不同场景、不同背景、不同街景,以及30类涵盖地面、建筑、交通标志、自然、天空、人和车辆等的物体标注。该数据集以关注真实场景下的环境理解著称,任务难度更高。
截至目前,Cityscapes评测吸引了近百支队伍参赛,包括Facebook、Uber、香港中文大学、商汤、NVIDIA(英伟达)、搜狗、科大讯飞等众多国内外优秀创新企业和顶尖学术机构参加。创新奇智提出的AInnoSegmentation算法在各项指标中均有突破性进展,各项指标均名列第一,综合成绩第一。
创新奇智AInnoSegementation算法
AInnoSegmentation算法是以著名的Mask R-CNN网路架构为基础,骨干网络使用SE-Resnet152网络架构,使用它来提取多尺度特征图,颈部网络采用一个6级特征金字塔网络(FPN),用来生成更加丰富的多尺度卷积特征。然后使用自研的特征融合模块作为特征融合器,后面连接两个共享子网,一个负责分类和框回归,一个负责图像分割。
Mask R-CNN网络图
看看AInnoSegementation算法的表现吧:
AInnoSegementation算法在Cityscapes数据集上的表现
实例分割算法的商业价值
创新奇智自成立伊始就瞄准高精尖的人工智能算法在制造、零售、金融等多个领域的商业化产品落地,重点突破人工智能算法的领先性和成熟性,形成具有巨大商业潜力的AI产品和解决方案。目前,创新奇智已经打造出业界领先的自动化机器学习平台和AI工业视觉平台ManuVision,并发表了数篇顶级会议论文。这些成果实实在在提高了算法在实际场景的精度,提升了训练和推理的速度,并极为高效地整合了计算资源。
AInnoSegmentation算法在工业视觉中应用非常广泛,典型场景包括:缺陷检测,定位,识别等复杂场景。例如,创新奇智已将该算法应用于成衣、磁性材料等质检场景下,提高产品的质检精准度。
AInnoSegmentation算法还可以应用于零售业中的渠道陈列和智能货柜等商品识别场景,提高商品识别准确度的同时,帮助客户提升运营效率。
另外,创新奇智还将AInnoSegmentation算法应用于钢铁厂智慧铁水无人机车运输系统上,进一步提高该解决方案的成熟度和技术壁垒。