Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

阿里行人重识别(ReID)算法效果刷新业内最好成绩

近日,阿里巴巴机器智能技术实验室在行人重识别(Person Re-identification)算法上获得突破性成果。该技术团队通过最新算法,在不使用任何时序信息的情况下,在行人重识别主流数据库(Market1501,DukeMTMC-reid和CUHK03)上各项指标均取得第一的好成绩,刷新了业内的最好成绩。

其性能的提高主要来源于技术层面的创新:该团队通过局部信息的挖掘,致力于解决行人在识别过程中表观姿态变化剧烈,不容易对齐的问题。一方面,通过人体语义分割得到具有强语义信息的部件,并利用注意力机制在其中寻找最具有区分性的区域。另一方面,使用了基于金字塔的水平分块策略,得到行人固定区域的可辨识信息。在训练中,同时采用两种策略相结合的方式,达到行人图片的对齐,从而实现更精准的匹配识别。通过技术上的改进,该方法在三个公开数据库上的效果均优于之前最好方法,特别是mAP指标,分别提升了2%,1.87%,3.39%。

近年来,行人重识别技术在业内得到了越来越多的关注,仅CVPR2018就有将近30多篇文章专注于行人重识别问题的研究。随着行人重识别技术的日渐成熟,其巨大的应用价值和市场潜力得到了越来越多的关注。

不管是老牌的安防公司如海康威视,浙江大华,还是新晋独角兽旷世科技,商汤科技,还有传统的互联网巨头,BAT,华为等,都对行人重识别非常关注,在算法,数据和人才等各个方面上进行着布局和积累。此次阿里巴巴机器智能技术实验室在行人重识别算法的突破,为其在XXX领域相关技术方案落地奠定了稳固基础。

行人重识别落地应用点:

1、在公共安全领域,行人重识别一方面能够帮助快速筛查可疑人员,建立快速反应安全防控机制、精准重拳打击犯罪,如精准查找黄牛党,预防公共安全事故发生。另一方面,在机场、车站等人流拥挤的公共区域,利用行人重识别技术,可以实现走失儿童和老人的快速查找。对维护人民群众切身利益,营造平安环境有着不可估量的作用。

2、在新零售领域,通过行人重识别技术,可以获取顾客的行为轨迹,获得顾客的数字化信息,帮助商家挖掘更多的商业价值,同时为客户提供定制化服务。可以实现零售场景内的全程无感知体验,并能对各种突发事件做出及时的响应。

除了应用在线下零售解决方案中,行人重识别与人脸识别技术的相结合,可以用来打通线上、线下零售场景,提供“一站式”的消费服务体验。

3、在智能交通领域,利用行人重识别技术,可以实现实现人与人,甚至人与车的联系。帮助智能交通系统一起完成人、车与道路的完整自动调度闭环,这种技术能力对于自动驾驶时代同样适用。

4、同时,行人重识别其本身也是智慧城市的一个重要技术环节。通过行人重识别技术不仅可以实现人流信息的统计,甚至包括全场景的人流轨迹还原及人员比对和查询,方便实时管理和调配各种终端资源,节省了大量人力和物力资源。

两个例子如下:

4.1 通过行人重识别,得到来政府部门办理相关业务的用户的统计信息,帮助政府服务部门更好的调配人力资源,提高办理效率,进一步优化政务服务。形成方便快捷、公平普惠、优质高效的政务服务信息体系,真正意义上完成从被动服务向主动服务、单一服务向综合服务的转变。

4.2 利用行人重识别技术,得到城市旅游景点的人流信息,可以帮助旅游业的发展规划、精准营销、旅游管理、产品线路及旅游服务提供强大的数据支撑,对旅游市场进行细分,更为有效地确定目标受众,制定符合城市定位的旅游发展规划,从而实现精准营销、业态创新和旅游产业的转型升级。

5、最后,行人重识别还可以用于个人居家生活。在家庭机器人和智能管家中嵌入行人重识别技术,可以帮助其更好的识别服务家庭成员。

产业行人重识别阿里巴巴ReID语义分割注意力机制人脸识别自动驾驶智能交通新零售
41
相关数据
海康威视机构

海康威视是以视频为核心的智能物联网解决方案和大数据服务提供商。海康威视拥有视音频编解码、视频图像处理、视音频数据存储等核心技术,及云计算、大数据、深度学习等前瞻技术。为PBG(公共服务事业群)、EBG(企事业事业群) 、SMBG(中小企业事业群)三个事业群客户提供专业的细分产品、IVM智能可视化管理解决方案和大数据服务。

http://www1.hikvision.com/cn/index.html?jmode=j1
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。

https://www.huawei.com/cn/
商汤科技机构

作为人工智能软件公司,商汤科技以“坚持原创,让AI引领人类进步”为使命,“以人工智能实现物理世界和数字世界的连接,促进社会生产力可持续发展,并为人们带来更好的虚实结合生活体验”为愿景,旨在持续引领人工智能前沿研究,持续打造更具拓展性更普惠的人工智能软件平台,推动经济、社会和人类的发展,并持续吸引及培养顶尖人才,共同塑造未来。

http://www.sensetime.com
自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

注意力机制技术

我们可以粗略地把神经注意机制类比成一个可以专注于输入内容的某一子集(或特征)的神经网络. 注意力机制最早是由 DeepMind 为图像分类提出的,这让「神经网络在执行预测任务时可以更多关注输入中的相关部分,更少关注不相关的部分」。当解码器生成一个用于构成目标句子的词时,源句子中仅有少部分是相关的;因此,可以应用一个基于内容的注意力机制来根据源句子动态地生成一个(加权的)语境向量(context vector), 然后网络会根据这个语境向量而不是某个固定长度的向量来预测词。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

流数据技术

流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下,数据流可被视为一个随时间延续而无限增长的动态数据集合。应用于网络监控、传感器网络、航空航天、气象测控和金融服务等领域。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

语义分割技术

语义分割,简单来说就是给定一张图片,对图片中的每一个像素点进行分类。图像语义分割是AI领域中一个重要的分支,是机器视觉技术中关于图像理解的重要一环。

阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。

https://www.alibabagroup.com/
推荐文章
问一下,有文章题目吗
1