旷视科技RPC大型商品数据集发布
近期,旷视南京研究院发布了一个新零售自动结算场景下的大型商品数据集RPC。RPC数据集的特点包括:1)量大。无论商品类别(达200)还是图像总量(达83k)均是目前该领域之最;2)跨域。RPC中图像数据分为「单品图」和「结算图」两种形态。模型需在单品图上进行训练,但真正测试环境则为结算图。3)真实。在构造和采集结算图时,尽可能追求模拟真实购买场景,无论商品类别、商品个数、摆放角度及遮挡等等因素均接近实际零售场景;4)层级。RPC中的200类商品隶属于17个商品大类(如方便面、纸巾、饮料等),天然构成了层次的结构;5)难易。对于RPC中的结算图我们设计了三种难度:easy,medium和hard;6)强弱。在监督信息层面,为每张RPC的结算图均提供了由弱(shopping list)到中(point)再到强(product bbox)的三种强度监督信息。