在不久前结束的 KDD Cup 2020 竞赛中,美团到店广告平台搜索广告算法团队在 Debiasing、AutoGraph、Multimodalities Recall 三道赛题中获得了两冠一季的成绩。本文将介绍该队伍的解决方案。
NDCG@50_full:与常规推荐系统评价指标 NDCG 一致,该指标在整个评测数据集上评估每次用户请求所推荐的前 50 个商品列表的平均排序效果。该评测集被称为 full 评测集。
NDCG@50_half:关注偏差问题。从整个 full 评测数据集中取出一半历史曝光少的点击商品,对这些商品的推荐列表进行 NDCG 指标评估。该评测集被称为 half 评测集。
选择性偏差:曝光数据是由模型和系统选择的,与系统中的全部候选集不一致。
流行度偏差:商品历史点击次数呈现长尾分布,因此流行度偏差存在于头部商品和尾部商品之间。如何解决流行度偏差是赛题的核心挑战之一。
图数据的多样性:解决方案要在多个不同的图结构数据上均达到优秀效果。图的类型多种多样,包含了有向图 / 无向图、稠密图 / 稀疏图、带特征图 / 无特征图等。
超短时间预算:大部分数据集的时间限制在 100 秒左右,在图结构和参数搜索方面需要有一个快速搜索方案。
鲁棒性:在 AutoML 领域,鲁棒性是非常重要的因素。最后一次提交要求选手在之前没见过的数据集上进行自动化建模。
黄坚强,美团广告平台搜索广告算法团队算法工程师,毕业于北京大学。
胡可,美团广告平台搜索广告算法团队资深算法专家,毕业于香港中文大学。
陈明健,美团广告平台搜索广告算法团队算法工程师,毕业于北京大学。
漆毅,美团广告平台搜索广告算法团队算法工程师,毕业于清华大学。
唐兴元,毕业于中国科学院大学。
曲檀,美团广告平台搜索广告算法团队算法工程师,毕业于中国人民大学。
雷军,美团广告平台搜索广告算法团队研究员,毕业于清华大学。