Alexa 研究人员通过减少数据不平衡将 AI 错误率降低三成
不平衡的训练数据是分类器的主要障碍 - 即将输入分类的机器学习系统。当语料库出现一类样本不成比例,分类器自然会比其他类型更频繁地对它进行训练,导致模型在新数据上推理正确率降低。不过,亚马逊 Alexa 部门的研究人员表示,他们已开发出一种技术,可以将某些数据不平衡系统的错误率降低多达 30%。他们在最近发表的一篇论文(「用于不平衡数据的罕见音频事件检测的深嵌入」)中描述了它,计划于今年春天在布莱顿举行的声学、语音和信号处理国际会议上发表。