SIGMOD 2020 | MIT为数据库构建基于存储布局的多维学习索引
在多维索引表格(multi-dimensional table)上进行扫描和筛选是现代分析型数据库引擎的关键技术。为了对这些操作进行优化,数据库常建立起聚类的索引结构(indexes),如 R-Trees,Z-ordering 等,然而这些索引结构在不同的数据集以及查询集合(query workload)下很难进行统一优化。在本篇论文《Learning Multi-dimensional Indexes》中,MIT的研究人员提出了名为 Flood 的多维学习索引结构。通过同时优化索引结构以及存储布局,这种结构自动地调整自身以适应具体数据集和查询集合。该工作用来为端到端学习型数据库系统构建索引模块。