Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

概率矩阵分解

许多现有的协同滤波算法既不能处理非常大的数据集,也不能轻松处理那些有很少数据的用户。通过使用概率矩阵分解(PMF)模型,可以在大型、稀疏且不平衡的数据集上有很好的表现。以用户-项目评分矩阵为例,矩阵分解就是预测出评分矩阵中的缺失值,然后根据预测值以某种方式向用户推荐。

简介

描述

矩阵分解是一种基本的数学算法,可用于推荐算法中,根据用户的喜好来进行相关推荐。2008年,Andriy Mnih等人提出了概率矩阵分解,并将其应用于大型、稀疏且不平衡的数据集上,获得了很好的效果。在2008年,基于PMF提出了几个改进算法,如贝叶斯概率矩阵分解和核概率矩阵分解等,都在推荐系统中获得了很好的结果。2009年,Yehuda Koren等人对现有的矩阵分解算法进行了对比和总结。

主要事件

2008

Andriy Mnih等人提出了概率矩阵分解

Mnih A, Salakhutdinov R R. Probabilistic matrix factorization[C]//Advances in neural information processing systems. 2008: 1257-1264.

2008

提出了贝叶斯NMF,通过使用MCMC(Markov chain Monte Carlo)进行模型中的近似推理,证明了在面对大数据集的情况下,MCMC也可以获得很快的速度。并且贝叶斯NMF获得了很好的效果。

Salakhutdinov R, Mnih A. Bayesian probabilistic matrix factorization using Markov chain Monte Carlo[C]//Proceedings of the 25th international conference on Machine learning. ACM, 2008: 880-887.

2009

Yehuda Koren等人对现有的矩阵分解算法进行了对比和总结

Koren Y, Bell R, Volinsky C. Matrix factorization techniques for recommender systems[J]. Computer, 2009, 42(8).

2012

提出了kernel NMF

Zhou T, Shan H, Banerjee A, et al. Kernelized probabilistic matrix factorization: Exploiting graphs and side information[C]//Proceedings of the 2012 SIAM International Conference on Data Mining. Society for Industrial and Applied Mathematics, 2012: 403-414.

发展分析

瓶颈

概率矩阵分解算法中的正则化参数对应的是点估计,在参数选择的不合适时容易发生过拟合。

未来发展方向

概率矩阵分解算法在提高推荐质量的同时可以在大数据环境下保证计算的时间和计算资源的瓶颈问题。针对算法面对的未来发展需要,在保证推荐质量的前提下,与其他并行算法相结合,提高算法在工程应用中的速率。

Contributor: Yilin Pan

简介