你也在用《计算机视觉:算法与应用》入门 CV 吗?或许你手里的版本已经有点过时了。
提到计算机视觉领域的入门书,不少人会推荐 Facebook 研究科学家 Richard Szeliski 的《计算机视觉:算法与应用》。这本书的英文版于 2010 年出版,2011 年被翻译成中文在国内面世,成为很多人学习计算机视觉的入门教材。

这本书探索了用于分析和解释图像的各种常用技术,描述了具有一定挑战性的视觉应用方面的成功实例,兼顾专业的医学成像和图像编辑与拼接之类有趣的大众应用。在这本书中,作者从科学的角度介绍了基本的视觉问题,将成像过程的物理模型公式化,然后在此基础上生成对场景的逼真描述,他还运用统计模型来分析和运用严格的工程方法来解决这些问题。作为一本被广泛采用的教材,《计算机视觉:算法与应用》非常受初学者欢迎,有人称赞其「为计算机视觉技术的初学者(本科生)提供了广泛的标准计算机视觉问题的坚实基础」。
内容引自知乎用户 @红色石头。原贴链接:https://zhuanlan.zhihu.com/p/85618233还有人表示,这本书「写得很简单,看完后对这个领域有了很好的把握,而且很多内容都有代码,感兴趣的地方自己尝试后,对算法理解也加深了很多」。
内容引自知乎用户 @Recruit (https://www.zhihu.com/people/rui-shi-87)。原贴链接:https://www.zhihu.com/question/28813777/answer/85845127毋庸置疑,《计算机视觉:算法与应用》是一本高质量的入门教材。但美中不足的是,这本书写于十年前,涉及的机器学习、深度学习内容较少,而近年来,这两项技术又在视觉领域实现了爆炸式增长。为了弥补这一缺憾,最近,作者 Richard Szeliski 在自己的个人主页上宣布,《计算机视觉:算法与应用》第二版已经基本完成,并发布了新书的 PDF 版本,向读者征集意见。
Richard Szeliski 在新书的前言中介绍说,这本书萌芽于 2001 年,当时华盛顿大学的 Steve Seitz 邀请他一起讲授一门课程——「Computer Vision for Computer Graphics」。后来,这门课程逐渐演变成一份愈发完整的计算机视觉教学大纲,还形成了一套以项目为导向的课程结构。基于这些课程经验和在企业研究实验室的多年积累,Richard Szeliski 写了《计算机视觉:算法与应用》的第一版。他表示,这本书更加强调能够在现实世界发挥作用的基本技术,而不是高深的数学原理。第一版的《计算机视觉:算法与应用》共计 14 个章节,分别为:引言;
图像形成;
图像处理;
特征检测与匹配;
分割;
基于特征的对齐;
由运动到结构;
稠密运动估计;
图像拼接;
计算摄影学;
立体匹配;
3D 重建;
基于图像的渲染;
识别。
第二版的《计算机视觉:算法与应用》也是 14 个章节,分别为:引言;
成像;
图像处理;
模型拟合与优化;
深度学习;
识别;
特征检测与匹配;
图像对齐与拼接;
运动估计;
计算摄影学;
由运动到结构与 SLAM;
深度估计;
3D 重建;
基于图像的渲染;


可以看出,与第一版相比,第二版发生了很大的变化,其中最显著的变化包括:除此之外,该书还增加了一些当前最新的技术、文献和应用,如手机计算摄影学和自主导航技术。在之前的教学过程中,作者发现让学生实现一些小项目非常有用,有时这些项目甚至可以组成会议论文。因此,该书每一章末尾的练习都包含一些建议,针对一些期中小项目进行指导。此外,书中还包含一些尚未解决的开放性问题。该书适用于计算机科学和电气工程高年级本科生和研究生。读者上手之前最好先学习一门图像处理或计算机图形学课程,这样就能少花点时间学习数学基础知识,多一点时间去学计算机视觉技术。为了让读者了解该领域的最新进展,作者尽量引用最新的研究。Richard Szeliski 博士是计算机视觉领域的大师级人物,他在计算机视觉研究方面有 30 多年的丰富经验,主攻计算机视觉和计算机图形学。
Richard Szeliski 先后任职于 DEC(美国数字设备公司)和微软研究院。1996 年,他在微软研究院任职期间提出了一种基于运动的全景图像拼接模型,采用 L-M 算法,通过求图像间的几何变换关系来进行图像匹配。此方法是图像拼接领域的经典算法,Richard Szeliski 也因此成为图像拼接领域的奠基人。目前,Richard Szeliski 在 Facebook 担任研究科学家,他还是 Facebook 计算摄影部门的创始负责人。2017 年,Richard Szeliski 获得 ICCV 大会颁发的杰出研究奖。Richard Szeliski 表示,他的新书还处在勘误、征集建议的阶段,读者可以通过电子邮件与他联系。