学术研究的专利归属对于学者而言很重要,是对自己所做工作的保护和肯定。但如果因公司变故而将自己参与研究的专利分了出去,后续研究还怎么搞?深度学习三巨头之一、卷积神经网络之父 Yann LeCun 就曾遇到过这种「烦心事」。
卷积神经网络(ConvNet/CNN)有两项专利:一个是具有 strided convolution 的 ConvNet,另一是具有独立池化层的 ConvNet。它们分别于 1989 和 1990 年提交,并于 1990 和 1991 年获准。
我们最开始与一个构建基于 ConvNet 的 OCR 系统的开发团队合作。此后不久,AT&T 收购了 NCR 公司,后者正为银行构建支票成像器和分类机,然后支票图像被发送给人类操作员进行转录。显然,NCR 想要实现这些业务的自动化。 我们最终构建了一个完整的支票读取系统,该系统足够可靠,可以进行部署。银行从 1995 年起开始商业部署。该系统可以读取大约一半的支票(机器打印或手写),并将另一半发送给人类操作员。
实际上,首次部署是在 ATM 机上实现金额验证(由法国 CMB 银行率先部署)之前一年进行的。接着 1996 年出现了重大变故:AT&T 拆分成了 AT&T(服务)、Lucent(朗讯,电信设备公司)和 NCR。 我们的研究(research)团队留在了 AT&T(包括 AT&T Labs-Research),工程(engineering )团队则去了 Lucent,产品(product )团队去了 NCR。在律师们的努力下,ConvNet 的专利最终分配给了 NCR,因为他们销售的正是基于 ConvNet 的产品。
所以,我停止了 ML 的研究工作。当时,神经网络正变得不再受欢迎,我开始与 Léon Bottou(法国学者,因机器学习与数据压缩的工作而闻名)致力于一个名为 DjVu 的互联网图像压缩项目。我们在 20 世纪 90 年代早期写了一系列关于这方面工作的论文。(注:LeCun、Léon Bottou 以及另一位学者 Patrick Haffner 都是 DjVu 图像压缩技术的主要创建者) 直到 2002 年离开 AT&T,我才重新开始 ConvNet 的研究工作。我希望 NCR 没人意识到他们拥有我所做研究的专利。事实上确实没有。2007 年该专利到期时,我开了香槟庆祝。
所以我们从这个故事中得到的启发是:当专利与最适合构建他们的人分开时,专利系统可能会起到反作用。对于实体的东西来说,专利是合理的,但对于软件这种东西来说,它几乎从来都不适用。