在这里,他的身份除了清华交叉信息研究院的助理院长之外,还有刚刚成立不到半年的「图灵人工智能研究院」副院长。
由姚期智院士牵头创办的图灵人工智能研究院,并不是清华的一个新院系,而是一家注册在南京的公司。当然,这家公司和清华有千丝万缕的联系:它由清华交叉信息学院的教授们组建,为交叉信息学院的科研成果做转化服务,并且因为公司本身是清华团队的科研成果转化形成的公司,公司部分属于学校。姚院士也向清华大学郑重承诺,他在公司未来所有股权收益,都将捐赠给清华大学教育基金会。
「我们希望帮老师们走通一条从科研,到孵化,到对接投资,甚至反哺科研的道路。通过帮他们解决政策上的、时间上的、团队上的、资源投入上的任何顾虑,给他们一个自由宽松的科研环境,也让他们的研究真正落地。」
从第一步搭实验室,到最后一步拉电线
「学校对科研成果的转移转化一直是很支持的。」徐葳介绍道。
有着深厚科研积淀的清华,在 2015 年出台了明确的知识产权转化与分配相关规定:「科技成果转化所获现金收益或股权,学校享有 15%,原则上成果完成人所在院系和对完成、转化该项科技成果做出重要贡献的人员分别享有 15% 和 70%。」
但是即使学校对此持有赞成与支持的态度,给出了正向的激励,科研成果走出校门之后的转化之路,也仍然超乎想象的漫长。
「开公司和做科研非常不一样,有时候越是学术做得好的老师越不擅长开公司」,徐葳笑称,「很多 VC 找到我们院的老师,跟他说你这东西不错,我投资你开公司吧。但是你是个教授,所以你就好好做教授,把知识产权给我吧:你占 10%,我占 90% 怎么样?」。然而即使是这样听起来非常离谱的条件,很多老师仍然因为不了解或者没有其他好的转化途径而选择合作。「从做出科研成果到获得经济价值,尤其是获得值得的经济价值,还有很长的距离。所以我们觉得还是应该自己来做创业孵化指导,我们不希望自己的老师作出了研究成果却收不回应有的价值。」
抱着这样的想法,图灵研究院在今年 4 月正式成立,如今已经有十多个项目开始了孵化。不过如果对比传统孵化器的业务范畴,你会对图灵的服务覆盖长度与广度大跌眼镜:图灵的所谓「孵化」,可以从「一位老师产生了一个科研想法」开始,到「调试和运维一个 IoT 摄像头」为止,跨过一个项目完整的生命周期和产业链上下游。
在项目最早期,图灵对孵化项目进行「科研支持」。
第一批就位的图灵全职员工包括 HR 与行政助理,紧接着公司还会招聘一批专职研发人员:「有一些想法,不是最最前沿的科研,但是是一个有趣的、可能会有用的课题。这样的探索性项目可能不适合清华的博士生做毕业课题,而且我们全院一共就 23 位老师,每年最多招收二十多位博士,也没有大量人手去做。同时一个课题没有商业计划书,普通投资人也没法做风险收益评估,也没法以普通投资行为支持它。」在徐葳看来,这就是「科研支持」要做的事:「如果我们判断,这个课题然很难、需要探索,但是并不是做不出来,而且做出来会很有用,那我们就会以支持科研的心态支持它:如果之后有收益那我们共同分享,如果最后没有收益只有科研成果,我们也一起承担风险。」
图灵可以为团队提供科研经费、提供人事管理支持,甚至提供研究场所:「我们孵化的一个公司是做 AI 新药研发的。用 AI 技术判断哪些分子和靶点有作用。AI 筛药的速度那么快,当然需要专门的实验室批量化地去做实验来验证,我们在南京帮他做了一个实验室,700 多平米,还帮他招了一支做实验的团队。」
而当项目从科研阶段走到落地阶段,图灵希望给予的是产业链模块化的支持和上下游的模块化服务,这部分支持,被图灵称作「公共技术服务」。
「清华建筑系的毕业生未必盖得出房子,因为他不会砌砖拉电线。砌砖拉电线是脏活累活,但一定要有人干。建筑落地是这样,AI 落地也是这样。不一样的是建筑行业存在大量技术工人,而 AI 行业没有。」因此图灵格外关注 AI 系统想要「生存」所必须的上下游支持。
公共技术服务包括可以提供分布式计算系统的平台,而这是徐葳自己的专长,「分布式计算这里我们没有什么特别好的资源能整合进来,自己又擅长开发这些,就先开发了,再给其他人用」。
当然,负责「砌墙拉电线」的公司也是公共服务里重要的一环:「这个我们还真不会,他们可以接网线,做 IoT 设备的选型、部署、运维,调试每一个摄像头,这都是 AI 落地的必要环节」。
某种程度上,这相当于谷歌的一个基础设施部门。「谷歌的系统平台有超过一千人在开发和维护。这是谷歌做 AI 的算法工程师『炼丹』的基础。如果没有基础设施团队,一个算法工程师想要靠自己把算法部署在两台机器上都很难,更别说一千台了。人类第一次展示很多深度学习用例都在谷歌。并不是这些算法有多么艰深,以至于普通工程师完成不了,而是从 TensorFlow 到 TPU 等大机群的全面系统支持,让谷歌的工程师能首先完成这些算法的部署。」
图灵的项目也大多沿袭着这一「做系统」的思路。比如做 AI 病理图像诊断的透彻影像,成立后的第一件事是为病理医生量身定制了一套非常完备的标注系统:能用 iPad 和 Apple Pencil 标注,还能在标注完成后利用算法控制标注质量。这套标注系统的组件也是之后诊断系统最核心的组成部分。同时从第一天部署开始,透彻就在做分布式系统的机群架构,为未来一年可能需要的算力而未雨绸缪。
「做算法的人总是希望有清洗好的标注好的数据,能把问题限定在算法。我们是做系统的人,我们做的就是弄个铁盒子把七七八八的零件装在一起,和『砌砖拉电线』很像。」
除了产业链上下游的服务之外,徐葳所设想的公共技术服务还包括模块化的算法,语音识别、人脸识别,这些 AI 最先「攻克」的,最先成为基础能力的模块,以及开放的、用于优化和可靠使用这些模块的机器学习系统。有了这些公共技术加持,企业不用端到端地开发每一个轮子,而是拿着最优的轮子去完成产品,对企业自身的创新能力也是一种提高。「AI 一定不是拿着一个单独的技术出去当产品卖,而是很多零件组合起来的。这时候每个公司都重做全部零件,就是资源浪费了。我希望我们这儿什么都有,供应商能提供各种技术的模块,然后企业把模块聚集起来,做成好的产品。」
钉子,锤子与石头
但是什么才是好的产品?
「好产品不是甲方提出来的,因为甲方提出来想要的东西一定是你实现不了的。」在徐葳看来,不了解技术的人,对技术的想象常常过于科幻或者过于理想化。「你去问一个普通公司的老板,你能不能用上 AI?他说能啊!我希望有一个自动客服,客户来了就陪他聊天,把前台都替换掉。可是 AI 公司的前台都还坐着真人呢。」
但研究人员研发出了好算法也不等于做出了好产品。「人家总说,我们做技术的人就是举着一个锤子,看哪儿都像钉子,都要去砸一砸。但问题是,但凡是迫切要砸进去的钉子,不等我们造出锤子,人家早就捡了块石头砸进去了。钉子长时间存在却没被砸进去,说明它不需要砸。」
因此徐葳觉得,这就是需要技术专家从学校里走出去,落地看看外界的真实需求的时候了。
「这轮 AI 能不能解决所有的问题?肯定不能,差远了。」现有的 AI 算法能够解决得好的问题只有屈指可数的几个,如果想要解决更多的问题,不能只靠对现有算法细枝末节的改进,也不能依赖工程上「炼丹技术」的提升,而是需要真正的突破,这种突破何时发生?没有人可以预期。
所以如今的现实是,「技术都是这些技术,准确程度就是这种准确程度。但是市场到底需要什么?是更快?更准?还是其他的某个需求?」人脸识别算法准不准?很准,但是做成门禁、代替了一把钥匙,或者一个检票员,带来的本质好处有多大?肺结节识别算法准不准?也很准,但是医生其实一眼就可以识别出结节,顺带着识别出其他数百种可能的异常。「真实的需求可能和研究人员想象中的应用完全不一样。」
AI 时代什么最宝贵:人才!
成立至今,图灵已经有十二、三个在商谈中的项目了,其中大部分来自交叉信息学院老师们的科研成果转化或者科研合作项目,也有部分来自校友的对接。
与其说图灵在选择项目,不如说图灵在选择人。「拿制药行业做对比,药物研发人员把专利交给后期制药的的团队之后就可以撤出了,而人工智能专利往往具有欺骗性:一个是你拿了专利也不知道有什么用,另外还可以有十几种方法可以绕过这个专利做同样的事儿。」因此,看好一个项目,意味着「你只能把这个团队招了」。
而图灵青睐的团队就非常体现交叉信息学院的特色了:都是有着真正深入的交叉背景的人。
生物背景的人会写点程序的很多,但是懂计算机科学的很少,反过来,计算机背景的人真正理解生物学需求的人就更少了。「生物信息学来源于以为自己有数据处理需求的、生物背景的人,他们做甲方,雇了一些不懂生物的做计算机的人来处理,最后经常发现想象中的解决方案未必适合这个问题。」
「图灵签的 AI 新药研发的公司,是第一个纯计算机背景的人领导的药物研发公司。」这位教授在读计算机博士期间跟着同样履历的导师从计算机转向了生物,所以他会做实验、知道生物学的研究方法,同时也有非常扎实的计算机理论知识。
除此之外,还有计算机科学家与经济学家一起试图从政策制定者和城市规划者的高度探讨智慧城市问题、和监狱管理者一起研究如何根据现有的信息化水平使用司法数据做出犯人的画像和风险评估、和医生一起从医疗影像标注问题的简单化与日常化开始解决影像分析问题。
而随着这些团队一起成长的是图灵为创业提供支持的环境。
「有了小的成功和可持续发展的预期,很多在海外大公司的中国人也就回来了,等他们回来之后,就又可以进行更大的尝试了。而这一切,总要从一个基础开始。」