一周之内完成融资,这就是 Transformer 的力量吗?
Hugging Face 的 transformer 模型在 GitHub 上现在有 6.2 万 star 量,一个星 1600 美元。五年前,一家来自纽约的创业公司 Hugging Face 宣布,它为那些颇感无聊的青少年打造了一款 iPhone 聊天机器人应用,可以分享一些电脑生成的人脸和笑话,也可以和 Siri 玩互动。换句话说,他们想打造一个可以理解任何类型对话主题的聊天机器人。「我们可以和人工智能谈论一切,就像你在科幻小说中看到的那样。」这款应用完全符合三位创始人的商业理念 —— 关于「开放领域的对话式人工智能」的想象,但基本没有让 Hugging Face 赚到什么钱。转机发生在 2018 年,相应的对象不是青少年,而是开发者。那时候,Hugging Face 的创始人开始在线免费分享应用程序的底层代码,包括谷歌、微软在内的一些知名科技公司的研究人员开始将其应用于自己的 AI 程序。如今,聊天机器人早已从 App Store 中下架,Hugging Face 已成为即用型机器学习模型的中心,超过 10000 家组织以这里为起点,为其业务创建了 AI 驱动的工具。今天,这家备受瞩目的开源创业公司 Hugging Face 宣布完成 1 亿美元 C 轮融资,本轮融资仍由 Lux Capital 领投,红杉资本和 Coatue 首次参与跟投,其他跟投的投资方包括 Addition、Betaworks 等 Hugging Face 原有的投资方。「机器学习正在成为构建技术、取代软件的新方式,」Hugging Face 的联合创始人兼 CEO Clément Delangue 说道,Hugging Face 的名字来源于一个表情符号,看起来像一张带有手势的笑脸。据官方公告,本轮融资将用于 Hugging Face 未来在人工智能研究、开源、产品和负责任的民主化方面的投入。因 Transformer 开源库走红
「自 2018 年首次开源 PyTorch BERT 以来,我们已经走了很长一段路,而且才刚刚开始!」图源:Hugging Face
大约在同一时间,谷歌和 OpenAI 的研究人员公布了 Transformer 模型,这种全新的 NLP 模型打破了当时 AI 模型阅读理解能力的最好记录。随后,谷歌开始使用这种模型为其搜索结果提供支持。对于想要利用这些 NLP 突破,但不可能像谷歌一样从头从搭建模型的机构来说,Hugging Face Transformer 开源库的出现正赶上一个完美的时机。在此后的时间里,随着机器学习社区越来越多成员将 Hugging Face 作为部署 Transformer 模型的中心基地,这家公司几乎一炮而红。「我们发布东西时没有考虑太多,而社区的爆炸式增长甚至让我们感到惊讶,」Clément Delangue 说。目前,Hugging Face 在 GitHub 平台上的 Transformer 开源库已经有 62000 个 Star 和 14000 个分支。由于该工具的成功,Hugging Face 很快成为所有机器学习模型相关内容的主要存储库 —— 不仅是自然语言处理。在该公司的网站上,人们现在可以浏览数千个预训练的机器学习模型,使用你自己的模型参与开发者社区、下载数据集等等。现在,Hugging Face 已经成为增长最快的社区和最常用的机器学习平台,拥有 10 万个预训练模型和 10000 个数据集,涵盖自然语言处理、计算机视觉、语音、时间序列、生物、强化学习、化学等领域。Hugging Face 正在试图打造「机器学习领域的 GitHub」。它是一个社区驱动型的平台,拥有大量资源。开发人员可以在机器学习模型、数据集和 ML 应用程序上不断创建、创新和互相协作。Hugging Face 还提供托管服务,允许你通过编程接口使用数千个模型的推理 API,以及「自动训练」模型的能力。CEO:不想和 GitHub 一样卖公司
在接受福布斯采访时,Clément Delangue 表示,GitHub 是面向软件的开源社区,而 Hugging Face 正在成为面向机器学习的社区。2018 年,GitHub 以 75 亿美元的价格被微软收购,它最后的收入记录是 3 亿美元。目前,超过 7000 万开发人员使用 GitHub 来共享和协作代码。据三位熟悉其财务状况的人士称,相比之下,Hugging Face 去年的收入不到 1000 万美元。Delangue 没有对这个数字发表评论,但他和投资者都认为机器学习已经成为 2020 年代最重要的一项技术。Delangue 认为,如果 Hugging Face 有足够多的忠实用户,那么公司就能从雇佣这些用户的企业身上获得资金。「基于机器学习的价值以及它正在成为主流,会存在递延收入,」Delangue 说。「我不确定机器学习是否会成为构建技术的默认方式,也不确定 Hugging Face 会成为这方面的 No.1 平台,我们也未曾设法创造数十亿美元的收入。」过去一年里,Hugging Face 的团队成员从 30 多人增加到了 120 多人。图源:Hugging Face
在本轮融资过后,Hugging Face 计划继续现有的道路,现在已有超过 1 万家公司正在使用该公司的服务。Clément Delangue 透露,Hugging Face 去年才开始提供付费功能,并拥有 1000 多家公司作为客户,其中包括英特尔和他的老东家 eBay。药企辉瑞(Pfizer)和罗氏(Roche)为企业级安全功能付费,而彭博社则通过 Hugging Face 为其实时终端运行机器学习。微软不是客户,但使用了 Hugging Face 作为基础来训练必应搜索引擎,以更好地理解自然语言查询。本轮融资领投机构 Lux Capital 的合伙人 Brandon Reeves 表示:「无论是谷歌、亚马逊还是 Facebook,你一开始会认为是竞争对手的公司,现在几乎都成为了支持者,就像生态系统中的一块不动产。」Clément Delangue 则认为:「作为一名企业家,我的个人心得之一是不要对十年的大型商业计划进行过多的战略思考,而是更多地进行实验,遵循社区的验证以及他们告诉你的内容。」如果愿景成真,Brandon Reeves 认为奖金可能是 500 亿美元或 1000 亿美元的股市市值。这或许可以解释,Clément Delangue 为何说自己拒绝了多个「有意义的收购要约」,并且不会像 GitHub 对微软那样出售自己的业务。关于未来,Hugging Face CEO 还有一些有趣的想法:「我们希望成为第一家以表情符号上市的公司,而不是三个字母的股票代码。」他带着类似公司 Logo 表情符号的微笑说:「我们必须开始对纳斯达克进行一些游说,以确保这件事能够发生。」参考链接:https://huggingface.co/blog/series-c 工程Transformer融资Hugging Face