2022/05/10 14:27

小舟、泽南报道

一枚笑脸emoji，估值20亿美元：Hugging Face官宣1亿美元C轮融资

一周之内完成融资，这就是 Transformer 的力量吗？

Hugging Face 的 transformer 模型在 GitHub 上现在有 6.2 万 star 量，一个星 1600 美元。

五年前，一家来自纽约的创业公司 Hugging Face 宣布，它为那些颇感无聊的青少年打造了一款 iPhone 聊天机器人应用，可以分享一些电脑生成的人脸和笑话，也可以和 Siri 玩互动。换句话说，他们想打造一个可以理解任何类型对话主题的聊天机器人。

「我们可以和人工智能谈论一切，就像你在科幻小说中看到的那样。」

这款应用完全符合三位创始人的商业理念 —— 关于「开放领域的对话式人工智能」的想象，但基本没有让 Hugging Face 赚到什么钱。

转机发生在 2018 年，相应的对象不是青少年，而是开发者。那时候，Hugging Face 的创始人开始在线免费分享应用程序的底层代码，包括谷歌、微软在内的一些知名科技公司的研究人员开始将其应用于自己的 AI 程序。

如今，聊天机器人早已从 App Store 中下架，Hugging Face 已成为即用型机器学习模型的中心，超过 10000 家组织以这里为起点，为其业务创建了 AI 驱动的工具。

今天，这家备受瞩目的开源创业公司 Hugging Face 宣布完成 1 亿美元 C 轮融资，本轮融资仍由 Lux Capital 领投，红杉资本和 Coatue 首次参与跟投，其他跟投的投资方包括 Addition、Betaworks 等 Hugging Face 原有的投资方。

「机器学习正在成为构建技术、取代软件的新方式，」Hugging Face 的联合创始人兼 CEO Clément Delangue 说道，Hugging Face 的名字来源于一个表情符号，看起来像一张带有手势的笑脸。

据官方公告，本轮融资将用于 Hugging Face 未来在人工智能研究、开源、产品和负责任的民主化方面的投入。

因 Transformer 开源库走红

「自 2018 年首次开源 PyTorch BERT 以来，我们已经走了很长一段路，而且才刚刚开始！」

图源：Hugging Face

大约在同一时间，谷歌和 OpenAI 的研究人员公布了 Transformer 模型，这种全新的 NLP 模型打破了当时 AI 模型阅读理解能力的最好记录。随后，谷歌开始使用这种模型为其搜索结果提供支持。

对于想要利用这些 NLP 突破，但不可能像谷歌一样从头从搭建模型的机构来说，Hugging Face Transformer 开源库的出现正赶上一个完美的时机。

在此后的时间里，随着机器学习社区越来越多成员将 Hugging Face 作为部署 Transformer 模型的中心基地，这家公司几乎一炮而红。「我们发布东西时没有考虑太多，而社区的爆炸式增长甚至让我们感到惊讶，」Clément Delangue 说。

目前，Hugging Face 在 GitHub 平台上的 Transformer 开源库已经有 62000 个 Star 和 14000 个分支。

由于该工具的成功，Hugging Face 很快成为所有机器学习模型相关内容的主要存储库 —— 不仅是自然语言处理。在该公司的网站上，人们现在可以浏览数千个预训练的机器学习模型，使用你自己的模型参与开发者社区、下载数据集等等。

现在，Hugging Face 已经成为增长最快的社区和最常用的机器学习平台，拥有 10 万个预训练模型和 10000 个数据集，涵盖自然语言处理、计算机视觉、语音、时间序列、生物、强化学习、化学等领域。

Hugging Face 正在试图打造「机器学习领域的 GitHub」。它是一个社区驱动型的平台，拥有大量资源。开发人员可以在机器学习模型、数据集和 ML 应用程序上不断创建、创新和互相协作。

Hugging Face 还提供托管服务，允许你通过编程接口使用数千个模型的推理 API，以及「自动训练」模型的能力。

CEO：不想和 GitHub 一样卖公司

在接受福布斯采访时，Clément Delangue 表示，GitHub 是面向软件的开源社区，而 Hugging Face 正在成为面向机器学习的社区。

2018 年，GitHub 以 75 亿美元的价格被微软收购，它最后的收入记录是 3 亿美元。目前，超过 7000 万开发人员使用 GitHub 来共享和协作代码。

据三位熟悉其财务状况的人士称，相比之下，Hugging Face 去年的收入不到 1000 万美元。Delangue 没有对这个数字发表评论，但他和投资者都认为机器学习已经成为 2020 年代最重要的一项技术。

Delangue 认为，如果 Hugging Face 有足够多的忠实用户，那么公司就能从雇佣这些用户的企业身上获得资金。

「基于机器学习的价值以及它正在成为主流，会存在递延收入，」Delangue 说。「我不确定机器学习是否会成为构建技术的默认方式，也不确定 Hugging Face 会成为这方面的 No.1 平台，我们也未曾设法创造数十亿美元的收入。」

过去一年里，Hugging Face 的团队成员从 30 多人增加到了 120 多人。

图源：Hugging Face

在本轮融资过后，Hugging Face 计划继续现有的道路，现在已有超过 1 万家公司正在使用该公司的服务。

Clément Delangue 透露，Hugging Face 去年才开始提供付费功能，并拥有 1000 多家公司作为客户，其中包括英特尔和他的老东家 eBay。药企辉瑞（Pfizer）和罗氏（Roche）为企业级安全功能付费，而彭博社则通过 Hugging Face 为其实时终端运行机器学习。微软不是客户，但使用了 Hugging Face 作为基础来训练必应搜索引擎，以更好地理解自然语言查询。

本轮融资领投机构 Lux Capital 的合伙人 Brandon Reeves 表示：「无论是谷歌、亚马逊还是 Facebook，你一开始会认为是竞争对手的公司，现在几乎都成为了支持者，就像生态系统中的一块不动产。」

Clément Delangue 则认为：「作为一名企业家，我的个人心得之一是不要对十年的大型商业计划进行过多的战略思考，而是更多地进行实验，遵循社区的验证以及他们告诉你的内容。」

如果愿景成真，Brandon Reeves 认为奖金可能是 500 亿美元或 1000 亿美元的股市市值。这或许可以解释，Clément Delangue 为何说自己拒绝了多个「有意义的收购要约」，并且不会像 GitHub 对微软那样出售自己的业务。

关于未来，Hugging Face CEO 还有一些有趣的想法：「我们希望成为第一家以表情符号上市的公司，而不是三个字母的股票代码。」

他带着类似公司 Logo 表情符号的微笑说：「我们必须开始对纳斯达克进行一些游说，以确保这件事能够发生。」

参考链接：https://huggingface.co/blog/series-c

工程Transformer融资Hugging Face

相关技术

推理网络 OpenCV

机器学习技术

机器学习是人工智能的一个分支，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论，机器学习与推断统计学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法。

来源：Mitchell, T. (1997). Machine Learning. McGraw Hill.

人工智能技术

在学术研究领域，人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体（intelligent agent）

来源：Russell, S., & Norvig, P. (2003). Artificial Intelligence: A Modern Approach.

计算机视觉技术

计算机视觉（CV）是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

来源：机器之心

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话，通过图灵测试。聊天机器人可用于实用的目的，如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统，但大多简单的系统只会撷取输入的关键字，再从数据库中找寻最合适的应答句。

来源：维基百科

查询技术

一般来说，查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域，查询指的是数据库和信息系统对信息检索的精确要求

来源：Wikipedia

自然语言处理技术

自然语言处理（英语：natural language processing，缩写作 NLP）是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言；自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

来源：维基百科

强化学习技术

强化学习是一种试错方法，其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划（Dynamic Programming）。流行的强化学习方法包括自适应动态规划（ADP）、时间差分（TD）学习、状态-动作-回报-状态-动作（SARSA）算法、Q 学习、深度强化学习（DQN）；其应用包括下棋类游戏、机器人控制和工作调度等。

来源：机器之心