今年 5 月份,OpenAI 发布了震惊世界的 GPT-4o。这个模型可以跨越文本、视觉和音频,以一种非常自然的形式和人类语音对话,延迟低到与人类在对话中的响应时间相似。而且,它允许用户随时打断,并能感知和回应用户的情绪。因此,该模型发布后,很多人说科幻电影《Her》中的场景照进了现实。
此次离职的 Alexis Conneau 就是 GPT-4o 项目的关键人物之一。离职前,他是 OpenAI 音频 AGI 研究负责人,也是 OpenAI 最早提出 Her 愿景的人。他在领英的个人简介中写道,他是「专注于多模态和音频 AGI 的人工智能研究员,在 OpenAI 领导了『Her』的研究(GPT4-o 和 GPT-5),这是首个原生集成音频的 GPT 模型。」
关于离职后的创业方向,Conneau 还没有透露详细信息。但在被问及「AGI 时间表」时,他回答说自己更想追求「通用情感智能(General Emotional Intelligence,AGEI)」。
Conneau 的离职帖子引起了很多人关注,相信很多 VC 已经开始行动了。
有意思的是,直到 Conneau 离职,他参与构建的 GPT-4o 还没有向全部用户开放,目前只有部分 ChatGPT Plus 用户可以使用(此前有消息称今年秋季向所有 Plus 付费用户开放)。
同时,他的离职也加重了外界的疑问:最近那么多人离职,OpenAI 到底发生了什么?
Alexis Conneau 个人经历
Alexis Conneau 本科毕业于巴黎综合理工学院(法国的工程师大学,在法国各类院校中常年排名第一),也在该校拿到了硕士学位。之后,他又获得了巴黎 - 萨克雷高等师范学校的机器学习硕士学位。这一阶段,他打好了数学和计算机科学的教育基础。
之前有报道称,他在巴黎综合理工学院学习的是纯数学,并且他喜欢思考数字。而当时,科技行业已经将数字游戏变成了一种价值数十亿美元的艺术形式。所以当他毕业时,他选择了科技。
2015 年,Conneau 加入了 Facebook 在巴黎的新人工智能实验室。该实验室是在美国顶尖科技巨头的全球扩张行动中成立的:每个人都想在全球最有才华的研究和工程专业学生毕业前将他们招揽过来。2019 年,Conneau 拿到了他的博士学位。
之后,Conneau 先后在 Facebook AI Research 、谷歌和 OpenAI 工作,并在文本和语音神经网络领域做出过重要贡献。
他的主要成就如下:
在 OpenAI 通过 GPT-4o 创建了第一个版本的「Her」。Conneau 表示,是他将这一愿景带到了 OpenAI,并与一位同事合作,(几乎)从零开始构建了这个音频 LLM 研究。
创建了首个能够在没有任何监督的情况下翻译文本和转录语音的神经网络(无监督 MT 和 ASR)。
为文本和语音构建了通用的多语言掩蔽语言模型表示(XLM-R、Wav2vec 2.0 XLS-R)。
在 Meta 和谷歌推广这些语言模型表示,通过文本分类、机器翻译和语音识别等各种应用影响了 10 亿用户。
发现了「零样本跨语言迁移('zero-shot cross-lingual transfer)」的概念,证明多语言语言模型在单一语言上经过微调后,可以在其他语言上有效运行(XNLI、XLM)。
开源 Facebook AI Research 最受欢迎的基础文本和语音掩蔽语言模型(XLM-R 和 Wav2vec 2.0 XLS-R),可在 Hugging Face 上获取。
此外,他还曾在 EMNLP(2017 年、2018 年)和 SLT(2022 年)上获得最佳论文奖,并在 JMLR、NeurIPS 和 ICML 等顶级期刊和会议上发表过论文。他的工作极大地增强了服务于数亿人的文本和语音系统。
三年前,《华盛顿邮报》为他写过一篇专题文章。
报道链接:https://www.washingtonpost.com/technology/2021/07/01/humans-ai-language-advances-risks/
关于 Conneau 新公司的信息,我们将跟进报道,敬请期待。