Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Transformer作者之一Niki Parmar加入Anthropic,参与Claude 3.7 Sonnet研究

今天凌晨,Anthropic 的新旗舰模型如约而至,发布全球首个混合推理模型 Claude 3.7 Sonnet

在这铺天盖地的宣传中,我们看到了经典 Transformer 论文作者之一 Niki Parmar 的身影,她是 Transformer 唯一女性作者。

从她的推文我们不难发现,Niki Parmar 已经早早加入了 Anthropic,时间大概是去年 12 月。在这期间,Niki Parmar 参与了 Claude 3.7 Sonnet 研发过程,并表示自己能够参与进来很激动。
image.png
如果不是宣传自家产品,或许大家都还不知道 Niki Parmar 已经加入 Anthropic 的消息。

不断追求挑战的Niki Parmar
图片
Niki Parmar 是一位来自印度的工程师,硕士毕业于美国南加州大学。曾在印度软件公司工作,后来搬到了美国。

Niki 在求学时,还遇到过小挫折,当时她没能考上印度理工学院 (IIT) ,为此受到了很大的打击。对于许多印度学生来说,IIT 是通往梦想职业的大门。

未能考上印度理工学院的挫折并没有让她放弃。相反,她进入了一家私立工程学院,开始自学人工智能。没有人教她,她只是一头扎进去,边做边学 —— 参加在线课程,做一些业余项目。

毕业后,Niki 前往美国攻读硕士学位。

2015 年 Niki 选择加入谷歌,成为团队中最年轻的成员,也是当时唯一一位没有博士学位的成员。她成功踏入了一个充满 AI 领域最聪明人才的世界。

「一开始确实有点吓人,」Niki 表示。「但这也是一次难忘的学习经历。我身边总是围绕着一群不断突破人工智能极限的人。」

Niki 并不满足于完成分配给她的任务,她开始主动深入研究新兴的 Transformer 模型。没有人告诉她要研究这个,她只是想看看它能走多远。

Niki 的自发努力得到了回报。Niki 将 Transformer 架构应用于不同的模态,包括图像、音频,甚至 3D 视觉,突破了 AI 模型所能实现的极限。

即使在与他人共同撰写了影响深远的 Transformer 论文后,Niki 也不相信自己已经成功了。她的动力来自持续的好奇心。她总是对自己说「总有更多的东西需要学习。我不想只因为 Transformer 模型而被人们记住。我一直在寻找下一个挑战。」

或许是为了追求下一个挑战,Niki 在 2021 年选择离开。她参与构建的 Transformer 模型,成为 ChatGPT 等现代人工智能系统背后的基石。
image.png
离开谷歌后,Niki 选择创业,成为 Adept AI 的联合创始人兼首席技术官。

Adept AI 的创始团队非常豪华,联合创始人兼首席执行官 David Luan 曾是 OpenAI 的工程副总裁,深度参与了 GPT-2 和 GPT-3 的开发,后来加入谷歌领导大模型相关工作。联合创始人兼首席科学家 Ashish Vaswani,同样也是 Transformer 架构的提出者之一。不过,令人遗憾的是,这几位大佬都已经离开了 Adept AI。

离开 Adept AI 后,Niki 和 Ashish 又共同创办了大模型初创公司 Essential AI。当时谷歌、英伟达、AMD 等科技巨头都有参与投资。

2024 年 9 月,Niki 离开 Essential AI,并于今年 1 月正式加入 Anthropic,参与到构建 Claude 3.7 Sonnet 的项目上来。
2025-02-25_102739.png
截止到现在,Niki 的论文引用量已经达到 18 + 万次。
image.png
在这条推文下,大家纷纷表示祝贺,包括 GoogleDeepMind 研究总监 Dumitru Erhan 等人。
image.png
我们也期待 Niki 为 Anthropic 带来更开创性的研究。

参考链接:https://www.ndtv.com/ai/how-niki-parmar-went-from-self-taught-coder-to-modern-ai-pioneer-6706892
产业Niki ParmarAnthropic
暂无评论
暂无评论~