作者:小岩
编辑:彩云
就在最近,昔日就职于OpenAI的工程师Pavel Izmailov正式加入了马斯克的AI团队,他还在自己的推特上大张旗鼓的做着宣传:研究院@xai。
AI工程师的跳槽本不值得惊讶,但Pavel的跳槽却在行业内引起了不小的热议。就在半年前,Pavel因被指疑似泄露Q*的相关机密而被OpenAI开除。至此,马斯克和OpenAI 的梁子算是越结越深了。
马斯克公开聘请“泄密者”,业内对此褒贬不一。
最近马斯克旗下的xAI发展迅速,聘用了不少新员工,其中最为神秘,也最惹人瞩目的,当属Pavel Izmailov。毕竟,就在半个月以前,他主页还写着“在OpenAI搞搞大模型推理”的介绍。
翻看Pavel的简历,会发现他的成长经历很不一般。他是纽约大学CILVR小组成员(本人还透露即将在2025年秋加入纽约大学 Tandon CSE和Courant CS 担任助理教授) 。此前,他一直服务于超级对齐团队。超级对齐发布的第一篇论文的作者,也是Pavel。
超级对齐团队成立于去年 7 月份,是OpenAI为应对不同时间尺度上大模型可能会产生的安全问题,所成立的三大安全团队之一。概括说来,超级对齐团队负责的是遥远的未来,给超越人类的超级智能安全性奠定基础。超级对齐团队由Ilya Sutskever和Jan Leike领导。
对于外部,OpenAI十分重视安全问题和保密问题,但其内部对 AI 的安全开发却存在着很大的争议和分歧,这俨然成为了公开的秘密。甚至有人猜测,这种分歧是去年 11 月OpenAI 董事会宫斗大戏发生的最主要原因。
网传技术主导者 Ilya Sutskever 成为 “政变 ”带头人,究其原因,是因为看到了一些东西让他内心不安。在Ilya 带领的超级对齐团队里,很多成员站在 Ilya 这边。宫斗事件最终以Sam Altman重回董事会为结束的标志,从某种程度上说,Ilya是此次宫斗的失败者。在此之后,他仿佛从OpenAI 蒸发了一般,惹得外界流言四起,但他再也没有公开露面过,甚至都没在网上进行澄清或辟谣。
Pavel作为超级对齐团队成员,Ilya的部下,被认为是Ilya的支持者。他的“被开除”,也被很多网友猜测是在被Sam Altman秋后算账。
有着复杂背景的Pavel前脚刚被开除,后脚就被马斯克聘用。对于马斯克这样的行为,有人认为他是把握住了人才,抢占了先机;但也有人对此嗤之以鼻,认为“雇佣泄密的人的行为就像是在捡垃圾”,无疑是自掘坟墓。
有新仇更有旧恨:马斯克与OpenAI之间的“相爱相杀”...
事实上,“聘用泄密员工”并不是马斯克第一次“得罪”OpenAI。
今年2月29日,马斯克对于ChatGPT 主体 OpenAI发起起诉,称其违反了他在2015年帮助创建OpenAI时同意的原则,同时被起诉的还有OpenAI的CEO Sam Altman。
马斯克的诉讼文件长达46页,共计1.4万字,包括一些曾不为人知的内幕细节。马斯克在起诉中表示,OpenAI已经背离了其最初非营利及开源的使命,即开发技术以造福人类而不是利润。如今的它并没有像它成立时那样试图“造福人类”,反而专注于为主要投资者微软“实现利润最大化”。由于微软大量资金投入OpenAI,使得OpenAI似乎成了微软的私有开源产品。
当然,不排除马斯克这样做是有私心的,当年早早的离开OpenAI董事会,以至于现在没有了话语权,而且马斯克当年给OpenAI的捐助,在其后来成立盈利子公司时没有转化成相应的股份回报。加上去年3月,马斯克创办了自己的人工智能公司 xAI,与OpenAI形成了竞争关系。如今,马斯克又选择雇用明显有错的OpenAI离巢员工,显然会让彼此之间的竞争变得更加激烈。
人才济济的xAI,马斯克是准备在AI赛道放大招了吗?
当然,最近马斯克的xAI所网罗到的人才,远不止Pavel自己。
尽管外界还不知道Q*的真实面貌是怎样的,但就目前释放出的信息,以下的优势Q*是一定具备的:可以将大模型与强化学习和搜索算法等有机结合结合起来;增强 AI 推理能力等。
所以,马斯克麾下新招揽的几名员工的研究方向,多多少少是与之有关的。
Qian Huang,目前还是斯坦福大学的一名博士生。去年夏天开始,Qian Huang 在 Google DeepMind 工作,但目前,她在推特上已经明确注明了@xai。尽管我们还不知道她在xAI具体担任的职务是什么,但从 GitHub 个人主页可以看到,她的研究方向是将机器推理与人类推理结合起来,特别是新知识的合理性,可解释性和可扩展性方面的研究。
Eric Zelikman,斯坦福博士在读生,推特上写明 “study why @xai”。之前,他先后在 Google 研究院和微软研究院待过一段时间。他在个人主页上说:“我对算法如何(以及是否)能够学习有意义的表示和推理很着迷,我正在 xAI 研究这回事儿。”
Aman Madaan,卡内基梅隆大学语言技术研究所博士在读生。他的研究领域包括大型语言模型,反馈驱动的生成以及代码生成和自然语言推理的交叉领域,研究的首要主题是使用推理时间计算(Inference-Time Compute)来增强推理能力(Reasoning) 。攻读博士学位期间,Aman 曾担任 Google 大脑和艾伦人工智能研究所的学生研究员和合作者;更早以前,他还是 Oracle 的主要技术人员。
通过分析马斯克新招人员的履历,我们可以发现,新员工主要还是集中于谷歌,斯坦福,meta,OpenAI,微软等机构。他们都有名校背景,拥有丰富的大模型训练经验,诸如GPT 系列,谷歌meta 相关大模型等。
如果加上 Pavel Izmailov 在内的几位新员工,自此马斯克的技术人才版图已扩增至 34 人(不包括马斯克本人),相比于最开始 12 人的创始团队增长了约 2 倍。