近期,a16z联合创始人本·霍洛维茨(Ben Horowitz)与普通合伙人埃里克·托伦伯格(Erik Torenberg)与山姆·奥特曼(Sam Altman)展开对话,探讨了OpenAI多元化布局背后的核心理念、发布Sora的原因、内部如何使用模型、最佳的AI评估方法,以及未来的发展方向。

 

 

 

内容摘要

 

OpenAI 的整体愿景:奥特曼将 OpenAI 定义为四重身份的结合:消费科技公司、超大规模基础设施运营商、前沿研究实验室,以及探索新业务(如硬件、招聘、商业化)的平台。其终极使命是构建通用人工智能(AGI),并确保它为人类创造巨大价值。核心产品方向是成为用户的“个人 AI 订阅服务”——一个高度个性化、跨平台可用、未来运行于专用设备上的 AI 助手,用户可能订阅一个或多个此类服务。

 

基础设施与垂直整合:当前基础设施完全服务于 OpenAI 自身的研究与产品,但随着规模扩大,未来可能衍生独立业务。奥特曼坦言自己曾反对垂直整合,但实践证明:为实现 AGI 使命,必须掌控从底层算力到上层应用的全栈能力。他以 iPhone 为例,说明极致垂直整合是打造革命性产品的关键。OpenAI 正在建设“人类历史上最大的基础设施项目”,以支撑其研究和产品野心。

 

Sora 的战略意义与社会协同进化:Sora 表面看与 AGI 无直接关联,但奥特曼认为构建强大的“世界模型”对 AGI 至关重要。更重要的是,发布 Sora 是为了让社会提前了解和适应 AI 视频生成技术(尤其是深度伪造)的到来,推动“技术与社会共同进化”。他强调,不能等到 AGI 完成才交付给世界,而需通过持续互动让社会逐步适应。Sora 的算力投入仅占整体资源的一小部分,但验证了用户强烈的创作意愿。

 

人工智能界面的未来:基础聊天功能已趋成熟,但潜力远未释放——用户可要求 AI 完成复杂任务(如“治愈癌症”),而当前模型尚不能实现。未来界面可能包括:由实时渲染视频构成的交互、能感知环境上下文的硬件设备,以及在恰当时机主动提供信息的智能系统。文本界面仍有巨大发展空间,同时新形态界面将不断涌现。

 

人工智能科学家与科学进步:奥特曼最期待的是“AI 科学家”——能独立进行科研并做出重大发现的系统。他认为这将是继图灵测试被超越后的下一个里程碑。已有迹象表明 AI 能辅助数学、物理、生物等领域的研究并产出新发现。他预测两年内 AI 将承担更大比例的科研工作,而科学进步本身是推动人类长期繁荣的核心动力。

 

对模型进展和能力的思考: ChatGPT 以来,模型能力持续超预期,深度学习不断带来突破性进展。当前模型的“能力储备”远超大众认知,前沿用户已使用远超公开版本的能力。奥特曼认为大语言模型仍有巨大潜力,甚至可能自我驱动发现下一代架构。他批评静态基准测试已被“刷分”玩坏,主张以科学发现、实际收入等动态指标评估模型价值。

 

个性化与用户体验:AI“过度讨好”问题在技术上并不难解决,核心挑战在于用户偏好高度分化。理想方案是 AI 通过互动自动学习用户风格,实现个性化交互。奥特曼承认,早期“打造一个让数十亿人满意的统一 AI”是天真的想法,未来必须支持多样化人格和交互方式。

 

研究优先与创新文化:在资源紧张时,OpenAI 几乎总是优先将 GPU 分配给研究而非产品。公司正大力投资基础设施,以避免在研究与产品间做艰难取舍。其创新文化源于奥特曼的投资背景:将顶尖研究员视为“创始人”,像运营种子基金一样支持高风险、高回报的探索,而非按部就班管理产品。

 

合作策略与行业生态:OpenAI 正与 AMD、NVIDIA、Oracle 等广泛合作,推动激进的基础设施扩张。这一决策基于对模型未来经济价值的高度信心。尽管合作方可能在某些领域构成竞争,但奥特曼认为实现 AGI 需要整个行业协作,涵盖芯片、算力、分发等全链条。

 

监管与安全观:奥特曼认为 AGI 未来可能引发严重风险,社会需建立“护栏”,但当前尚未出现真正可怕的后果。他主张监管应聚焦于最前沿、超人类水平的模型,进行严格安全测试,而非限制能力较弱的模型,以免扼杀创新。他警告,过度监管(如欧洲模式)可能使美国在 AI 竞争中落后,而全球 AI 领导权落入不负责任方手中将更危险。

 

版权与内容生态:他预测社会可能将“模型训练”界定为“合理使用”(类比人类阅读学习),但生成模仿特定风格或包含特定 IP 的内容需新授权机制。有趣的是,许多版权方担忧的不是“被使用”,而是“未被使用”——因 AI 互动可提升 IP 价值。未来可能出现“希望 AI 多用我的角色”的新诉求。

 

开源立场:OpenAI 支持开源,已发布强大开源模型并乐见社区使用。但也警惕风险:开源模型权重可能被注入不良内容,或受地缘政治影响。奥特曼认为开源与闭源将长期共存,服务于不同需求。

 

能源与 AI 的交汇:AI 发展将极大依赖廉价、充裕的能源。短期新增能源以天然气为主;长期看,太阳能+储能与先进核能(如小型模块化反应堆、核聚变)将成为主力。核能若在经济上具备显著优势,将推动政策与建设加速;否则将受制于公众情绪与监管流程。

 

商业模式探索:Sora 的高使用量促使 OpenAI 探索新盈利模式(如按生成次数收费)。对广告持开放但谨慎态度:破坏用户信任的竞价排名模式不可行,但类似 Instagram 的“发现型广告”可能适用。同时需防范虚假内容(如刷好评)污染模型输出。

 

人才、领导力与个人反思:奥特曼坦言从投资人转型 CEO 极具挑战:运营琐碎、压力巨大,与投资的“飘然感”截然不同。OpenAI 的成功依赖顶尖人才与高强度创新文化。其在生命科学(Retro)、能源(Hellion、Oclo)等领域的投资,并非源于宏大规划,而是用资本支持真正相信的长期议题。

 

对创业者与投资者的建议:下一个万亿美元公司不会是 OpenAI 的复制品,而是建立在“近乎免费的通用 AI”之上的全新范式。奥特曼强调:预测未来几乎总是错的,真正洞见来自一线实践、创造与交流。他鼓励创始人追随好奇心,与顶尖人才合作,在行动中有机发现机会,而非追逐热点或模仿过去。

 

视频完整内容

 

01 OpenAI的愿景与基础设施

 

主持人Erik Torenberg:Sam,欢迎来到 a16z 播客。

 

山姆·奥特曼:谢谢你的邀请。

 

主持人Erik Torenberg:在另一次采访中,你曾将OpenAI描述为四家公司的结合体:一家消费科技公司、一个超大规模的基础设施运营商、一个研究实验室,再加上所有新业务,包括规划中的硬件设备、从硬件到应用集成的各种项目、招聘市场乃至商业化运作。综合所有这些布局,OpenAI 的最终愿景是什么?

 

山姆·奥特曼: 从某种意义上说,这是我们对传统大型研究实验室的现代诠释,但核心业务有三块。我们希望成为用户的个人 AI 订阅服务。我认为未来大多数人都会订阅一个,有些人可能会订阅好几个。你不仅会在我们的第一方消费产品中使用它,还会通过它登录许多其他服务,并且最终会在专用设备上使用它。你将拥有一个懂你、对你极具价值的 AI。这正是我们努力的方向。而这一切的目标,我们的使命,就是构建通用人工智能(AGI),并让它为人类创造巨大的价值。

 

主持人Ben Horowitz:那么,这套基础设施对于实现你们的主要目标是必不可少的吗?它未来会成为一项独立的业务,还是只为个人 AI 服务?我的意思是,你们会把它卖给其他公司吗?毕竟这是一项如此庞大的工程,它还能用来做别的事情吗?

 

山姆·奥特曼我觉得它很有可能会衍生出其他业务,但目前还不好说。眼下,它完全是为了支持我们自身的研究和服务。

 

主持人Ben Horowitz:这说得通。

 

山姆·奥特曼不过,当规模大到一定程度时,你自然会考虑用它来做些别的事情。

 

主持人Ben Horowitz:没错,毕竟你们可能正在建造人类历史上最大的数据中心。

 

山姆·奥特曼史上最大的基础设施项目。

 

02 商业模式与垂直整合

 

主持人Erik Torenberg:在你早期(远在ChatGPT出现前)的一次精彩采访中,当被问及OpenAI的商业模式时,你回答说:“哦,我们会去问AI,它会帮我们想出来。” 当时大家都笑了,而且还不止一次。

 

山姆·奥特曼是的,有好几次。而且最近又有一次,我们问了当时的一个模型该怎么做,它给出了一个我们之前忽略的、富有洞见的答案。所以,当我们这么说时,人们或许没有当真,或者没有从字面意思上理解。但答案或许是,你应该同时当真并从字面上去理解。

 

主持人Ben Horowitz:作为一名组织管理者,我经常问AI我该做什么。只要你给它足够的背景信息,它有时确实能给出非常有趣的答案。

 

主持人Erik Torenberg:除了更广的应用和更强的算力,还有什么理论能将这些投入串联起来?我们该如何理解这个体系?

 

山姆·奥特曼研究让我们能创造出伟大的产品,而基础设施则支撑我们进行研究。这是一个垂直整合的体系。比如,你可以用ChatGPT或其他服务来获取运营组织的建议。但要实现这一点,背后需要卓越的研究和海量的算力。但我们的最终目标和使命,是构建通用人工智能(AGI),并让它对人类极具价值。

 

主持人Ben Horowitz:你认为它会发展到完全横向化,还是在可预见的未来将保持垂直整合?

 

山姆·奥特曼我一直反对垂直整合,但现在我认为我错了。理论上,在一个高效的经济体中,一家公司只要做好一件事就能成功。但在我们的例子中,情况并非如此。当然,在某些方面是的,比如英伟达制造了令人惊叹的芯片,供许多人使用。但OpenAI的发展历程明确地告诉我们,为了实现使命,我们需要做的远比最初想象的要多。

 

主持人Ben Horowitz:计算行业的历史在某种程度上就是一部在垂直整合与非整合之间摇摆的历史,从王安文字处理机,到个人电脑,再到黑莓,然后是智能手机。iPhone本身就是一个极致垂直整合的产物。

 

山姆·奥特曼我认为iPhone是科技史上最不可思议的产品,它就是极致垂直整合的典范。

 

主持人Ben Horowitz:确实令人惊叹。很有趣。

 

03 AGI、Sora与社会共同进化

 

主持人Erik Torenberg:在通往AGI的路上,哪些投入是核心驱动力,哪些又是为了对冲不确定性?比如Sora,它在表面上看起来……

 

山姆·奥特曼Sora看起来似乎与AGI没有直接关系,但我敢打赌,如果我们能构建出卓越的世界模型,它对AGI的重要性将远超人们的想象。就像ChatGPT,许多人曾认为它与AGI关系不大,但它不仅帮助我们构建了更好的模型,理解了社会期望如何使用AI,更重要的是,它推动了整个社会跟上我们的步伐,让人们意识到:“我们必须开始认真应对这件事了。” 在ChatGPT出现之前,我们谈论AGI,人们要么觉得遥不可及,要么漠不关心。而现在,他们非常关心。

 

除了研究本身的价值之外。我坚信技术与社会必须共同进化。我们不能等到最后才把成品扔给世界,事情不是这样运作的,这是一个持续互动、共同演进的过程。

 

主持人Erik Torenberg:请详细说明Sora如何融入您的战略。社交网络上有些争论,大家在问,为什么要把宝贵的GPU资源投入到Sora上?这是一种短期还是长期的权衡?

 

主持人Ben Horowitz:并且,新的版本在社交网络方面有一些非常有趣的转折。我很想知道您对此的看法。比如,Meta有没有打电话给您,表达不满,或者说,您预计会有怎样的反应?

 

山姆·奥特曼我认为,如果两家公司中的任何一方觉得受到了对方的攻击,那就不该这么看。当然,这段历史我是知道的,不是吗?

 

首先,打造出色的产品本身就是一件很棒的事,而且人们很喜欢Sora。其次,我认为让社会了解技术进展至关重要,尤其是在技术与社会共同进化的关键节点。很快,世界就必须应对能够生成以假乱真的深度伪造视频的模型。

 

这在很大程度上是好事,但社会需要一个适应过程。就像ChatGPT发布时,我们觉得世界需要了解这项技术。同样,现在让世界尽快了解视频生成的未来走向也至关重要,因为它的影响将是巨大的。

 

视频比文字更能触动情感。 很快,我们就会进入一个视频无处不在的时代。所以,这其中大有文章。正如我所说,Sora也会助力我们的研究,推动我们向AGI迈进。

 

当然,AI的意义不能只在于提升效率和解决问题,过程中也必须有乐趣、创意和享受。不过,我们投入到Sora上的算力只是我们总资源的一小部分。

 

主持人Ben Horowitz:绝对数量上看似庞大,但相对比例并不高。

 

04 人工智能界面的未来

 

主持人Erik Torenberg:我想谈谈人工智能人机界面的未来。您在八月份曾说,模型在聊天这个应用场景上已经趋于饱和。那么,未来的AI人机界面会是什么样子,包括硬件和软件?它的愿景是否类似于一个超级应用?

 

山姆·奥特曼从狭义上讲,基本的聊天功能已经相当成熟了。但是,一个聊天界面能为你做什么,其潜力还远未被发掘,因为你可以对聊天界面说“请治愈癌症”,而目前的模型显然还做不到。因此,我认为文本这种界面形式依然有巨大的潜力,远不止于闲聊。当然,还会有更好的界面。Sora的另一个绝妙之处就在于,你可以想象一个完全由实时渲染的视频构成的界面。

 

那将开启怎样激动人心的可能性。你也可以想象新型的硬件设备,它们能时刻感知周围的环境。未来的设备不再是随时用通知打扰你,而是能真正理解你所处的环境和上下文,在最恰当的时机为你呈现所需的信息。

 

这些方面都还有很长的路要走。

 

05 人工智能科学家与科学进步

 

主持人Erik Torenberg:在未来几年,模型将能做到哪些今天做不到的事情?比如更深层次的白领工作替代、AI科学家、人形机器人等等。

 

山姆·奥特曼我最期待的就是“AI科学家”。我们能在这里严肃地讨论这个话题,本身就十分疯狂。关于图灵测试的定义虽有争议,但它在大众认知中的概念早已被我们远远甩在身后。

 

主持人Ben Horowitz:是的,那确实很快。

 

山姆·奥特曼我们曾长久地将它视为AI的终极考验,看似遥不可及,然后它突然就被跨越了。世界恐慌了一两个星期,然后大家就习以为常了,“好吧,看来电脑现在也能做这个了”,然后生活照旧。

 

我认为,科学领域也将发生同样的事情。我个人心中与图灵测试等价的里程碑,是当AI能够独立进行科学研究时。那才会真正改变世界。通过下一代模型,我们已经看到了星星之火——你在社交媒体上看到各种例子:AI有了新的数学发现,或者在我的物理、生物研究中帮上了小忙。

 

我们看到的一切都预示着这个趋势会继续发展。因此,我预计在两年内,模型将能承担更大部分的科学研究工作,并作出重大发现。

 

这是一件足以改变世界的大事。我相信,从根本上说,科学进步是推动世界随时间变得更美好的核心动力。 如果我们即将迎来科学进步的大爆发,那将是一个巨大的变革。

 

主持人Ben Horowitz:有趣的是,这是一个人们不常谈论的积极变化。当人们谈论AI变得极其聪明时,往往会联想到负面影响。但治愈疾病,这很有意思,我们可以从科学中获得更多益处。这确实是个很好的观点。我想艾伦·图灵曾被问到:“你真的认为计算机能比聪明人更聪明吗?”他回答说:“它不必比聪明人更聪明,只需要比一个普通人的头脑更聪明就行,比如美国电话电报公司(AT&T)的总裁。”我们或许也应该更多地利用这一点。

 

06 对模型进展和能力的思考

 

主持人Erik Torenberg:我们刚看到Pika上周发布了产品,看到你们的创新,以及从OpenAI走出的团队,他们似乎在创造巨大的价值,这真是太棒了。我们当然希望如此。我想问您,自ChatGPT问世以来,关于2025年的发展或进展,有什么让您感到惊讶,或者说您的世界观发生了哪些更新?

 

山姆·奥特曼:有很多,但最有趣的或许是:我们不断有新发现。我们曾以为自己偶然发现了一个巨大的秘密——掌握了语言模型的规模化定律。那感觉像是一场不可思议的胜利,我当时想,这样的好运可能不会再有了。但深度学习就像一个不断带来惊喜的奇迹。 我们持续发现突破性的进展。

 

再次,当我们取得推理模型的突破时,我同样觉得这样的突破不会再有了。这项技术的效果好到令人难以置信。但或许,当你发现一个伟大的科学突破时,总有这种感觉。

 

伟大的科学突破,如果足够重大,往往是根本性的,并且持续有效。但进展的速度之快,令人惊叹。

 

如果你现在回头去用GPT-3.5刚发布时的ChatGPT,你可能会觉得:“真不敢相信当时有人会用这种东西。”而我们现在所处的世界,其“能力储备”是如此巨大。世界上大多数人想到的还只是ChatGPT能做什么,而硅谷的一些极客已经在使用Codex,并觉得“那些人完全不知道正在发生什么”。接着,少数科学家又会觉得,那些用Codex的人也完全不知道正在发生什么。这种尚未被完全发掘的能力储备已经到来,而且非常庞大。

 

主持人Erik Torenberg:在模型能力方面,我们已经走了很远。但要进一步发展,大语言模型(LLM)的潜力有多大?在哪个节点上我们需要新的架构,或者您认为还需要哪些突破?

 

山姆·奥特曼:我认为我们能走得很远,远到可以创造出一种东西,它能利用现有技术找出下一个突破。这听起来像个自我指涉的答案,但如果一个基于LLM的系统,其研究能力能超越OpenAI所有研究人员的总和。或许那就足够了。

 

主持人Ben Horowitz:是的,那将是一个巨大的突破,一个非常巨大的突破。回到更实际的问题,人们已经开始抱怨一件事,我想《南方公园》还为此拍了一整集,就是AI,特别是ChatGPT,那种过度讨好、百依百顺的态度。解决这个问题有多难?是技术上很棘手,还是一个根本性的难题?

 

山姆·奥特曼:哦,解决起来一点也不难。很多用户非常想要这种体验。如果你看看人们在网上对ChatGPT的评价,很多人都怀念它过去的样子,希望它能变回去。所以,这在技术上根本不难。有一点……这一点也不令人意外,但这种偏好的分化非常广泛。用户希望聊天机器人如何表现,这在大事小事上都因人而异。

 

主持人Ben Horowitz:你认为这意味着需要个性化配置吗?你觉得那会是答案吗?

 

山姆·奥特曼:我想是的。理想情况下,你只需要和ChatGPT聊一会儿,它就能在与你互动的同时,像面试一样摸清你的喜好和风格。

 

主持人Ben Horowitz:然后ChatGPT就能自己想明白。

 

山姆·奥特曼:然后就能想明白。但在短期内,你可能只需要先选择一种预设的风格。

 

主持人Ben Horowitz:明白了,这很合理,非常有意思。

 

山姆·奥特曼:我认为我们过去有一个非常天真的想法:我们曾天真地以为,可以创造一个让数十亿人满意的、千人一面的AI,但这本身就是一种奢望。 但长期以来,这似乎是我们的潜在假设,对吧?因为人们有非常不同的朋友。所以现在我们正试图解决这个问题。

 

主持人Ben Horowitz:是的,人们不仅有不同的朋友,还有不同的兴趣和认知水平。所以你通常不想一直和同一个东西交谈。它的优点之一是你可以说,“用对我五岁小孩说话的方式解释”,但也许我根本不想每次都输入这样的提示。也许我希望你总能用我能理解的方式和我交流,尤其是在你教我东西的时候。这很有意思。

 

07 山姆·奥特曼CEO经验与领导力教训

 

主持人Ben Horowitz:我想问你一个关于CEO的问题,观察你是一件很有趣的事。你刚刚和AMD达成了一笔交易,当然,现在公司所处的位置不同,你拥有了更多的议价能力。但是,和你当初做那笔交易时相比,这些年来你的想法发生了多大的变化?

 

山姆·奥特曼:当时我几乎没有任何管理经验。我天生不擅长管理公司,而更适合做个投资人。我当时以为,那才是我之前做的事情,也以为那将是我的职业生涯。

 

主持人Ben Horowitz:是的,尽管你之前也是CEO。

 

山姆·奥特曼:一个不怎么样的CEO。所以我觉得,当时我们做这笔交易时,我的心态更像一个为公司出谋划策的投资人。而现在我才真正体会到经营一家公司的滋味。它们非常不同。我学到了很多关于如何运营的知识,也学会了如何让达成交易成为一种常态化的能力。

 

主持人Ben Horowitz: 我明白了,你开始理解协议背后的所有深层含义,而不仅仅是“哦,我们能拿到分销权或资金”。这说得通。我对你们这次交易结构设计的精妙印象深刻。

 

08 战略合作与基础设施扩展

 

主持人Erik Torenberg:从更宏观的层面来看,就在过去几周,你提到了AMD,还有Oracle、NVIDIA。你选择与这些公司合作,但他们也可能在某些领域与你竞争。你如何决定何时合作,何时不合作?或者说你是如何思考这个问题的?

 

山姆·奥特曼:我们已经下定决心,要进行一次极其激进的基础设施扩张。我们对未来的研究路线图以及这些模型将带来的经济价值,从未如此自信。但要实现如此规模的扩张,我们需要整个行业——或者说行业的大部分力量——来支持我们。这涵盖了从芯片层面到模型分发,以及中间的所有环节。所以,我们将与许多人合作。未来几个月,你应该会看到我们更多的动作。

 

主持人Ben Horowitz:你能否详细说明一下?因为当你谈到规模时,感觉在你看来,扩张是没有上限的。你会一直这样扩张下去……

 

山姆·奥特曼:绝对有上限。比如,全球GDP总量是有限的。其中一部分是知识工作,我们还没进入机器人领域。所以限制是存在的,但感觉这些极限离我们目前的位置还非常遥远。如果我们是对的——我不是基于现状,而是基于我们对未来的判断——如果我们对于模型能力将按预期发展的判断是正确的,那么它能创造的经济价值将不可估量。

 

主持人Ben Horowitz: 对。所以如果只有今天的模型,你不会这么激进地扩张?

 

山姆·奥特曼:绝对不会。我们仍然会扩张,因为我们看到今天的模型远不能满足现有需求,但我们不会如此激进。现在,我们能提前一到两年预见到未来的发展。

 

主持人Erik Torenberg:有意思。ChatGPT每周有8亿活跃用户,约占世界人口的10%,似乎是有史以来增长最快的消费品。你们是如何做到比任何人都增长得更快的?你如何平衡优化活跃用户与保持研究公司属性这两者之间的关系?

 

山姆·奥特曼:当资源紧张时,这种情况几乎每天都会发生,我们几乎总是优先将GPU分配给研究,而非产品支持。我们之所以要投入巨资建立这种能力,就是为了避免做出如此艰难的抉择。当然,也会有特殊情况,比如某个新功能上线后迅速爆火,届时研究部门会暂时牺牲一些算力,但总的来说,我们的最终目标是构建通用人工智能(AGI)。

 

主持人Erik Torenberg: 所以研究绝对是第一位的。你之前在接受你哥哥杰克采访时提到,其他公司可以模仿产品、收购知识产权,或者做各种事情,但他们买不走你们的文化,更买不走那台能够持续创新的文化引擎。 你是如何做到这一点的?谈谈这种创新文化。

 

山姆·奥特曼:我觉得这一点很有用,它源自我过去的投资背景。一个顶尖的研究文化,其实更像是在运营一家顶尖的种子基金——你押注于“创始人”(研究员),进行类似的投资,而不是像运营产品公司那样按部就班。我认为这段经历对我们建立的文化非常有帮助。

 

主持人Erik Torenberg: 是的。在某种程度上,这和我理解的本尼迪克特·蔡(Benedict Z)有些相似,你是一名CEO,但你也有一个投资组合,就像一个投资者。

 

主持人Ben Horowitz: 没错。我正好相反。他是一位CEO转为投资者,而我是一位投资者转为CEO。这很不寻常。

 

山姆·奥特曼:朝着这个方向。

 

主持人Ben Horowitz: 是的。嗯,这种转型从来没成功过。你是我见过唯一一个从投资者转型CEO并且成功的。

 

山姆·奥特曼:马克·戴(Mark Day)也是。

 

主持人Ben Horowitz:啊,但阿尼尔(Anil)在他成为投资者之前就是一名运营者。我是说,他骨子里就是个运营者。

 

主持人Erik Torenberg:为什么这种转型这么难?是因为一旦人们成为投资者,他们就不想再做运营的苦差事了吗?

 

主持人Ben Horowitz: 嗯,我认为投资者,如果你擅长投资,你不一定擅长处理组织动态、解决冲突,或者深刻理解那些复杂的、带有办公室政治色彩的事情。成为一名运营者或CEO的细致工作是如此庞杂,而且在智力上不那么有吸引力。你很难在鸡尾酒会上向人夸耀这些琐事。当投资人时,你感觉自己无所不知,人人都觉得你聪明绝顶,那是一种很棒的感觉。而当CEO,大部分时候感觉都很糟糕。从飘飘然到焦头烂额,这种转变太难了。 我只能这么说。

 

山姆·奥特曼:我震惊于这两份工作的天差地别,也震惊于一份好工作和一份坏工作之间的巨大差异。

 

主持人Ben Horowitz:是的。

 

山姆·奥特曼:这真的很难。

 

主持人Ben Horowitz:我简直不敢相信我在经营这家公司,我自己都觉得不可思议。就像他也无法相信自己在经营OpenAI一样。

 

主持人Erik Torenberg:回到当前的进展,在一个评估标准被玩坏、被操纵的世界里,它们还有用吗?现在衡量模型能力的最佳方法是什么?

 

山姆·奥特曼:关于科学发现,我认为这是一个可以长期有效的评估维度。收入也是一个有趣的指标。但我认为静态的基准测试分数已经意义不大了,而且那些榜单早已被刷分行为玩坏了。

 

主持人Erik Torenberg:是的。

 

主持人Ben Horowitz:据我所知,它们除了被操纵之外什么都不是。

 

主持人Erik Torenberg:更广泛地说,似乎那种“AGI至上”的狂热文化比一年前有所降温。有些人指出,比如GPT-5,没有看到像预期那样明显的飞跃,尽管底层有很多进展。人们是否应该降低对AGI的期望,还是说这只是社交媒体上的情绪波动?

 

山姆·奥特曼:我们曾经讨论过,AGI的到来会像一阵风,呼啸而过,但世界并不会像你想象中那样发生剧变。 即使它在做着疯狂的AI研究,社会学习和适应的速度也会更快。回顾来看,一个观察是,人类和社会总是比我们想象的更能适应。

 

过去认为AGI的到来会是一次颠覆性的系统更新,你经历了那个过程,接受了它,然后你需要新的东西去思考。事实证明,这个过程比我们想象的要平滑得多,这是件好事,一件大好事。

 

主持人Ben Horowitz:不会是一场“大爆炸”。

 

09 监管、安全和社会影响

 

主持人Erik Torenberg:但说到这里,你的想法是如何演变的?你提到你在垂直整合方面的想法有所演变。那么在人工智能的监管和安全方面,你的想法又是如何演变的,或者说最新的想法是什么?

 

山姆·奥特曼: 我仍然认为,未来会有一些真正奇怪甚至可怕的时刻。事实上,这项技术至今还没有引发真正可怕的巨大风险,但这并不意味着它永远不会。

 

主持人Erik Torenberg: 我们正在讨论一个奇特的现象:让几十亿人与同一个“大脑”对话。这或许已经引发了一些奇怪的社会适应性问题。

 

山姆·奥特曼:这些问题虽然还没发展到可怕或重大的地步,但也确实带来了一些变化。但我预料到,这项技术终将引发一些非常糟糕的事件,就像历史上的任何一项重大技术——甚至可以追溯到“火”——都曾带来过的那样。

我认为,作为一个社会,我们会围绕它建立起护栏。

 

主持人Erik Torenberg:关于正确的监管框架,你最新的思考是什么?或者说,我们应该关注哪些方面?

 

山姆·奥特曼: 我认为大多数监管都可能带来许多负面影响。我最希望的是,当模型的能力真正达到超人类水平时,只有那些模型才值得进行非常仔细的安全测试。随着前沿技术的推进,我不希望出现“大爆炸”式的突变,你可以预见到很多事情可能会严重出错。但我希望我们将监管的重点集中在那些最顶尖的模型上,而不是限制所有那些能力较弱的模型所能带来的美妙创新。否则,我们可能会像欧洲那样,对整个行业造成扼杀式的打击,那将非常糟糕。

 

主持人Ben Horowitz:这个思想实验似乎是这样的:好吧,未来会出现一个超人类智能模型,它可能会实现某种“智能起飞”。但我们真的需要等到那个阶段,或者接近那个阶段时再行动吗?毕竟,下周你的实验室里还不会出现那种东西。

 

我认为,我们整个行业在这里让监管者感到困惑。其中一个问题是,过度的监管可能会损害美国,尤其是在中国不会有同样限制的情况下。在我看来,人工智能领域的落后,对世界而言是极其危险的——其危险性远超我们因暂时不知如何监管而带来的风险。

 

10 版权、开源和内容创作

 

主持人Ben Horowitz:你们认为版权将如何演变?你们已经做了一些非常有趣的事情,比如推出了“选择退出”机制。你认为未来人们出售版权时,会是独家买断,还是说任何人想用都可以获得授权?你觉得会如何发展?

 

山姆·奥特曼:我的猜测是这样的:社会和技术是共同演进的,技术会朝不同的方向发展。我们已经看到一个例子,不同的视频模型从版权所有者那里得到的反馈,与图像生成模型截然不同。所以,这种情况会持续下去。但基于我们今天的处境,我猜测社会最终可能会将“模型训练”这一行为界定为“合理使用”。

 

然而,对于生成模仿特定风格或包含特定知识产权的内容,则会有一套新的模式。这就像一位人类作家,你可以读一本小说并从中获得灵感,但你不能逐字复制这本书。

 

主持人Ben Horowitz:你可以谈论《哈利·波特》,但不能一字不差地复述它。

 

山姆·奥特曼:正是如此。还有一件事我认为会发生变化。关于Sora,我们已经听到许多版权所有者表达了担忧,但同时也有许多人说:“我担心的是,你们使用我的角色的频率不够高。”

 

我当然希望有相关的限制。如果我拥有一个角色,我不想让这个角色说一些非常冒犯的话。但我希望人们能够与它互动,因为这样他们才能与角色建立情感联系,我的IP价值才能提升。如果你们总是选择用别人的角色而不用我的,我肯定会不高兴。所以我完全能想象这样一种情况:

 

版权所有者可能会因为我们生成他们角色的次数太少而感到不满,而不是因为生成得太多。这个观点并非显而易见,也是最近才浮现出来的,但这或许就是未来的发展方向。

 

主持人Ben Horowitz:是的,这在好莱坞很有趣。我一直对音乐行业的一点感到困惑:如果你在餐厅或比赛中播放一首歌,就必须付费。

 

他们在这方面态度非常强硬,但显而易见,在大型比赛中播放你的歌曲对你非常有利,因为那是你所有事业——演唱会、周边商品、品牌——的最好广告。这一点让我觉得非常不合理。

 

我认为,由于行业的组织方式,特别是传统创意产业,整个行业有可能做出不理性的决定。这源于音乐产业的结构,特别是那些无处不在的出版商。

 

他们的职责似乎就是阻止音乐的播放,而任何艺术家都希望自己的音乐被播放。我确实好奇这会如何发展。我同意你的观点,理性的想法应该是:“我希望你随便用我的IP,但别把我的角色搞砸了。”

 

山姆·奥特曼:所以,如果让我猜测,有些人会说“绝对不行”。但这不像音乐行业,版权被少数几家公司垄断。所以人们会尝试各种不同的合作模式,看看哪种可行。

 

主持人Ben Horowitz:是的,这或许是新兴创作者推出新角色的方式。而你可能永远都不能再用达菲鸭了。

 

主持人Erik Torenberg:我想聊聊开源,因为这方面的思考也出现了一些演变。GPT-3没有开源模型权重,但你们今年早些时候发布了一个非常强大的开源模型。你们最新的想法是什么?这中间的演变是什么?

 

山姆·奥特曼:我认为开源是件好事。我很高兴人们如此喜欢我们的开源模型。

 

主持人Ben Horowitz:从战略上看,你认为有什么危险?比如DeepSeek成为主导的开源模型。

 

山姆·奥特曼:谁知道人们会往那些开源模型里放些什么呢?比如模型的权重到底是什么。

 

主持人Ben Horowitz:这样一来,你们就等于是把对一切的解释权,交给了那些可能深受他国影响的人。举个例子,我们非常感谢你们发布了一个出色的开源模型,因为我们现在看到,所有大学都在使用他国的模型。这感觉非常危险。

 

11 能源、政策和 AI 的资源需求

 

主持人Erik Torenberg:你曾说过,你在职业上最关心的两件事是人工智能和能源。

 

山姆·奥特曼:我当初并不知道这两个领域最终会合二为一。它们曾是我两个独立的兴趣点,但现在确实交汇了。

 

主持人Erik Torenberg:多谈谈你对能源的兴趣是如何开始的,又是如何投入其中的,然后我们可以聊聊它们是如何交汇的。

 

主持人Ben Horowitz:是的,因为你的职业生涯始于物理学。

 

主持人Erik Torenberg:计算机科学。

 

山姆·奥特曼:是物理学。我从未真正有过职业生涯,我学的是物理,第一份工作是计算机科学。简单来说,纵观历史,要论对提升人类生活质量影响最大的因素,莫过于更廉价、更充裕的能源。所以,继续在这方面取得更大进展似乎是个好主意。而且,我就是喜欢能源。人们看待世界的角度不同,但在我眼中,似乎处处都是能源的影子。

 

主持人Ben Horowitz:让我们深入探讨一下。在西方,我认为我们在能源问题上已经把自己逼到了一个困境,因为我们长期以来都限制核能。

 

同时,也出台了很多能源政策限制,在欧洲比在美国更严重,但在这里也很危险。现在有了人工智能,感觉我们需要来自各种可能的能源。你们如何看待这方面的政策和技术发展?有哪些主要的能源来源,这些曲线将如何交叉?以及,关于钻探、水力压裂等问题,正确的政策应该是什么?

 

山姆·奥特曼:我预计短期内,美国新增的能源中,大部分将是天然气,至少在基载能源方面是如此。从长远来看,我预计太阳能加储能以及核能将成为两大主导能源。这两种能源的某种组合将决定未来。

 

主持人Ben Horowitz:长期来看。

 

山姆·奥特曼:是的,包括先进的核能,比如小型模块化反应堆(SMRs)和核聚变,整个体系。

 

主持人Ben Horowitz:你认为核能技术的发展速度有多快?我们现在是否已经准备好大规模应用了?显然有很多人在研发,但我们必须先让它完全合法化。

 

山姆·奥特曼:我认为这在某种程度上取决于价格。如果它在经济上展现出绝对优势,那么我认为它会发展得相当快。回顾能源史,当发生向更廉价能源的重大转变时,世界迁移的速度是相当快的。能源的成本至关重要。所以,如果核能变得比其他任何能源都便宜得多,

 

我认为将会产生巨大的政治压力,来推动美国核能管理委员会(NRC)加快进程,我们也会找到快速建设的方法。但如果它的价格与其他能源相当,我认为反核情绪就会占上风,

 

那么整个过程就会耗时很长。它理应更便宜,确实应该。它理应成为地球上,乃至任何地方最廉价的能源形式。 既便宜又清洁。

 

主持人Ben Horowitz: 有什么理由不喜欢呢?显然,理由还不少。

 

12 盈利模式和用户行为

 

主持人Erik Torenberg:关于OpenAI的盈利模式,你们有什么最新的想法?无论是正在进行的实验,还是你们打算投入更多或更少精力的方向,有哪些不同的模式让你感到兴奋?

 

山姆·奥特曼:我现在最关心的是我们即将为Sora做的事情,因为它刚刚发布,而且使用量非常大。发布这些产品后,你会学到另一件事,那就是人们究竟如何使用它们。

 

人们使用Sora的方式,既有我们预料之中的,也有很多出乎我们意料的。比如,人们会用它来制作自己和朋友的搞笑表情包,在群聊里分享。但对我们来说,Sora视频的生成成本相当高昂。因此,对于那些每天生成成百上千次内容的用户,我们需要一种与原先设想截然不同的盈利模式。

 

我认为Sora背后一个很酷的理念是,它证明了人们其实拥有强烈的创作欲望。过去那种传统甚至有些天真的看法是:1%的用户创作内容,10%的用户评论,而100%的用户都在消费。但现实或许是,更多人想成为创作者,只是过去的工具门槛太高了。我认为这是一个非常酷的转变。但这确实意味着,如果人们想创作如此海量的内容,我们就必须找到一种全新的盈利模式。我猜,如果成本居高不下,按生成次数收费或许是一种可行的模式。但这是一种我们以前从未真正考虑过的新可能。

 

主持人Ben Horowitz:你对长尾广告有什么看法?

 

山姆·奥特曼:我持开放态度。和许多人一样,我觉得广告有时挺烦人,但并非完全无法接受。而且有些广告我甚至很喜欢。例如,我非常欣赏Meta的一点是,Instagram的广告对我而言是能创造净价值的。我竟然会喜欢Instagram上的广告,这种感觉前所未有。在Google上搜索时,我明确知道自己要找什么,广告往往只会干扰我找到最佳结果,是一种烦恼。

 

但在Instagram上,它会给我推荐一些我从未想过要搜索,甚至闻所未闻的东西,然后我发现:“哇,这东西太酷了,我以前从没听说过,我想要!”所以,这类广告是存在的。然而,用户与ChatGPT之间建立了一种非常强的信任关系。即便它会犯错,会出现幻觉,人们依然觉得它在尽力提供帮助,做正确的事。如果我们破坏了这种信任——比如你问我该买哪款咖啡机,我们不推荐最好的,而是推荐了付钱给我们推广的那款——那么这种信任将荡然无存。

 

所以,那种竞价排名式的广告模式在这里是行不通的。我相信还有其他类型的广告可以完美运作,但是……这需要非常审慎,以避开那些显而易见的陷阱。

 

主持人Ben Horowitz:就像你提到的Google的例子,如果有人为了推广某款咖啡机,发布了成千上万条虚假好评,这些内容被模型学习后,模型就开始向用户推荐这款并不好的咖啡机,这种问题有多严重?

 

山姆·奥特曼:所有这些事情都发生得太快了。这正是其中一个例子,人们正在做各种疯狂的事情,也许不是为了虚假评论,但会付费让很多人去写……

 

主持人Ben Horowitz:是的,我正在努力尝试让ChatGPT写出好的评论。“写一篇ChatGPT会喜欢的评论。”

 

山姆·奥特曼: “所以,这是我的咖啡市场。” 没错。这是一个非常突然的变化,我们六个月前都闻所未闻。当然。现在感觉一夜之间就催生出了一个专门做这个的“家庭手工业”。

 

主持人Ben Horowitz:是的,他们非常聪明。

 

山姆·奥特曼:是的。所以我还不知道我们该如何应对,但人们总会想出办法的。

 

主持人Ben Horowitz:这就涉及到我们一直在担心的另一个问题。我们正在研究区块链等潜在的解决方案。但这里有一个根本问题:在互联网上,内容创作的激励机制曾经非常明确。如果我写博客,人们会来看我的内容,参与互动。然而,如果人们都只向ChatGPT提问,而不去浏览互联网,那么谁还会去创作内容?为什么要去创作?

 

这就引出了激励机制的问题。我们是否有必要去维护互联网的既有契约?这个契约的核心理念就是:“我创造内容,并因此获得关注、金钱或其他形式的回报”。

 

山姆·奥特曼:理论上,如果我们能让内容创作变得更容易,同时不破坏创作者获得回报的基本模式,那么创作行为反而会更多。以我们一直在讨论的Sora为例,创作一个有趣的视频比以往任何时候都容易。

 

也许未来有一天,你可以因此获得收入分成。而现在,你得到的是互联网上的“赞”,这对很多人来说仍然是强大的驱动力。但事实是,人们在这个领域创作的内容,比以往任何时候、在任何其他类型的视频应用中都要多。

 

主持人Ben Horowitz: 但这会是文字的终结吗?

 

山姆·奥特曼: 我不这么认为。对于人类创造的东西,未来人们可能会更加看重其“原创性”。你可能需要去验证:这件作品有多大比例是纯人工的?是完全手工打造,还是借助了AI工具?

 

主持人Ben Horowitz: 是的,人们可能更看重那些没有使用工具的作品。

 

13 人才战争与个人反思

 

主持人Erik Torenberg:我们已经“致敬”了Meta,现在我想问你,2025年盛大的“人才战争”已经打响,而OpenAI仍然屹立不倒。团队比以往任何时候都更强大,持续发布着令人难以置信的产品。你能谈谈今年的整体情况吗?

 

山姆·奥特曼:我还记得最初的几年。运营OpenAI是我职业生涯中最有趣、最不可思议的经历。能运营一个由最顶尖人才从事这项史诗级工作的研究实验室,亲眼见证这一切,感觉非常酷。然后我们发布了ChatGPT,每个人都在祝贺我,而我当时想的是:我的生活要天翻地覆了。事实也的确如此。

 

但感觉一切都一直很疯狂。到现在快三年了,我觉得事情只会变得越来越疯狂,但我自己也越来越习惯这种节奏了,所以感觉还好。

 

主持人Erik Torenberg:我们已经谈了很多关于OpenAI的事情,但你还有其他几家公司,比如研究生命健康的Retro Biosciences,以及能源领域的Hellion和Oclo。你是否在十几年前就有一个宏伟的计划,要在这些主要领域进行布局?或者我们应该如何理解萨姆·奥特曼的这条职业轨迹呢?

 

山姆·奥特曼:不,我并没有什么宏大的计划。我只是想用我的资本去支持那些我相信的事业。对我来说,这是一种更有意义的资本运用方式,也肯定比买一堆艺术品之类的有趣多了。

 

主持人Erik Torenberg: “人类算法”(The Human Algorithm)呢?

 

山姆·奥特曼: 未来的人们回望现在,会觉得什么最不可思议?我想,应该是这整件事。我的直觉是,AI最终会对所有其他领域都产生兴趣,去研究和观察一切。

 

14 给创始人的建议

 

主持人Erik Torenberg:最后,我想分享你曾提出的一个深刻见解:投资者在寻找下一个OpenAI时常犯的错误,是试图用过去的成功模式去套用未来,比如寻找下一个Facebook或下一个OpenAI。

 

你认为,下一个万亿美金的公司不会是OpenAI的翻版,而是会建立在OpenAI所带来的突破之上——也就是近乎免费、无处不在的通用人工智能,正如OpenAI本身也受益于过去的科技突破一样。

 

那么,对于收听节目的创始人、投资者和所有试图预测未来的人来说,在一个由OpenAI帮助实现的世界里——一个存在近乎免费的通用人工智能的世界——在公司创建或投资方面,有哪些机会让你感到兴奋?

 

山姆·奥特曼我不知道答案。我确实有些猜测,但我学到的一课是,你的预测总是错的。这让我学会了真正的谦卑。

 

你当然可以说一些听起来很聪明的话,但那基本都是拾人牙慧。真正独到而正确的见解是很难获得的。我所知道的唯一方法,就是投身一线去探索各种想法。

 

你需要和大量的人交流,但我现在已经没有时间这么做了,我必须专注于一件事。所以,我现在能说的,也只是重复别人的话,或者说一些显而易见的事。

 

但我认为很重要的一点是,如果你是一位投资者或创始人,最重要的问题,是无法通过纸上谈兵找到答案的。

 

你必须去创造、去实践、去与人交流,真正地置身其中。我一直对一件事感到非常失望,那就是愿意支持这类探索性工作的投资者太少了,尽管事实证明这总是有效的。你们(指a16z)做了很多,但大多数公司和创始人都只是在追逐当下的热点。所以我希望人们会去尝试……

 

主持人Erik Torenberg:我们谈到,在这个瞬息万变的世界里,制定五年计划是多么愚蠢。当我问及你的宏伟蓝图时,感觉你的职业生涯本身就是一种实践:追随好奇心,与最顶尖的人才为伍,紧跟技术前沿,然后在实践中有机地、渐进地发现机会。

 

山姆·奥特曼:是的,但人工智能一直是我真正想做的事。我上大学时就学的人工智能,大一暑假就在AI实验室工作。我并非总是在这个领域工作,因为我不想去做一件完全行不通的事。当时对我来说很明显,AI还没有准备好。但我从小就是个AI迷。

 

主持人Ben Horowitz:真是太神奇了,一旦获得了足够的GPU和数据,那盏灯就亮了。

 

山姆·奥特曼:当时这个方向非常不受欢迎。当我们在探索这些时,人们都认为绝对不行。这个领域的主流非常排斥这个方向,投资者也一样。这似乎不是一个有吸引力的解决方案。理查德·萨顿的《痛苦的教训》(The Bitter Lesson)说得没错。

 

主持人Erik Torenberg 好了,剩下的都已成为历史,我们或许可以在此结束。我们很幸运能一路同行。Sam,非常感谢你来参加播客。

 

主持人Ben Horowitz:非常感谢。谢谢。

 

完整版专访视频链接:https://www.youtube.com/watch?v=JfE1Wun9xkk

点赞(0)

微信公众账号

微信扫一扫加关注

返回
顶部