来源:华尔街见闻
Altman表示,Agent可以很好地完成一个两天或两周的任务,并在必要时提问,然后反馈一个出色的重要产品,且不是按Agent数量来付费,而是根据问题需要的计算量来定价。GPT4可以轻易复制成功,即使不知道别人是如何做到的。
近日,OpenAI CEO Sam Altman在一次互动访谈中分享了自己对AI Agent的看法,涉及AI Agent的潜力,定价与商业模式。他认为,Agent能够像一个聪明的同事一样,与用户一起合作完成项目。他还强调了推理是当前OpenAI模型最重要的关注领域,将解锁更大的价值。
以下为访谈要点:
Agent可以很好地完成一个两天或两周的任务,并在必要时向您提问,然后反馈一个出色的重要产品。
AI Agent不是按每个Agent来付费,而是根据问题需要的计算量来定价。
我们可以通过模型实现收入,我认为证明了投资是合理的。
可能有太多人在训练非常相似的模型,如果您稍微落后了,或者如果您没有一个带有自然商业规则的产品,使得该产品具有粘性和价值,那么也许可能很难获得投资回报。 我们非常幸运拥有ChatGPT和成千上万的人使用我们的模型。
我们的独特之处,很容易复制已经成功的东西。 所以在研究实验室做了一些事情之后,即使您不知道他们是如何做到的,复制它也是可行的。
真正困难的事情,也最让我自豪的文化是不断重复地去做一些新的、完全未经验证的事情。
以下为访谈原文,部分内容略有删减:
AI Agent就像高级同事,能高效反馈出色成果
提问:
对于人们对AI Agent的看法,您认为他们有什么误解吗?
Sam Altman:
我认为没有人能猜到这将变成什么样子。就像您所说的,我们都在描绘一些看似重要的东西,也许我可以举个例子,当人们谈论AI Agent代表他们行事时,他们给出的主要例子似乎相当一致。
比如,您可以让Agent为您预订餐厅 ,无论是通过OpenAI GPT进行交互,还是直接打电话给餐厅。当然,这是一件很麻烦的事情,也必须去做,也许就像做某些工作一样。
我认为有趣的是,在全球范围内, 您可以做一些不会或不能做的事情。例如,如果我的Agent不是打电话给一家餐厅来预订,而是拨打300家,找出哪家的饭菜最适合我或者有什么特别之处呢?
您可能会说,如果Agent一直在给餐厅打电话,那真是太烦人了,但如果是一个自动化系统来处理这300个餐厅,那么没问题,这就变成了一种大规模并行的操作,人类无法做到。这只是一个简单的例子。
但这也揭示了人类带宽的限制,这些限制可能会被Agent打破。 我认为更有趣的类别不是人们通常谈论的,而是您有一个为您服务的东西,但更像是一个真正聪明的高级同事, 您可以和他合作一个项目。Agent可以很好地完成一个两天或两周的任务,并在必要时向您提问,然后反馈一个出色的重要产品。
AI Agent以计算量付费
提问:
这是否从根本上改变了定价的方式,您如何看待未来的定价?它将如何定价?
Sam Altman:
我是一个风险投资者,以投资为生,所以我们预计会随时间而有所收获。可以想象一个世界,在那里您可以说,我想要一个GPU,或10个GPU,或100个GPU来解决我的问题。这不是说按个数或每个Agent来付费,而是根据问题需要的计算量来定价。
提问:
我们是否需要为特定用途构建专用模型,或者我们不需要? 您如何看待这个问题?
Sam Altman:
确实需要大量的基础设施和东西要建立,但我认为o1指向了一个能够执行出色任务的模型。这确实是某种值得继续思考的事情。
模型是贬值资产,但ChatGPT的投资有意义
提问:
在模型方面,大家都说模型是贬值资产,模型商品化是如此普遍,您如何回应和思考这个问题? 当您考虑到训练模型的资本强度越来越高,我们是否实际上正在看到这种趋势的逆转,需要如此多的资金以至于实际上很少有人能够做到?
Sam Altman:
确实,模型是贬值资产,但说它们的价值不如训练成本,这似乎完全错误。更不用说,随着您学习训练这些模型,会更好地训练下一个模型,并从中获得正反馈。我们可以通过模型实现收入,我认为证明了投资是合理的。
但公平地说,我不认为这对每个人都适用,可能有太多人在训练非常相似的模型,如果您稍微落后了,或者如果您没有一个带有自然商业规则的产品,使得该产品具有粘性和价值,那么也许可能很难获得投资回报。 我们非常幸运拥有ChatGPT和成千上万的人使用我们的模型。
推理是当前OpenAI模型最重要的关注领域
提问:
您如何看待OpenAI模型随着时间的推移继续进行差异化,以及你最想专注于哪个方面的差异化?
Sam Altman:
推理是我们当前最重要的关注领域,我认为这是解锁下一个巨大进步和价值的关键。因此,我们将在很多方面改进它们。我们将进行多模态工作,将在模型中加入我们认为非常重要的其他功能,以满足人们使用这些工具的方式。
提问:
您如何看待多模态工作中的推理及其所面临的挑战, 以及您希望实现的目标?
Sam Altman:
多模态工作中的推理,这显然需要一些努力,但是就像人们在他们还是婴儿和蹒跚学步时,虽然语言能力不强,但仍能进行相当复杂的视觉推理,所以显然这是可能的。
提问:
视觉能力将如何随着由 o1设置的的推理时间范式进行扩展呢?
Sam Altman:
在不透露过多细节的情况下,我们会取得快速进展。
提问:
GPT 的输出是生成式的。我不认为我们在很多 GPT 的输出中有接近英式风格。GPT 的输出通常在拼写和语气上是美式的。你如何看待模型的国际化,不同的文化,不同的语言,以及这一点的重要性。
Sam Altman:
我不使用英式英语,我没有尝试过,但我会猜测它在英式英语方面表现得很好。我们可以看看, 我们可以做到。
OpenAI很容易复制已经成功的东西
提问:
OpenAI 如何在推理能力方面取得突破?我们是否需要开始将强化学习作为路径推进,或新的技术?除了 Transformer 之外,还有其他方法吗?
Sam Altman:
这一点是我们的独特之处,很容易复制已经成功的东西。 所以在研究实验室做了一些事情之后,即使您不知道他们是如何做到的,复制它也是可行的。您可以在GPT-4的复制中看到这一点,我相信您会在o1的复制中看到这一点。
真正困难的事情,也最让我自豪的文化是是不断重复地去做一些新的、完全未经验证的事情。很多组织,无论是在任何领域,都声称拥有这种能力,但实际上做到的很少。在某种意义上,我认为这是人类进步最重要的投入之一。
所以我曾幻想在退休后写一本书,总结我所学到的一切,关于如何建立一个组织和文化,去做这种事情,而不是仅仅模仿其他人已经做过的事情。
因为我认为世界上可以有更多这样的组织, 这受到人类才能的限制,但人类才能的浪费却很多,因为这不是我们擅长建立的组织风格或文化, 无论您想怎么称呼它。 因此,我希望能有更多这样的事情,我认为这是我们最特别的地方。
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
海量资讯、精准解读,尽在新浪财经APP责任编辑:刘明亮