OpenAI新发布推理模型o1-preview，将通过隐藏模型来解决问题

时间：2024-09-19 阅读：245

在人工智能竞赛中，竞争非常激烈。每个大型 AI 开发者都像鹰一样盯着竞争对手，并且试图逆向工程或复制他们的最佳作品，正如我们所报道的。

一个像 OpenAI 的领导者可以做些什么来保持其优势？该公司新发布的推理模型 o1-preview，也称为 Strawberry，展示了一种方法：通过隐藏模型实际解决问题的方式。

上周发布的博客文章宣布了 o1-preview，提到该模型使用“内部思维链”将问题分解为更简单的步骤，然后再进行解决。正如我们之前所展示的，开发者已经使用“思维链提示”来使现有的大型语言模型，包括 OpenAI 的 GPT-4，在复杂或多步骤查询上表现得更好。

新的推理模型自行完成这一过程，但并未向客户展示其工作过程。相反，o1 模型展示了“模型生成的思维链摘要”，这意味着在客户看到之前，它的思维是由一个完全不同的模型重写的。

OpenAI 表示，他们决定将原始思维链隐藏起来，主要是因为这将允许其员工——仅限员工——“读懂”模型的思维，以了解其运作方式。OpenAI 表示，他们不希望模型的未经过滤的思维被展示出来，因为这可能包含不安全的想法，并且公司希望“监控”模型，以确保它不会表现出背叛行为，例如“操纵”客户。

但 OpenAI 并没有掩饰其决定的另一个因素是“竞争优势”。这是可以理解的。

这一举动暗示，如果 o1-preview 的思维链没有被过滤，它可能会表现得更好，因为客户可能通过根据模型的思考来调整他们的问题，从而获得更多的收益。

我们很好奇 OpenAI 是否会找到方法来限制在发布模型的完整版本 o1 之前，隐藏思维链所带来的所谓性能下降。

一些开发者表示他们对隐藏的思维链感到烦恼，因为他们可能会为一些看不见的东西付费。OpenAI 根据其模型处理和输出的令牌数量（单词或单词的一部分）向开发者收费。

尽管如此，在 X 上发布关于 o1-preview 的开发者的评论仍然大多是积极的。

对 o1-preview 的良好反响提高了竞争对手的压力，例如谷歌。这家搜索公司在赢得客户方面已经遇到了困难，尤其是对于其Gemini LLMs 因为谷歌让使用它们变得异常困难。

感谢 OpenAI，谷歌吸引商业客户必须攀登的山峰变得更高了。

了解更多AI 资讯，可以加入我们的交流群一起沟通讨论~

网站——AI群码（明娟）.png

文章来源： Z Potentials