OpenAI新发布推理模型o1-preview,将通过隐藏模型来解决问题
在人工智能竞赛中,竞争非常激烈。每个大型 AI 开发者都像鹰一样盯着竞争对手,并且试图逆向工程或复制他们的最佳作品,正如我们所报道的。
一个像 OpenAI 的领导者可以做些什么来保持其优势?该公司新发布的推理模型 o1-preview,也称为 Strawberry,展示了一种方法:通过隐藏模型实际解决问题的方式。
上周发布的博客文章宣布了 o1-preview,提到该模型使用“内部思维链”将问题分解为更简单的步骤,然后再进行解决。正如我们之前所展示的,开发者已经使用“思维链提示”来使现有的大型语言模型,包括 OpenAI 的 GPT-4,在复杂或多步骤查询上表现得更好。
新的推理模型自行完成这一过程,但并未向客户展示其工作过程。相反,o1 模型展示了“模型生成的思维链摘要”,这意味着在客户看到之前,它的思维是由一个完全不同的模型重写的。
OpenAI 表示,他们决定将原始思维链隐藏起来,主要是因为这将允许其员工——仅限员工——“读懂”模型的思维,以了解其运作方式。OpenAI 表示,他们不希望模型的未经过滤的思维被展示出来,因为这可能包含不安全的想法,并且公司希望“监控”模型,以确保它不会表现出背叛行为,例如“操纵”客户。
但 OpenAI 并没有掩饰其决定的另一个因素是“竞争优势”。这是可以理解的。
这一举动暗示,如果 o1-preview 的思维链没有被过滤,它可能会表现得更好,因为客户可能通过根据模型的思考来调整他们的问题,从而获得更多的收益。
我们很好奇 OpenAI 是否会找到方法来限制在发布模型的完整版本 o1 之前,隐藏思维链所带来的所谓性能下降。
一些开发者表示他们对隐藏的思维链感到烦恼,因为他们可能会为一些看不见的东西付费。OpenAI 根据其模型处理和输出的令牌数量(单词或单词的一部分)向开发者收费。
尽管如此,在 X 上发布关于 o1-preview 的开发者的评论仍然大多是积极的。
对 o1-preview 的良好反响提高了竞争对手的压力,例如谷歌。这家搜索公司在赢得客户方面已经遇到了困难,尤其是对于其Gemini LLMs 因为谷歌让使用它们变得异常困难。
感谢 OpenAI,谷歌吸引商业客户必须攀登的山峰变得更高了。
文章来源: Z Potentials