AI 新趋势:怎样才能更好的满足模型层与应用层之间的落差?
前段时间,Sequoia 领投了由华人女性 Lin Qiao 创立的 Fireworks AI,使其估值在 2 年时间达到了 5.52 亿美金。
当时我觉得 Fireworks 做的事情挺重要,因为它本质上是在帮助开发者或者企业更高效的接入适合自己 ai 的能力,这里的高效不仅包括了便利性、质量、成本,也包括了安全等,就是怎么样在最快的时间和最低的成本下找到符合自己特定应用场景需要的 AI 模型能力。 其实这个需求正在变得越来越明显,以至于针对这个需求提供解决方案的行业可能正在悄悄兴起。 但在模型层和应⽤层中间,有很多企业的需求并没有得到很好的满⾜。AI 大模型提供的是通⽤能⼒,但是具体到各⾏各业,模型⽆法满⾜所有细分垂直领域的所有需求,并且最前沿的模型研究也发现,现在的模型发展有⼀种趋势,就是强调某⼀⽅向的能⼒,代价或许是弱化另⼀些⽅⾯的能⼒。 ⼤量的企业有使⽤模型能⼒的需求,但⾃⼰的业务⼜不是基于模型去做⼀款新的应⽤,比方说公司内部信息的整合,知识库的建⽴,HR 部⻔⾃建的简历筛选⼯具等等。 这类公司的需求⽐较细分和垂直,单单依靠套⼀个⼤模型的 API,⽆法直接满⾜⾃身需求,⽽⾃⼰投⼊研发⼈员去进⾏基于模型 API 的内部需求功能开发,成本相对较⾼,AI 的⼈才也⽐较稀缺,很多公司并不具备这样的研发能⼒。 而对于数量更加庞⼤的中⼩企业来说,他们很少没有⾜够的资源和能力去研发适合⾃⼰的 RAG 过后的⼤模型 API。于是解决这个需求的服务在很多⾏业就逐渐兴起来了,它们基于⼤模型,给这些企业提供 RAG 过的⼤模型的 API 接⼝的服务。 比方说上面提到的 Fireworks AI,但事实上,还有很多其它类似的产品,比方说我之前介绍过的 Hebbia,虽然它被描述为一个瞄准海量非结构化数据的 AI 搜索引擎,但是本质上它也是在为 B 端企业提供类似的 API 服务。 另外像 Together AI、阿里副总裁贾扬清创立的 Lepton AI、被 Databricks 以 13 亿美金收购的 Mosaicml 甚至 AWS 的 Sagemaker 和 Bedrock 也都在做类似的事情。 这些一开始都比较明确,直接面向 B 端企业。但这里比较有意思的一点是,很多流量大一开始面向 C 端的 AI 产品也都逐渐开始提供这样的 API 服务,比方说 Perplexity 和 Chatpdf 等。 Perplexity 我们比较熟悉,我之前在介绍其推出企业版 Perplexity Pro 时,就曾说它可能正在开辟一个新的市场。其 CEO Aravind 当时一直强调这个产品针对的是企业内部的知识工作,目的是促进这些组织内部的研究和有针对性的搜索能力。 ChatPDF 同样如此,它本来是为学生、研究人员和专业人士提供基于 PDF 文档做 AI 总结和问答类似的服务,自身定位是一个 PDF AI:ChatGPT,but for PDF。 看起来像一个提供给 C 端用户的 AI Wrapper,在拥有大量 C 端用户后,现在也越来越多的在提供这块的 API 服务。这种现象还发生在一些垂直聚焦的 AI 产品上,比方说 you.com 和我之前介绍过的 txyz.ai。 you.com 本来是一个个性化的 AI 搜索引擎,它会根据用户的兴趣偏好和过去的搜索历史提供定制化的搜索结果,慢慢的提供了更多 AI 功能,比方说图片生成以及用于优化不同任务的 Smart、Genius、create 和 Research 等专用模式。 现在,和 Perplexity 类似,You.com 也推出了针对 B 端企业客户的 API 服务,除了强调隐私和准确性外,它同样强调了为特定用例、部门或专有数据集创建自定义助手。 而 txyz.ai 我之前详细介绍过,它由知识博主严伯钧以及几位科学家一起创立,做的是一款 AI 驱动的知识工作自动化产品,一开始主要是一个帮助大家搜索、查询专业文献并可以进行对话的 AI 工具。 上线 3 个月便吸引了多个领域中的专业知识工作者用户和一些企业级客户。最近严伯钧跟我说,他们的企业级市场这块的需求增长非常快速,希望他们能提供针对专业科研领域的 RAG 服务。 这就需要拥有针对专业领域的 RAG,而 C 端用户的活跃所产生的数据,进入数据飞轮以后,会对 RAG 的质量提升起到正向作用,这种数据飞轮正在成为这类 C 端产品,同时又向企业提供 API 服务的创业公司的护城河。 这些产品一开始本身是为 C 端提供服务的,但在服务大量 C 端用户的过程中积累了越来越多的行业专业数据和 KnowHow,再与目前非常热门的 Agentic Workflow 技术相结合,它们往往可以提供更加能满⾜ B 端⽤户具体需求的 API 接⼝。 从而让这些看似 ToC 的 AI 产品,在 C 端未必能赚到钱,但是通过为中小企业提供 API 接口服务,反而开始创造了不少的价值和营收。 当然在解决这个需求方面,还有一类专门做 RAG 服务的公司,比方说斯坦福大学助理教授马腾宇创立的 Voyage AI,这是一家专门开发为各种领域和公司量身定制的高级嵌入模型的公司,以提高检索和搜索质量。 这些模型旨在提高检索增强生成 (RAG) 系统的性能,可以广泛用于聊天机器人和语义搜索等 AI 应用。 如果简单做个总结了话,我觉得这个趋势有这么几点可以关注:一个大需求 3 种解决方案。 1.需求痛点方面: ⼤模型提供 API 接⼝,AI 应⽤都是基于⼤模型的 API 构建; 有⼤量的中⼩企业,有使⽤⼤模型能⼒的需求,但是⼀个裸的⼤模型 API ⽆法满⾜这些企业的具体需求; 如果这些企业⾃⼰做 RAG,投⼊⼤,⼈才缺乏,做出来的还不⼀定好,甚⾄可以说⼤部分的企业并不具备这样的⼒; 2.3 种解决方案: 一种是类似 Fireworks 和 Together 等直接面向 B 端企业提供 API 服务的产品; 第二种是⼀批看似是 2C 的企业,这些企业在服务 C 端的同时,积累了⼤量专业的⾏业数据和 Knowhow,把这种能⼒迭代到⾃⼰的 API 中,相⽐直接的⼤模型,更能贴合⼴⼤中⼩企业的需求;其结果是 C 端未必赚到了钱,但是他们纷纷提供⾯向中⼩企业的 API 接⼝,这个反⽽已经开始创造了不少的价值和营收; 第三类就是专门做 RAG 服务的产品; 考虑到大量中⼩企业的数量,以及⼤模型带来的效率提升,我想这种 API 中间层服务或许会是⼀个正在爆发的巨⼤市场机会,而这块对于面向 C 端的 AI 产品来说,同样具有非常大的机会,甚至可能更有优势,因为它们在发展的过程中积累了并且一直在持续积累大量的专业数据和行业 Knowhow。 AI 时代,在很多领域,或许 ToC 和 ToB 的分界线不会那么明显。下面是对上面提到的一些公司在这块提供 API 服务简单做的一个总结,我相信应该还有很多其它类似的产品。
我们知道各⼤模型公司都提供 API 供企业接⼊进⾏开发,AI 应⽤都是基于各个⼤模型提供的 API 开展⾃⼰的业务。
txyz 的主要 API 客户集中在生物医药、材料科学、机械制造领域。这些企业的共同特点是,它们都拥有较重的 R&D 部门,所以针对垂直学科领域的知识搜索和处理需求巨大。同时,这类高科技企业也拥有海量的内部文档,关于企业内部知识库的建立也是一个核心需求。
本篇内容来源微信公众号: 投资实习所