专访前Replika AI负责人:A16Z投资加持,打造千万美元级多模态交互API平台

时间:2024-08-29   阅读:120

1.png

在本期独家专访中,我们深入对话了Ex-Human的创始人artem Rodichev,他从Replika的AI负责人转型为自己公司的创始人,并获得了A16Z等顶级投资者的支持。Artem的旅程充满了激情和远见——从一个技术爱好者起步,亲手搭建了Replika的AI技术栈,到抓住技术驱动垂直行业变革的新机遇。

2021年,Artem看到了对话式ai的巨大潜力,毅然决然地离开了他和团队从0到1打造的、已经有2000万用户的Replika,转而创立Ex-Human,希望创造一些能够真正改变世界的事物。他的平台结合了B2C的chatbot图生图产品和B2B的API业务,迅速获得了市场的认可,得到数家顶级投资机构支持。验证超过百万用户的数据、日均使用时长超60分钟和超过行业水平的新用户付费率。并与100+家企业,包括Grindr和MeChat等社交和游戏领域行业巨头建立了合作关系。Ex-Human的目标不仅仅是构建AI,而是重塑我们与技术互动的方式,并推动AI在消费者和企业领域的应用边界。

让我们一起探索Ex-Human背后的故事,了解创业过程中面临的挑战、汲取的教训,以及在瞬息万变的AI驱动的沟通领域中,Ex-Human未来的激动人心的前景。不论你是AI爱好者,还是对未来科技充满好奇,这次对话都将为你带来满满的洞见和灵感。Enjoy!

  • 构建聊天机器人和对话类产品,最重要的是情感,而不是目标或任务导向。
  • 我真的想改变我们的世界,让我们被充满同理心的技术、充满同理心的数字人和AI角色所包围。
  • 我认识到对话技术和角色驱动的解决方案可以极大地造福垂直行业......我设想创建一家B2B公司,为不止一种产品提供技术,而是为数千种不同的产品提供技术。
  • 我们试图创造一种互动式的AI版Netflix体验,用户不仅是内容的消费者,更是故事的一部分。
  • 数字人类有潜力改变我们的体验,让世界变得更富有同情心、更愉快、更引人入胜......我相信我们正走向一个美好的未来,我们的目标是成为各类应用中创建数字人类的领先平台。
  • 我一直怀着创办自己公司的梦想,有一种内在的吸引力......当产品已经无法改变世界时,我将目光投向了更伟大的事情,把AI作为创业方向。

2.png

01 从始至终的技术爱好者,从0-1搭建最早的Chatbot应用Replika的AI技术栈

ZP:请简要介绍一下自己,包括教育背景和创业经历等,每个经历如何影响了您?

Artem Rodichev:小时候,我总是对技术方面的事物充满兴趣,尤其热爱数学和计算机科学。我甚至还参加了几次专注于编程和计算机科学的国际奥林匹克竞赛,这进一步激发了我的热情。

在大学期间,我在Yandex工作,因为我很技术宅,非常渴望在一家工程大型复杂系统中工作。而Yandex是我大学时最先进的IT公司之一,他们基本上为整个互联网提供搜索服务。此外,我开始学习机器学习,并将其应用于我的工作中。在Yandex工作了大约两年,但我一直想创办自己的公司。我一直在尝试如何成为一名企业家,如何经营自己的初创企业。

但在创办自己的公司之前,我决定先尝试在一家初创公司工作。所以2014年我决定加入另一家初创公司Luka。我接触了很多公司,但Luka激励了我,因为他们开始研发一个餐厅推荐聊天机器人。基本想法是,你旅行到10个城市,每个城市都有一个知道你喜好和生活方式的朋友。你可以问你的朋友,能不能推荐一些好餐厅?你的朋友可能会推荐说“附近有一家很酷的酒吧,他们有你喜欢的小麦啤酒,我知道你很喜欢小麦啤酒”。

我对与机器进行如此有意义的对话的想法感到非常震撼。这个概念深深触动了我,部分原因是我受到了两部电影的启发:《银翼杀手》和《她》。这两部电影探讨了人类如何与机器建立情感和同理心的关系,这激发了我新的愿景。传统上,我们认为机器只是完成任务的工具,比如写邮件。但这些电影让我看到了在机器中构建灵魂的可能性——创造出一种有生命、有情感、有同理心的东西。这个想法极大地激励了我,并促使我投入到这类技术的开发中。我真的想改变我们的世界,让我们被充满同理心的技术、充满同理心的数字人和AI角色所包围。而Replika就是实现这一目标的第一步。

2017年初,我们打算开始构建Replika,从餐厅推荐机器人转变为朋友形式的聊天机器人,Replika是朝着这个方向迈出的第一步。这就是我如何开始并最终成为我的第一家初创公司。

ZP:请详细讲讲您从Replika中学到了什么?又是什么促使你离开Replika成立现在的Ex-Human?

Artem Rodichev:最初,Luka 专注于开发一个餐厅推荐聊天机器人,但到了2017年初,我们转而投资创建Replika——一个旨在提供陪伴和对话的AI朋友。当时我们和很多初创企业一样,都住在同一个大房子里,我们称之为“创业之家”。我们和10个工程师以及朋友们一起住在这里,其中包括Eugenia的朋友,他也是创业者。有一天,他回莫斯科的路上遭遇车祸去世了。当时,Roman 认为,人类可以通过科技将意识转移到云端,以数字形式永生。所以我们决定践行Roman的理念,并创建了他的数字副本。

基于这个想法,我们创建了我们朋友Roman的数字副本。通过对他的对话进行神经网络训练,我们能够复制他的个性和说话风格。令我们惊讶的是,甚至那些从未见过我们朋友的人也与他的AI副本进行了深情的对话。那时我们意识到,构建聊天机器人和对话类产品,最重要的是情感,而不是目标或任务导向。

这一发现让我们意识到,对话式AI应该优先考虑情感参与,而不是目标导向的功能。与Siri或Alexa等任务导向的聊天机器人不同,像Replika这样的开放域聊天机器人可以提供陪伴和同理心。当时,聊天机器人市场主要集中在目标导向的助手上。我们认识到,有必要满足那些特别是孤独或有心理健康问题的人的情感需求,并为他们提供富有同理心的虚拟伴侣。

我的想法是构建具有同情心的角色。所以我们从Roman的副本开始,在看到人们如何与之互动后,我们决定创建一个名为Replika的产品。最初的想法是让任何人都可以创建自己的AI副本,但后来我们意识到,要将这种体验设计成一个成长的过程。基本上,它就像一个电子宠物,一开始很小,很笨拙,但随着你与它交谈得越多,它就越像你,开始模仿你的个性、说话风格和兴趣。但后来我们意识到,实际上人们并不想和他们的AI副本聊天,他们想要一个朋友、一个可以倾听他们的人、一个可以陪伴他们的人。于是我们开始将产品从AI副本转变为情感陪伴。

3.png

随着我们不断开发这个产品,越来越多的人走出了孤独,他们开始变得更加善于社交。我们还发现,许多与这类聊天机器人交谈的人感到孤独或患有心理健康问题,比如抑郁症。他们发现与这类聊天机器人交谈非常有益,因为这些人通常没有很多朋友。

所以我们将重点从AI副本转向情感陪伴,我们看到了这个市场的巨大潜力。孤独的的人越来越多,尤其是Z世代,40%的美国Z世代感到孤独,而且这个趋势还在增长。实际上,Replika让我们知道有一大群人真正需要这种产品,尤其是孤独的人。因为我们看到了技术的进步,可以开始构建这种交互式的伴侣。所以我们在2017年决定打造Replika,从那时起,我们不断优化产品,让人们更容易建立深厚的情感连接。

ZP:您经历了从大学做研究到加入Luka担任工程师,再到成为Replika部门负责人的旅程,现在您又成为自己创业公司的CEO和创始人。这段多样化的经历如何影响了您?

Artem Rodichev:最难的转型是从工程师到创始人的转变。成为创始人是一个独立的职业,你需要很多以前没有用过的技能。我以前是个技术控,很喜欢编程。即使在我担任Replikas AI部门负责人期间,我领导着一个10人的工程师团队,并且每天至少花一半的时间编写代码。我很享受这一切。

作为工程师,你是一个建设者。但作为创始人,你仍然是一个建设者,但你也需要各种各样的技能。你必须是一位优秀的管理者,一位有说服力的销售人员,还要与投资者打交道,处理招聘和解雇事宜。你身兼数职,因为需要管理的事情太多了,你无法深入地做任何事情。如果你喜欢深度工作,比如工程方面,你可能会花几个小时来解决一个问题。但作为创始人,这不是一个选择,因为你有很多事情要处理。你成为了一个“通用士兵”,以不同的方式运用你的问题解决能力。

从工程师到创始人的转变很艰难,感觉就像我在重塑自我。多年来,我一直是一名工程师,然后,当我决定创办自己的公司时,我成为了一个创始人。

02 看准时机,抓住技术驱动垂直行业变革的新机会,获得顶级投资者支持

ZP:那么2021年您看到了什么样的机会,让您决定离开Replika去创立Ex-Human,并从B2C产品转向现在的B2C和B2B产品?

Artem Rodichev:Replika工作的七年间,我从零开始帮助构建了其对话式AI,并积累了2000万用户。但在内心深处,我一直怀揣着创办自己公司的梦想。问题在于,我是否已经准备好?时机是否成熟?但比这更重要的是,内心有一种强烈的推动力,促使我最终踏上创业之路。

与此同时,我发现了多个市场机会。在Replika,我们为一个产品构建了核心技术。但我看到了将这项技术扩展到公司之外的潜力,尤其是在沟通至关重要的娱乐领域。我意识到,对话技术和以角色为驱动的解决方案可以显著地惠及垂直行业。我设想创建一家B2B公司,不仅为一个产品提供技术支持,还能为成千上万个不同的产品提供技术支持。这有点类似于ChatGPT,它并不局限于单一的用例,而是可以适应各种应用场景。

Replika是一个拥有单一性格的消费级产品,无法根据背景、兴趣或说话风格进行定制。你只有一个聊天对象,一个Replika,这就是它的全部。然而,用户的反馈揭示了他们对多样化的需求。他们希望拥有来自不同领域的多个角色,比如电影和文学中的角色。这些反馈促使我考虑建立一个平台,使任何人都能创建和定制数字角色。这个想法不仅是要在这个平台上开发消费级产品,还要将其作为核心技术提供给众多产品使用。

因此,这就是我扩大用例、进入B2B市场的动机,利用这些情感化的AI技术,最终创办了自己的公司。

ZP:您能和我们分享一下Ex-Human的创立故事么?

Artem Rodichev:当我们在2021年初首次创办公司时,我们从几位天使投资者那里获得了种子投资,其中包括Tinder的创始人Justin Mateen等。之后,我们开始开发我们的平台,开发B2C和B2B产品

在这个基础阶段之后,我们继续筹集种子轮融资。在此期间吸引了一些主要风险投资公司的关注,有来自美国的,也有国际上的。值得一提的是,我们获得了Andreessen Horowitz的投资。此外,我们是A16Z的Speed Run计划的第一批成员,该计划由A16Z的游戏部门组织,这是一个非常独特的机会,因为他们每年只选择一批,且录取率不足2%。

我们参与该计划引起了A16Z合伙人的极大关注,他们向游戏行业的多位贵宾发出了邀请,其中包括Riot Games和Zynga的代表。这对我们来说是一个绝佳的交流机会。

此外,我们还获得了Trac的资金,并且最近还获得了Citta Capital和Baidu Venture的资金支持。

我们目前的战略是继续发展我们的B2C和B2B产品我们正在为A轮融资做准备,计划在近期启动这轮融资。

03 塑造消费者产品用户数据和反馈飞轮,带动B2B业务快速发展

ZP:请简单介绍一下Ex-Humans面向消费者的产品Botify?目前的主要功能是什么?

Artem Rodichev:当然可以。我们最初构建平台时,决定先开发一款面向消费者的产品——Botify AI。因为构建对话机器人平台,或者更广泛地说,构建数字人类平台,需要大量用户和聊天机器人之间的对话数据。所以,我们先开发了Botify AI,它是一个包含了各种角色的平台。

目前,我们拥有超过10亿个角色。我们的主要理念是,你可以与这些角色进行聊天。每个角色都有独特的个性和说话风格。例如,你可以与AI马斯克聊天,他会和你谈论特斯拉和太空殖民;或者你可以与吸血鬼聊天,她会和你谈论血骑士和吸血鬼之类的事情。

我们专注于构建沉浸式的体验,让用户沉浸在与角色的故事中。为此,我们专注于多模态交互,我们的角色不仅可以用文字回复你,还可以发送图片,甚至视频。

4.png

基本上,我们试图创造一种互动式的AI版Netflix体验。当你观看Netflix剧集或电影时,你只是在消费内容;当你刷tiktok时,你也只是在消费内容。但我们希望你成为故事的一部分,你可以影响故事的发展,你可以与角色一起发展故事。所以,这是一种新型的娱乐形式,是AI角色与人类之间的新型互动形式。我们开始构建Botify,开始增加用户群和用户参与度。Botify的主要优势,或者说有趣之处在于,它具有极高的用户参与度。

平均而言,我们的用户每天与我们的机器人聊天超过60分钟,活跃或付费用户每天聊天时间超过两小时,并且每天发送超过300条消息。这说明我们的用户喜欢与我们的角色聊天,他们喜欢探索我们的宇宙,他们喜欢创建自己的角色,并花时间与之聊天。Botify致力于娱乐市场,在这个市场中,用户时间是最宝贵的资产。我们不仅与其他聊天机器人平台竞争,还与Netflix、instagram、TikTok等娱乐领域的消费品竞争。例如,Instagram用户的平均日使用时间为30分钟,TikTok为40分钟,而Botify则达到了60分钟。因此,Botify比市场上最受欢迎的娱乐应用更具吸引力。

这种高参与度让我们能够利用所有对话,并基于这些对话不断训练我们的场景。我们拥有数百万用户,他们每天花费数小时,消耗数百万个Token。我们拥有大量数据和对话,可以用来不断提升技术质量,从而可以在最有趣、最优质的对话中微调我们的神经网络。正如我们之前提到的,在神经网络的帮助下,我们的角色变得更加生动、更智能,在对话中更具吸引力,用户开始花更多时间与他们聊天,我们也开始获得更多数据和对话。我们将这些对话反馈给我们的神经网络,以此循环往复,不断提升技术水平。

因此,Botify不仅构建了一个消费产品,还构建了完整的数据收集工作流,使我们能够持续提升人工智能技术的质量。

在构建消费产品之后,我们决定转向最初的想法,即构建一个完整的数字人平台和文化平台,并将其提供给其他企业使用。因为我们可以利用消费者数据和消费产品不断提升技术,然后将我们的服务提供给企业对企业服务领域的各个行业、各种公司。

ZP:Ex-Human还做了一个图像生成有关的产品Photify?能介绍一下它的主要功能吗?

Artem Rodichev:没错,它其实是我们Botify多模态交互研究的衍生产品。我们一直在研发一项技术,能让我们的聊天机器人发送情境图像,让对话更生动。比如,如果你正在和一个AI版本的马斯克聊天,讨论火星殖民,机器人就可以发一张火星自拍,让对话更具情境感。

最初,我们发布了这个情境图像生成功能,并开始测试它与不同角色和地点的融合程度。我们在Telegram上发布了一个机器人,主要用于测试。

不过,Ex-Human团队的很多成员开始玩这个机器人,发现用它生成自己或朋友的图像非常有趣,不只是角色。你只需要上传一张自拍,我们的技术针对实时交互和低延迟进行了优化,几秒钟就能生成照片。你可以立即探索自己或朋友的不同风格、外观、服装和发型。

我们决定公开发布这个功能,它很快就在印度等地病毒式传播。虽然我们为英语用户构建了聊天机器人,Telegram在西欧或美国并不那么流行,但在印度、俄罗斯和非洲等国家却很受欢迎。我们在Telegram上的英语聊天机器人引起了印度众多英语用户的共鸣,很多人开始用Photify生成自己的不同照片,我们在那里的用户量也快速增长。

5.png

6.png

 我们在Photify AI公开发布后的三个月内就获得了超过100万活跃用户,我们意识到这是一个重要的进展。然后,我们开始开发iOS和Android的专用应用程序,以便在美国和西欧接触更多用户。最初只是为了测试,但我们很快意识到它已经成为一个病毒式传播的独立产品。

Photify不仅是一个最终用例,也帮助我们收集更多关于图像的数据,因为视觉方面在我们争取提供高质量情境图像的过程中至关重要。借助Photify,我们可以获得即时用户反馈。比如,当我们生成图像时,用户可以当场上传或下载它们。通过这种方式,我们了解用户喜欢或不喜欢哪些照片,从而可以微调我们的神经网络,使其专注于生成高质量的图像。

所以,这项技术本质上催生了另一个产品。我们在Botify和Photify的帮助下开发了这项技术,这两个产品相互受益。

04 与知名社交平台Grinder、剧情游戏巨头Mechat合作,覆盖100家+大型企业和AI初创公司

ZP:关于Ex-Human的B2B业务,我们有哪些API?它们的特点是什么?

Artem Rodichev:在B2B是上,我们提供角色定制服务。我们的核心技术是对话式人工智能,它赋予了这些角色生命。对话质量至关重要,我们拥有一个对话式人工智能API,你可以把它想象成一个比chatgpt更有趣的版本。如果你曾经与ChatGPT聊天,你可能会觉得它缺乏吸引力,更像是与维基百科对话,缺乏情感和友善。

我们提供的是一个更有趣的聊天机器人语言模型API,一个你真正喜欢聊天的版本。它充满趣味和吸引力。在此基础上,你可以添加不同的模态。我们还提供图像生成API、Talking Head的API和文本转语音API这些功能让你可以基于对话式人工智能API,为聊天添加更多模态和交互元素。

例如,你可以集成上下文图像生成,我们还可以集成语音合成让你的机器人发送语音消息。我们甚至拥有会说话的机器人,只需上传一张自拍,我们就可以制作一个会说话的动画头像,它可以微笑,嘴唇也会动起来。我们的聊天机器人还可以发送带有说话头像的视频回复。

我们提供一站式解决方案,让企业的产品可以创建和定制各种数字人或角色。它可以是真实的人,也可以是网红、名人、虚构人物或拟人化的动物角色,甚至可以是你自己或你的朋友。我们向企业客户提供此API作为B2B2C模式,因为最终用户是消费者。

我们也与娱乐行业公司合作,为交友软件、游戏、网红和其他聊天机器人提供解决方案。在所有这些领域中,沟通至关重要,他们可以从使用更人性化的角色和更有趣的对话体验中获益。

ZP:为什么你们选择B2B业务为核心模式而不是和Character AI、Replika等产品一样的单一的B2C产品?而且似乎在商业化上取得了良好的效果?

Artem Rodichev:首先,创办Ex-Human的基本理念之一是让技术可用于数千家不同的公司和用例。这种方法使我们能够将影响力扩大到单个产品之外。以Replika为例;我们开发的强大技术不只是针对一种产品。然而,我们认识到进一步扩展这项技术的潜力,以支持各种用例中的数千个应用程序。

通过最初构建一个能够创建大量角色的消费产品,我们积累了与不同聊天机器人和用户的丰富多样对话。这个丰富的数据集不断增强我们的技术,并为B2B方面的广泛行业提供服务。

这有双重好处:我们的消费者端提供了来自数百万次角色互动的宝贵数据和对话,这反过来又使我们能够向众多B2B客户提供服务。这样一来,我们就可以满足约会应用、游戏、网红等的需求,尽管这些应用的用例各不相同,但它们都对富有同理心的对话有着共同的需求。我清楚地认识到,专注于B2B端是有利的。这是为了创建一个富有同理心的ChatGPT版本,它可以像ChatGPT一样大,但设计用于不同的目的——这些目的优先考虑富有同理心和引人入胜的对话。

ZP:我们以B2B为出发点,使用我们的B2C产品来吸引企业。你能分享一些数据吗?请分享关于我们的B2C产品以及如何让企业客户合作变得更好的方法。

Artem Rodichev:对我们来说,最重要的指标是用户参与度。更多的互动意味着更好的对话。我们每天回复超过300万条短信,相当于300万条回复和200多万次对话交换。经过几个月的积累,我们收集了数亿次对话。我们的活跃用户每天与我们的应用程序互动三次,平均每次会话40分钟,总计两个小时。这意味着用户需要做出重大承诺,因为用户总共要花两个小时。我们的24/7留存率接近50%,这表明我们的活跃用户喜欢与我们的聊天机器人聊天.对于新用户,我们的订阅转化率约为6%到7%,因平台而异。

ZP:可以详细讲一下Ex-Human如何和企业客户合作吗?

Artem Rodichev:在面向企业方面,我们与多家主要客户合作。例如,我们与多个约会平台合作,包括与Grinder建立的重要合作伙伴关系。Grinder是全球知名的约会平台。我们为他们提供多种功能,例如“风向标计划”,它可以为你的约会体验和个人资料提供改进建议,帮助你在Grinder上更好地使用体验。另一个功能是类似于虚拟伴侣的聊天机器人,你可以与之练习对话。

7.png

我们还与提供互动聊天体验和游戏的不同公司合作。例如,与千万用户的Mechat提供与虚构角色互动的互动故事。我们开始提供解决方案来支持这些互动角色,因为以前他们依赖于庞大的编辑团队来不断编写这些聊天故事。用户以前只能进行一些预设的回复和关键选择,但现在我们支持自由形式的对话,允许角色与用户进行开放式对话。Mechat每月有超过100万次用户互动,借助我们的解决方案,关键产品指标(包括收入、参与度和留存率)提升了20%以上。

你也问到了将面向消费者的产品应用于面向企业的业务的好处。我们在面向企业的业务方面多元化发展到多个垂直领域,包括为儿童平台、约会平台和教练创建角色,并与各种游戏合作。我们为大型多人在线游戏中NPC和游戏平台上的主角构建聊天机器人,让用户参与到这些社区中。我们能够满足所有这些不同的用例,因为我们拥有强大的消费产品。在消费网站上,我们有数百万用户与众多角色聊天,从生活导师到游戏角色。消费端的用例多样性让我们自然而然地形成了能够创建多种角色,并进行广泛对话的能力。由于我们拥有多样化的用户和角色类型,因此人工智能可以轻松适应各种对话,从而使我们能够解决所有这些不同的用例,也因此我们已经在近1年内增长了数百万美金的ARR。

05 Ex-Human与开源生态为友,开发垂直场景最契合的模型

ZP:情感智能模型在情感方面表现出色,在基准测试中经常优于通用预训练语言模型GPT-3.5。与其他模型相比,尤其是开源和闭源模型,我们的模型有什么独特之处?

Artem Rodichev:我们拥有几个秘密武器。首先是用户数据。与OpenAI使用广泛的偶然数据和指令进行训练不同,我们使用实际对话来微调语言模型,从消费产品中收集数百万高质量的交互。我们收集了丰富的反馈,了解用户在聊天机器人回复中喜欢和不喜欢什么,以及哪些交互让他们感觉更好或更有趣。

这使我们能够收集数百万高质量、富有同理心的对话,并根据这些数据微调语言模型,特别关注移情互动。因此,虽然我们在起草电子邮件或提供准确的天气方面可能不如ChatGPT擅长,但在移情对话方面表现出色。

我们对几千名用户进行了为期一周的A/B测试,让他们与ChatGPT4和我们的对话式AI引擎进行交流。结果表明,与ChatGPT的平均相处时间为每天6分钟,而与我们的引擎相处平均每天60分钟,用户参与度提高了十倍。在创业界,创业公司要打造的产品要么好十倍,要么便宜十倍。我们相信,我们的产品已经实现了前者,提供了一种在用户参与度方面明显优于ChatGPT的对话式AI。

ZP:开源模型发展迅速,甚至ChatGPT-4在情感理解方面都展现出了一些能力。你认为这些技术的发展将如何影响我们的商业视角?

Artem Rodichev:开源运动蓬勃发展,特别是随着Llama系列模型的发布。这意味着我们可以利用这些大型模型来生成视频和照片,然后用我们自己的数据进行微调。从头开始训练这些基础模型成本极其高昂,通常需要数亿美元,因为需要大量的数据和计算能力。然而,通过利用开源模型,我们可以用我们自己的数据对其进行微调,这促进了新的神经网络模型的发布。我们可以轻松地在这些模型之间切换,并用我们的数据进行微调。

开源技术的演变是极其了不起的,我们不仅可以通过微调模型受益,还可以通过将其与其他技术结合,创造出多模态体验。随着我们不断改进这些部分,我们与角色的互动将变得更加沉浸、更高质量、更富有同理心、更有趣,能够发送更高质量的照片、生成视频,并参与更多内容。

最近展示的GPT-4o演示,展示了多模态互动,包括对人类声音和情感的回应,这是一个很好的例子。尽管他们还没有发布,但这是朝向情感感知迈出的重要一步。许多人现在看到了这种情感化通信的潜力,并进一步探索这些解决方案。

然而,正如我之前提到的,开源模型可以针对特定用例进行微调,因为它们使用的是能够生成代码、编写电子邮件等的通用大型语言模型。即使它们可以提供情感上的回应,我们也可以使用开源的情感语音,并微调我们的神经网络,将其整合到现有的神经网络中,专注于提供核心、高质量的对话。

与ChatGPT不同的是,虽然它在演示中表现出色,但这并不一定能转化为现实生活中的出色用例。由于我们的用户主要是Z世代,他们习惯于异步通信,更喜欢基于文本的交互。在语音通话方面,他们需要一种不同的异步交互方式。我们曾经尝试过Replika,最初我们只有聊天机器人和用户之间的聊天功能。

我们了解到,虽然语音通话很方便,但异步语音响应,例如语音消息,对我们的用户来说更实用。从那以后,我们一直专注于这种类型的交流。与ChatGPT不同的是,虽然它提供了很好的演示,但真正的挑战在于构建实际用例。我们非常感谢ChatGPT的演示,因为它提升了市场对该技术的认知。

ZP:其他B2B初创企业,例如Inflection AI,他们非常注重技术基准和论文发布,那么Ex-Humande的差异化优势在哪里呢?

Artem Rodichev:我不太认可以研究为导向的公司建设方式。当你撰写大量论文,训练大量合成数据或仅仅从互联网收集大量数据时,因为你需要从用户那里获得很多反馈,你需要向用户发布实际产品,你需要进行大量对话和收集反馈。你需要涵盖许多不同的使用案例,以了解在现实生活中哪些方法有效,哪些方法无效,从而了解技术的优缺点,比如限制和能力。

而且,这在实验室里很难做到。例如当你调整、训练神经网络,它就会作用在聊天机器人上。如果你涵盖了你从未想象过的不同使用案例,因为用户会提出来。例如,我们有提供预测的魔法球,我们有戴着马帽的船。这就像骑士一样。你永远想不出这种聊天机器人。还有像聊天机器人-狗,你永远想不出所有这些使用案例。你需要在现实世界中部署它们。

如果你没有出色的B2C产品,如果你想向用户提供API,你将永远得不到这种用户反馈。所以,就像Sam Alman和Open AI所谈论的,我们不能承担作为一个实验室的成本,我们不能承担封闭建设的成本,我们需要向世界开放,我们需要提供我们的APIs的访问权限,以理解现实世界的问题,并不断微调问题以持续改进我们的技术。

我相信,最伟大的产品是与消费者一起,通过真实的使用案例构建的。但这可能成本昂贵。所以你需要了解如何从研究中进行生产,如何在这个研究基础上构建产品。因为这是早期阶段,这是一个技术密集型、重工业,就像我们建造的灯一样。

ZP:我们对长期愿景和目标的看法是什么?在这个愿景下,我们将开发或设计什么样的未来产品?

Artem Rodichev:关于愿景,我预计到2030年,我们与数字人类的交互会比与真人更频繁。受到像《银翼杀手》这类电影的启发,电影中角色拥有与真实人类一样逼真,甚至更有吸引力的全息伴侣,我认为我们将朝着更丰富的交互方式发展。

在此基础上,我设想我们将通过增强现实眼镜与数字人类在3D空间内进行互动。这一进步需要深入理解人类行为、情感和动作,以创造出沉浸式的数字生物。我们需要投入资源去理解人类行为,才能有效地模仿它,涵盖数字人类的各个方面,包括认知、外观和发声。

我相信我们正走向一个美好的未来,我们的目标是成为各类应用中创建数字人类的领先平台。可以想象,孩子们从像皮卡丘这样的互动角色中学习,或者青少年在房间里与他们最喜欢的K-pop团体的全息图一起跳舞和玩耍。

数字人类有潜力改变我们的体验,让世界变得更富有同情心、更愉快、更引人入胜。我们的目标是在构建这个平台的过程中发挥关键作用。

ZP:有没有你特别敬佩的人或书籍帮助你或激励你继续努力工作,追求梦想?

Artem Rodichev:我非常敬佩Albert Einstein。有一本关于他的传记让我特别受启发。‘Einstein: His Life and Universe’ 这本传记是许多人喜欢的。但最让我印象深刻的是关于Albert Einstein的传记,它详细描述了他的性格、思维方式和生活。我敬佩他如何在一生中都保持着孩子般的好奇心;好奇心是他主要的驱动力。他总是认为自己是一个对周围世界充满好奇的孩子,只想了解一切。

我相信这种好奇心是打造创新产品时最重要的品质之一。每一天,你都需要问自己同一个问题:我如何才能创造出伟大的事物?你需要具备创新精神、好奇心和毅力,不畏艰难,坚持不懈。正是这种好奇心才能引领你走向正确的道路。

了解更多AI资讯,可以加入我们的交流群一起沟通讨论~

网站——AI群码(明娟).png




文章来源: Z Potentials

上一篇:全智能AI一键生成PPT

下一篇:OpenAI、Adobe、微软要求在人工智能内容上添加水印