a16z 播客实录:AI产品爆了,AI产品爆了,但我们什么时候才能有AI朋友圈?

B站影视 日本电影 2025-06-10 17:03 1

摘要:在 a16z 的本期播客中,a16z合伙人 Erik Torenberg 携消费者团队的合伙人 Anish Acharya、Olivia Moore、Justine Moore、Bryan Kim 展开深度对话。他们从爆款应用为何停滞讲起,深入解析 AI 原生

在 a16z 的本期播客中,a16z合伙人 Erik Torenberg 携消费者团队的合伙人 Anish Acharya、Olivia Moore、Justine Moore、Bryan Kim 展开深度对话。他们从爆款应用为何停滞讲起,深入解析 AI 原生工具、社交图谱缺席、产品商业模式演化等核心议题,AI 如何改变游戏规则,以及如何定义下一个产品时代。

以下为本期播客内容实录:

Erik Torenberg:各位,感谢来到《消费者市场现状》播客节目。似乎每隔几年就会有一些突破性的产品出现,比如 Facebook、Twitter、Instagram、snap、WhatsApp、Tinder、TikTok。每隔几年就会有新的范式、新的突破。感觉就在几年前,这种情况突然停止了,是真的停止了吗?为什么会停止?还是说这只是一种错觉?你会如何看待这个问题?我们接下来该往何处去?

Justine Moore:我认为在过去几年里,ChatGPT 是消费者市场的一个巨大成果和赢家。我们还看到在 AI 的其他领域,如图像、视频和音频领域,涌现出了许多公司,比如 Midjourney、11Labs 等。不过奇怪的是,很多这类产品并不具备你所说的那种社交或传统消费者动态,我认为这是因为 AI 仍处于相对早期阶段,很多新产品和创新都是由擅长训练模型的研究团队推动的,但他们在围绕模型打造面向消费者的产品层面上并不擅长。我乐观地认为,现在模型已经足够成熟,而且很多模型要么是开源的,要么可以通过应用程序编程接口获取,人们可以在此基础上开发出更传统的优质消费产品。

Bryan Kim:你提出这个问题很有意思,我一直在思考过去15到20年的情况,就像你说的,有 Google、Facebook、Uber 等众多知名公司。有意思的是,当你把互联网、移动互联网和云计算等因素综合起来看,就会发现涌现出了很多了不起的公司。

关于这种发展是否放缓了,我认为云计算和移动互联网等领域已经相当成熟,这些平台已经存在了10到15年,各个角落都在一定程度上被探索过了。过去人们需要适应的变化可能是苹果推出新功能,而现在人们需要适应的是底层模型不断更新,这是一个不同之处。

另外,正如你提到的,如果回顾过去的赢家,像 Google 这样的信息领域公司。现在我认为 ChatGPT 在实用性方面也做到了这一点,我们还错过了像 Box 和 Dropbox 这类更受消费者欢迎的公司,我们也看到很多公司在吸引和追求这些应用场景、表达和创造力方面的机会,这种情况正在发生。我认为目前可能缺失的是连接性,比如社交图谱,这方面还没有基于 AI 进行重建,这可能是一个空白领域,可以拭目以待下会有怎样的发展。

Erik Torenberg:这很有趣,要知道,脸书到现在差不多有20年历史了。你提到的这些公司,除了 OpenAI 之外,它们能存活10年、20年吗?我们所讨论的这些公司的护城河在哪里?而且我提到的所有公司的应用场景,会被这些新玩家颠覆吗?还是说10年后,它们仍将是所服务应用场景的主流?

Anish Acharya:有人可能会说,ChatGPT 的商业模式质量比上一轮产品周期中的同类消费公司要高得多,对吧?它的顶级服务每月收费200美元,而 Google 面向消费者的顶级服务每月收费250美元。当然,关于护城河、网络效应等方面是有疑问的,但这可能是因为如果没有这些因素,商业模式的质量就会很差。现在你可以直接向用户收取高额费用。也许我们之前想得太复杂了。

Erik Torenberg:过去的商业模式质量较差,但可能有更强的用户留存率或产品市场持久性。

Anish Acharya:没错,以前你必须编一个故事,说明在不能立即盈利的情况下,企业价值如何实现复合增长,而现在这些模型和公司能够立即盈利。

Justine你提到的另一点也很重要,所有基础模型在不同方面都各有特点,比如 Claude、ChatGPT 这种通用模型和 Gemini 模型,它们难道不能相互替代吗?这难道不会带来价格压力吗?但不同的人会用它们做不同的事,而且它们似乎都在提价,而不是降价。当你仔细观察时,会发现已经存在一些有趣的护城河动态。

Bryan Kim:“价格上涨而非下降”这一点很有意思,因为货币化在 AI 时代与之前的时代明显不同,尤其是对于消费类公司来说,它们能立即盈利。我一直有个想法,Olivia,如果你觉得不对可以指正。

在 AI 出现之前,我们讨论消费类订阅模式的用户留存率时,不确定是否真的区分过独立用户留存率和收入留存率,那时两者差不多。你不能经常更改价格,也不能随意提价,基本上是一回事。而现在我们明确区分了独立用户留存率和收入留存率,用户会进行升级,他们有积分和点数,会产生超额消费。你会发现收入留存率明显提高,而独立用户留存率却没有,这种情况我之前从未见过。

Olivia Moore:没错,我觉得以前普通的消费类订阅服务一年收费可能也就50美元左右,那就算是很高的了,顶级的消费类产品才会收这么多。而现在人们很乐意每月支付200美元,甚至在某些情况下还觉得自己付少了,愿意付更多。

Erik Torenberg: 这是为什么呢?他们从中获得了什么价值,愿意支付这么多钱?

Olivia Moore:这些产品能为他们工作。过去的消费类订阅服务可能围绕个人理财、健身、健康或娱乐等方面,但这些服务表面上是为了让你自我娱乐,你需要投入大量时间才能从中获得价值。而现在,像 DeepResearch 这样的产品,能帮你节省自己撰写市场报告所需的10个小时。所以我觉得,对很多人来说,即使只用一两次,每月支付200美元也是值得的。

Justine Moore:比如 Google Veo 3,人们每月愿意支付250美元,我也很乐意付这个钱,因为它就像一个神奇的百宝箱,你打开就能得到你想要的视频,虽然只有8秒,但太不可思议了。视频里的角色能说话,还能制作出很棒的内容分享给朋友。比如制作一个有朋友名字的个性化表情包,或者创作完整的故事,人们会把这些内容发布到推特、Reddit等各种平台上,这是我们前所未见的消费类产品能为人们做到的事情。

Anish Acharya:看起来消费者可自由支配支出的各个领域都将被软件占据。我认为未来消费者支出主要就是食品、房租和软件,这就是发展趋势。

Erik Torenberg:能举些例子说明吗?

Anish Acharya: 像Olivia 提到的很多例子,我觉得所有娱乐活动正被软件所涵盖的创意表达工作所取代,很多原本可能会花费可支配收入的社交中介活动也被软件取代了。所以我们生活的方方面面都将由模型介入,我们也会为此付费。

Erik Torenberg:Bryan,你觉得在这个新范式下我们还缺少连接性,人们仍然依赖照片墙、推特等过去的社交网络,怎样才能有新的突破?

Bryan Kim:社交是我最感兴趣的领域之一,很多社交活动其实就是状态更新,Facebook、Twitter、snap 都是如此。就是展示“我在做什么”。通过状态更新,你能与他人建立联系,而且状态更新的形式也在不断变化。从最初简单的文字说明到展示所在位置和所做事情的照片,再到现在的视频和短视频,现在人们通过视频动态等方式与他人建立联系。我认为这是人际连接的一个阶段。现在的问题是, AI 如何助力这一点? AI 如何让你感觉与他人建立了联系,了解朋友的生活动态?事实上,如果从照片、视频、音频等形式来看,很多方面都已经被探索过了。尤其是在移动互联网领域,这些形式的不同版本和变体都被广泛探索过了。

我觉得接下来可能会发生的事情很有意思。不知道大家有没有这种感觉,我使用 Google 已经超过10年了,但因为我跟 ChatGPT 交流得更多,提供了更多背景信息,所以它可能比 Google 更了解我。如果我的这种内在本质能够与他人分享,那会是一种怎样的连接体验?我不知道这是否会是下一种人际连接方式,但我能想象到,在未来这种方式会引起很多人的共鸣,现在的年轻一代已经厌倦了只看表面的东西。

Justine Moore:我们看到了一些相关的例子,比如现在有很多热门趋势,人们会让基于 ChatGPT 的程序根据对自己的了解,列出自己的5个优点和缺点,或者生成一张它认为能代表自己本质的图片,或者创作一个关于自己生活的漫画。人们会在各个地方分享这些内容。

前几天我发了一条消息,几分钟内就有几十个人回复,分享他们自己的内容,其中还有我不认识的人。不过有趣的是,到目前为止,由 AI 创意工具引发的社交行为仍然发生在现有的社交平台上,而不是在新的 AI 社交平台上,比如 Facebook 现在就有很多 AI 生成的内容。Facebook 充满了 AI 内容,而 Reddit 和 Instagram Reels 则是年轻人分享 AI 内容的地方。

Olivia Moore:同意。我一直很好奇,第一个 AI 社交网络会是什么样子。我们已经看到了一些模板,比如 AI 生成的个人照片动态,但一个社交网络要想成功,必须有真实的情感投入。如果你可以按照自己的喜好生成内容,而且自己总是看起来很棒、很开心,背景也很酷,那就没有那种情感投入的感觉。所以我觉得我们还没看到真正从零开始打造的 AI 社交网络。

Bryan Kim:很多模仿 Instagram 或 Twitter 动态的 AI 社交产品都是机器人模式,感觉很生硬,就像是把过去的形式用 AI 重新做了一遍,但这可能不是正确的形式。一个真正面向消费者的产品可能需要在移动端运行,要让 AI 产品在移动端很好地运行,目前前沿模型在设备端的应用还需要进一步改进,所以我很期待未来会有怎样的发展。

Erik Torenberg:在某些方面,人员推荐显然是一个很有潜力的应用场景,比如我和谁一起创业比较合适?和谁交朋友比较好?和谁约会合适?这些平台掌握了我们的大量信息,不是吗?

Anish Acharya:一个有趣的观察方向是 AI 原生的领英模式。很多人发现,领英只是指向你所掌握的知识,而不是真正包含这些知识。有了这项技术,我们可以创建一个真正包含你知识的个人资料,这样我就可以通过合成技术与你交流,获取你的所有智慧,也许这就是未来社交网络的样子。Justine ,你说的是这个意思吗?如果模型已经了解你的一切,那么是否可以用一种有趣的方式部署合成队列来与他人互动?

Justine Moore:这确实很有意思。我和 BK 在 11Labs 上就看到了很多这种情况,这家公司还处于相对早期阶段。我们在它首次推出后大概一个月左右进行了A轮投资。最初是早期采用者开始使用,他们用它制作表情包、有趣的视频和音频,克隆自己的声音,修改游戏。

但在很多情况下,它还没有真正进入主流消费者市场。比如,并不是美国的每个人或者大多数人都在手机上安装了 11Labs 应用或者订阅了该服务。但这家公司已经与很多企业签订了大型合同,有大量来自对话式 AI 、娱乐等不同领域的大客户在使用它。

很多 AI 产品都有类似的情况,即最初会在消费者中形成病毒式传播,然后这种传播会为企业销售带来潜在客户,这是上一代产品所没有的情况。现在企业采购者有很大的动力去采用 AI ,制定 AI 战略并使用 AI 工具,他们会关注 Twitter 、 Reddit 和各种 AI 时事通讯,然后会想,“这看起来像是一个普通的消费者娱乐产品,但我可以在我的业务中找到一个很酷的应用场景”,并因此成为公司 AI 战略的功臣。

Bryan Kim:我也听说过类似的令人兴奋的 AI 应用场景。公司可以从消费者的病毒式传播中获取支付数据,比如通过 Stripe 支付数据。查看所有的 Stripe 销售数据,然后将其输入 AI 工具,找出哪些业务领域有更多人使用产品。当发现某个公司有超过一定数量的人在使用产品时,就可以联系该公司说:“看起来你们公司有40多人在使用我们的产品。”

Erik Torenberg:Justine ,开始你列举了一系列产品和公司。我很好奇,你认为这些公司是像 MySpace 或 Friendster 那样会逐渐衰落,还是说我们正处于类似的发展阶段,或者说你列举的这些公司在20年后仍然会有影响力?我们现在处于什么阶段?

Justine Moore:我觉得我们一直希望所有我们熟知、喜爱且使用其产品的大型消费级 AI 公司都能长久存续。但不幸的是情况并非总是如此,与过去几轮消费产品热潮相比, AI 领域有趣的差异在于,模型层和相关能力仍在不断提升。我觉得在很多情况下,我们甚至还未触及这些模型能力的皮毛,就像我们看到 Google Veo 3 发布时的情况,突然之间,你可以让多个角色对话,可以有原生音频,能实现所有这些功能和模式,也许我们可以和研究文本的人探讨一下。

大语言模型相对更成熟,但随着规模扩大,仍有提升能力的空间。我们看到,只要一家公司处于我们所说的技术或质量前沿,也就是拥有最先进的模型,或者在集成这样的模型,那它就不会像 MySpace 或 Friendster 那样没落。只要稍微落后一点,发布个新更新,就能突然重回榜首,继续前进。

不过有趣的是,我们甚至看到了细分领域的出现。以图像为例,并非只有一种最佳的图像模型。有适合设计师的最佳图像模型,有适合摄影师的最佳图像模型,还有适合那些每月只能支付10美元的用户的图像模型,以及适合能支付50美元、100美元用户的图像模型。所以我觉得,由于在每个细分领域人们投入巨大,只要持续推出新成果,就可能会有多个长期赢家。

Bryan Kim:完全同意。即使在视频领域也是如此,具体来说是广告视频。就在昨天,我看到一篇文章,说有的视频适合产品拍摄,有的则适合有人物出镜的场景等等。我认为每个细分领域都是一个很大的市场。

Erik Torenberg:我们一直在讨论竞争壁垒和护城河,以及它们在这个时代的变化,还有我们对这个话题的看法发生了怎样的改变。

Bryan Kim:尤其是最近,我对此有了新的深刻认识。我一直认为护城河很重要,行业标杆、网络效应、融入工作流程、成为记录系统,这些都是非常重要的护城河形式。

但有趣的是,我发现那些我用“先看护城河”理论评估过的公司或投资项目,往往并非最终的赢家。而我们关注的这个领域里的赢家,总是那些打破常规、行动迅速、能出色推出新模型、产品迭代速度极快的公司。我逐渐意识到,在 AI 的早期阶段,速度就是护城河。无论是在产品推广方面,如今这极其重要且很难突破喧嚣吸引关注,还是产品更新速度方面都是如此。这才是制胜关键,因为这能带来用户关注度,坦率地说,就是能吸引用户,带来流量,最终转化为实际收入,让你有能力继续前行。

Erik Torenberg:很有意思,Ben Thompson 大概在十年前写过一篇博客文章,叫《Snapchat's Gingerbread Strategy》,他当时基本是在说,Snap能做的事,Facebook能做得更好。但Snap会不断推出新的创新成果。如果它能一直这样做,也许这就是它的护城河,他把这称为“姜饼策略”。

Bryan Kim:我觉得最终推广和网络效应还是会发挥作用,Snap自身也有这些优势,它在Z世代和年轻用户群体中占据了核心通讯市场。

Erik Torenberg:对于这些新产品,我们该如何看待网络效应?

Bryan Kim:我觉得现在还没到那个阶段。目前主要还是在产品创作阶段,创作和消费之间还没有形成紧密的闭环网络效应,也没有社交网络效应。所以我觉得在网络效应真正发挥作用之前,我们还处于早期阶段。但我们看到类似 11Labs 这样的公司形成了另一种形式的护城河,就像我之前说的,因为它发展迅速、产品出色,得以进入企业市场,融入工作流程。我觉得我们开始看到这种形式的护城河了,但真正的网络效应,我们还在拭目以待。

Olivia Moore:我觉得 11Labs 是个有趣的例子。前几天我在制作一个 AI 生成的视频,需要一段配音。因为 11Labs 起步早,有最好的模型,所以用它产品的人更多,这又让它能进一步优化模型。现在它有大量用户上传的语音和角色库。所以我在对比众多语音服务提供商时,如果我需要一种非常特定的、类似老巫师那种神秘的声音,11Labs 能提供25种符合我需求的选择,而其他平台可能只有两三种。所以我觉得虽然还处于早期,但已经开始出现一些迹象了。不过这些更像是我们在传统市场中看到的网络效应,并非全新的东西。

Erik Torenberg:我们在讨论新范式和新形式时,深入聊一下语音领域吧。我们很早就对语音产生了兴趣,你是最早对语音有相关理论见解的人之一。给我们讲讲,是什么让你对语音领域如此兴奋,哪些方面如你预期发展了,哪些还没有,你觉得未来会如何发展?

Anish Acharya:我最初关注语音是因为,从人类诞生之初,语音就是人际交流的媒介,但此前它并非技术应用的主要领域。之前有过很多尝试,比如语音XML和语音应用,但都没成功。当时技术还不成熟。即便如此,像90年代的 Dragon Naturally Speaking 等产品,一直有人对语音技术感兴趣,但它作为一种技术载体一直不太可行。而现在有了生成式模型,我们可以把语音作为基础元素来使用。这是一片未被充分探索的领域,语音对我们的日常生活又至关重要。所以我觉得这里会看到很多原生 AI 应用。

Olivia Moore:我觉得我们最初从消费端角度对语音产生兴趣,是因为想象有一个随时在线的教练、治疗师或伙伴在口袋里,你可以随时和它交流,现在已经有不少产品在这方面取得了成功。

至少让我惊讶的是,随着模型性能提升,很多企业迅速采用语音技术来替代电话客服,或辅助人工客服工作,甚至在金融服务这类敏感和关键领域也是如此。此前它们使用海外呼叫中心,存在很多合规问题,员工年流失率达300%,管理难度很大。

在很多方面,我们还在期待第一个真正出色的、全新的消费级语音体验会是什么样。已经有一些早期的例子,比如人们把ChatGPT的语音模式玩出了新花样。我们也看到像 Granola(AI会议笔记) 这样的产品突然火了起来,因为它让人们第一次能从自己说的话中挖掘出有价值的东西。但消费者市场完全不可预测,最好的产品往往会突然出现。如果已经有了,那肯定早就被做出来了。所以我很期待未来一年消费级语音领域会有什么新成果。

Anish Acharya:确实。我觉得语音是企业应用 AI 的关键切入点。现在很多人没意识到的是,大家普遍认为在低风险的对话场景,比如客户支持中会使用 AI 语音。但我们讨论的是,企业日常、每周、每年中最重要的对话,都会由 AI 来介入。因为在谈判、销售话术、劝说和交友等方面, AI 能做得更好。

Erik Torenberg:人们在哪些场景下会持续、有效地和自己的 AI 分身交流?为什么会想要和 AI 版的自己交流?

Justine Moore:我们已经看到了一些类似的情况。像 Delphi 这样的公司可以创建人物的 AI 克隆体,这些克隆体有大量知识储备,你可以向它们咨询建议、获取反馈等。Bryan 之前也提到过这个有趣的问题,如果不仅让思想领袖或专家拥有可以通过文字、语音,甚至未来可能通过视频交流的 AI 克隆体,而是让每个人都能拥有?我觉得在消费领域,我们经常思考的一个问题是,有很多人有某种技能、见解或知识,比如你高中时那个超级有趣的朋友,你一直觉得他应该有个喜剧烹饪节目,但他一直没能实现。又比如你的升学指导老师,他能给出很棒的建议。我们怎样才能让这些人以一种前所未有的方式扩大自己的影响力,通过拥有 AI 克隆体或 AI 化身。

到目前为止,我们看到的大多是思想领袖、专家,或者另一个极端,也就是大家熟知的角色。我们在 Character.ai 早期版本中就看到了这种情况,它增加了语音模式,尤其是在尝试一项新技术时,能和自己喜欢的动漫角色交流让人感觉很熟悉。但我觉得未来中间地带会被填补,不只是虚构角色,也不只是人类思想领袖,而是介于两者之间的真实人群。

Olivia Moore:人们的学习方式各不相同, AI 语音产品在大师课程领域表现出色。MasterClass 有个很有趣的测试版,它把平台上已录制课程的老师转化为语音智能体。你可以问一些非常个性化的问题。据我了解,它会综合课程中老师说的所有内容进行回答,给出相当定制化且准确的结果。这对我来说很有意思,因为我很喜欢这家公司,但我从来没有耐心和时间坐下来看12个小时的大师课程。但我和大师课程语音智能体进行过一些非常有趣的对话,每次聊两到三分钟或五分钟。所以我觉得这是一个真实人物转化为有用的 AI 克隆体的例子。

Anish Acharya:还有一个问题是,你是想和一个你觉得有趣的人的合成版本交流,还是想和一个现实世界中不存在,但完全符合你兴趣的合成人物交流呢?这也许是个更有趣的问题。这样的人会是什么样的呢?也许现实中存在这样的人,但你没遇到。现在通过这项技术,他们能被“创造”出来。

Erik Torenberg:这确实值得思考。那么,在哪些场景下我们希望和真人,或者我们认为是真人的对象交流,哪些场景下我们更愿意接受 AI 呢?

Anish Acharya:就像 Olivia 提到的大师课程的例子,这里已经存在一种准社交关系。所以,和某个特定的人交流,与和一个你可能遇到的最有趣的抽象人物交流是有价值差异的,和后者交流,你不需要有预先设定的关系。

Bryan Kim:这让我想起 ChatGPT 有个很火的推文,有人在纽约地铁上录到一个人完全像和女朋友聊天一样和ChatGPT对话?

Justine Moore:还有另一个例子,前几天有个家长发推文说,孩子问了45分钟关于《托马斯和他的朋友们》的问题,他们实在应付不了了,就把手机给孩子,打开语音模式,然后去忙别的了。两小时后回来,孩子还在和ChatGPT聊《托马斯和他的朋友们》。在这种情况下,孩子根本不在乎电话那头的角色是谁,他们只知道对方愿意深入探讨他们感兴趣的话题。

Erik Torenberg:理解,如果现在我们为了心理咨询或辅导去使用ChatGPT或类似的工具,我能想到未来我可能更愿意和我的 AI 克隆版的心理咨询师或教练交流。也许未来我们可以记录咨询过程,让他们有足够的数据,或者心理咨询师有大量线上内容,我们可以直接复制他们。

回到你的问题,五到十年后,顶级艺术家会是像 Lil Miquela 那样的 AI 生成的新人,还是像 Taylor Swift 和她背后庞大的 AI 团队合作,或者是两者的结合呢?同样,在Twitter上,我们关注的社交人物,下一个 Kim Kardashian 会是真人,还是 AI 生成的呢?你有什么看法?

Justine Moore: 这个问题我思考了好几年了。我们都密切关注过 Lil Miquela,后来也关注过一些最早引入 AI 全息角色的韩国流行乐队。这和逼真的图像和视频技术密切相关,我们现在看到很多人创造出的网红能吸引大量关注和粉丝,很大程度上是因为他们看起来非常逼真,让人分不清是 AI 还是真人,关于这一点有很多讨论。

我认为未来创作者或名人可能会分化为两种类型。一种像 Taylor Swift ,人类体验在某种程度上很重要。很多人不仅喜欢她的歌曲,还能在她的人生经历、故事和现场表演中找到共鸣,这些是 AI 目前还无法复制的。另一种类型的名人或创作者更基于兴趣,就像我们前面说的,孩子和ChatGPT聊《托马斯和他的朋友们》,并不在乎对方是否有真实的人类体验,只在乎对方能否就某个话题有趣地交流或分享内容。所以我猜测,两种类型都会存在。

Olivia Moore:对,这又回到了一直备受争议的 AI 艺术话题。现在任何人都能比以往更轻松地生成艺术作品,但要创作出优秀的 AI 艺术作品仍然需要大量时间。去年夏天我们举办了一场和 AI 艺术家的活动。很多艺术家向我们展示他们制作 AI 电影的流程,实际上花费的时间可能和拍摄一部电影差不多,只是他们以前可能没有相关技能,所以无法实现。我们看到,虽然 AI 网红数量激增,但真正脱颖而出成为像 Lil Miquela 那样的很少,只有寥寥几个。所以我觉得未来也会类似,会有 AI 人才池和人类人才池,每个池子中最优秀的人会脱颖而出,但转化率都会很低。

Justine Moore:这是一定的。在 Google Veo 3 中我们看到一个有趣的现象,类似街头采访的形式,但被采访的对象是精灵、巫师、幽灵,或者Z世代喜欢的那种毛茸茸的可爱角色,这些都可以是 AI 生成的,很有意思。

Anish Acharya: 音乐领域也是如此,我觉得 AI 生成的音乐大多很一般。从定义上来说,这些模型是基于已有数据生成的,而文化应该是有创新和突破的。所以问题不在于 AI 本身,而在于生成的作品质量不高。

Erik Torenberg:如果质量达到相同水平,你觉得人们不一定会100%想听人类创作的音乐吗?

Anish Acharya:有可能,这也引发了一场更具哲学性的讨论,如果用嘻哈音乐出现之前的所有音乐数据训练一个模型,它能推断出嘻哈音乐的出现吗?我觉得不能,因为音乐是过去音乐和文化的融合,文化对音乐至关重要。所以需要有创新和突破,超越训练数据,才能创作出新颖有趣的音乐。目前的模型还做不到这一点。

Erik Torenberg:很有意思,我几个非常有才华的好朋友正在开发一款同性 AI 陪伴应用,要是2015年的我听到这个消息,肯定会很惊讶。他们说在热门应用排行榜前50里有11款是陪伴类应用。我们来思考一下,我们是不是正处于这个趋势的开端?未来会不会出现各种垂直细分的陪伴类应用?这个领域的未来会怎样?我们该如何看待它?

Justine Moore:我们在陪伴类应用的各个方面都做了大量研究,从心理咨询、辅导到交友,甚至包括一些不太健康的所谓 AI 女友应用,基本都研究遍了。有意思的是,我觉得这可能是大语言模型最早的主流应用场景。我们常开玩笑说,不管是汽车经销商的客服聊天,还是其他什么聊天,人们都想把它变成心理咨询或女友聊天。和这些公司交流,看看他们的聊天记录,会发现很多人只是想找个人或东西聊聊天。现在能让电脑即时回应、随时在线且感觉像真人一样交流,这对很多以前得不到这种体验,或者感觉自己在对牛弹琴的人来说,是一个巨大的突破。

我认为我们才刚起步,尤其是因为如今的产品,或者说现有的产品,大多都非常宽泛,且完全来自基础模型提供商。就像人们用 ChatGPT 去做很多它原本并非为此设计的事情。我们已经看到很多案例,比如在一家公司里,人们可以为一个角色赋予某种个性,将其具现到一个数字化身中,对其进行引导,然后围绕它创建一个能吸引大量用户参与的游戏或世界,像Tolen 这样的公司就在为青少年和大学生做这样的事。

而另一家完全不同的公司,我也把它的产品看作一种陪伴型产品。它能让你每次吃东西时都拍张照片,提取并分析所有数据,然后为你提供有关营养摄入情况的各种信息,还能让你和它交流,获得情感支持。因为对很多人来说,饮食问题往往与情感问题相关,或者说他们通常会为此去寻求心理治疗。所以我觉得这很真实,真正让我们兴奋的是,陪伴的定义已经从朋友或女友之类的概念,迅速演变成任何你以前能从人类那里获得的建议、智慧、娱乐或指导,而且未来我们会看到更多细分领域的陪伴型产品。

Bryan Kim:我想到一件事,我曾在一家社交公司工作,很明显,随着时间推移,人们能与之交谈的朋友平均数量在减少,想想最年轻的一代,人均朋友数量也就略多于一个。我觉得陪伴作为一种应用场景的需求肯定会一直存在,这将是一个持久的应用场景。所以我对陪伴型应用场景感到非常兴奋,它会衍生出不同的形式,但与他人建立密切联系并与之交谈的需求会一直存在,也许连接是一个缺失的领域,是一片空白,但也许陪伴型产品正在填补这个空白,你只需要感觉到与某物有连接,不一定非得是人。

Erik Torenberg:人们听到关于陪伴型产品的讨论时,会说“天哪,人们的朋友会越来越少,人们都不会再谈恋爱了。”而且人们会觉得,抑郁率会上升,自杀率会上升,生育率会继续下降。

Justine Moore:我不这么认为。这让我想起我在 Character AI 子版块上最喜欢的一篇帖子,我在这个版块上花了大量时间。前提背景是很多高中生和大学生,他们的成长阶段是在新冠疫情期间,他们没有真正和其他孩子或青少年进行面对面交流,也没学会如何与人交谈。我觉得这真的对他们产生了很大影响。

其中一个孩子,我想他现在上大学了,他在 Character AI 子版块上发了一段时间关于他的 AI 女友的帖子。然后有一天,他发帖说他找到了一个现实中的女友,所以他一段时间内不会再上这个子版块了。他还特别提到,是这个 AI 教会了他如何与他人交谈,尤其是如何与女孩交谈,比如如何聊天、如何向别人提问、如何了解他们的兴趣。我觉得在某种程度上,这就是 AI 的最大价值,即促进更好的人际连接。网友看完都特别高兴。不过我觉得有几个还没找到现实女友的人有点嫉妒,但我对他们有信心。

Olivia Moore:我看到过相关研究,比如关于 Replica 这款产品的研究,实际研究表明,用户的抑郁、焦虑和自杀念头都在减少。我确实认为现在很多人感觉不被理解,没有安全感,他们很难在现实世界中正常生活。如果 AI 能帮助他们,而且他们可能没有钱或时间去接受心理治疗,如果 AI 能做到这一点,他们就能以一种全新的状态重新融入现实世界。

Erik Torenberg:真正让我意识到这些陪伴型应用有多重要的,是我们第一次采访 Replica 创始人的时候。Replica 这款应用非常棒,在创始人关闭了一些功能和相关子版块后,我们视频下的评论基本都是很多人说“这就像我的妻子,就像我们在柏拉图一样。”我当时就在想“天哪,我没想到这款应用在人们生活中扮演了这么重要的角色。”

Justine Moore:这其实是挖掘了人们长久以来就有的一种行为。就像人们一直有在网络聊天室、Discord 上建立的关系,现在的年轻人有 Discord 上的男女朋友。在我们那个时代,有一个漂流瓶网站,你可以在上面来回发送漂流瓶,和那些你可能永远不会见面、不知道对方是谁、也不知道对方是不是在假扮的人建立非常深厚的关系,我觉得 AI 只是让这种体验更深入、更有吸引力。

Anish Acharya:还有一个很重要的点,就是 AI 不能太一味顺从,因为在现实生活中,人际关系是需要相互妥协的。一个高度顺从的 AI 并不能让你为现实人际关系做好准备。所以我觉得要在适度地提出不同意见、帮助你更好地与人交往,和过于顺从、让你在人际交往中更差之间找到一个微妙的平衡。

Erik Torenberg:接下来我们来展望一下未来可能出现的、具有变革性的新平台或新设备形态。OpenAI 刚刚收购了Johnny II 的公司。Bryan,我听你提过几次智能眼镜,以及你为什么还对这种设备形态感到兴奋,也许我们可以从这里开始讨论。我想听听大家觉得有哪些产品可能会对手机的使用产生补充甚至颠覆性的影响。

Bryan Kim:目前全球有70亿部手机,很少有其他设备能达到这个规模。我的想法是,陪伴型产品大概会存在于手机上。从这个角度来看,未来有很多不同的发展方向,比如设置隐私保护墙,或者使用本地大语言模型,帮助你真正把所有你想保护的信息都控制在设备层面。

Olivia ,你提到手机已经具备了始终在线的功能,但还有其他设备也具备这个特性。那么当出现全新的设备时,会是什么样子?可以说就像你的附属品一样,那些能一直与你相连,并且能实现这种功能的设备会是什么样?

Erik Torenberg:大家有什么想法吗?未来我们会佩戴、携带或使用哪些与手机相连或独立于手机的硬件设备?

Olivia Moore:我认为 AI 在面向消费者的应用方面已经取得了巨大的成功,目前大多是通过文本框输入,然后在网页浏览器中输出结果。我很喜欢 AI 能时刻陪伴在你身边,看到你所看到的东西这种想法。现在我去科技派对的时候,很有趣的是,很多20岁以下的年轻人会戴着能记录他们言行的胸针,他们觉得这些胸针很有价值,这就是一个例子。

我们也看到了一批新的产品,它们能看到你屏幕上正在发生的事情,然后为你采取行动、提供指导等等,我觉得这些也很令人兴奋。而且我认为随着自主型模型变得更好,它们将不仅仅是提供建议,还能真正为你完成工作,比如帮你发邮件,这让我非常期待。

Justine Moore:我觉得人类洞察这一层面也很重要,我们常常没有办法将自己与他人进行比较,也不清楚自己在世界上的位置。如果一个 AI 能听到你所有的对话,看到你在网上的所有行为,然后说“你每周再多花五个小时做这件事,你就能成为这个领域的世界专家。根据我服务的大量其他人的数据,你应该和这三个人建立联系。这个人可能会是很棒的联合创始人,你应该和这个人约会。”诸如此类的建议。对我来说,这就是最理想的科幻场景。

Olivia Moore:这源于 AI 能时刻陪伴在你身边,而不只是像ChatGPT那样通过文本框交流。

Anish Acharya:手机之后普及率最高的设备就是 AirPods 了,所以它似乎是一个显而易见的选择。不过围绕它还有一系列社交礼仪方面的问题。因为在晚餐时戴着 AirPods 很奇怪,没人会这么做。但也许有一种方法可以将 AI 融入 AirPods,同时又符合现有的社交礼仪,会很有意思。

Erik Torenberg:你之前提到年轻人在派对上会记录对话。那么在未来,所有事情都会被记录下来吗?你觉得这一代人在某种程度上已经习惯了这种常态吗?

Olivia Moore:是的,我认为围绕这种行为会形成新的社交规范,因为我觉得这是真实存在且有价值的,这可能会让很多人感到害怕,但我认为这是一种趋势,已经开始且不会停止。

Justine Moore:我觉得背景因素也很重要。你提到的很多情况是在科技社交派对上,在这种场合,工作和私人生活的界限很模糊。

Bryan Kim:是的,我们之前讨论过。在旧金山可以这么做,但在纽约就不行。

Olivia Moore:但这就是为什么会形成一套新的文化规范。就像手机刚出现的时候,在某些场合大声打电话是不礼貌的,围绕这些记录设备也会出现类似的规范。

Erik Torenberg:那我们就以“我们还处于早期阶段”这个观点来结束今天的讨论吧。这是一场很棒的讨论,非常感谢大家参与!

来源:硅星人

相关推荐