Plaud 推出过两款 AI 硬件产品,分别是粘在手机背面的 AI 录音卡片 Plaud Note 和可穿戴 AI 录音硬件 NotePin。两款产品累计销量突破了100万台。软件层面, Plaud Intelligence 内置了多款主流大模型,能将会议、通话和语音笔记的录音,转化为结构化摘要、思维导图和待办事项。摘要:Plaud 推出过两款 AI 硬件产品,分别是粘在手机背面的 AI 录音卡片 Plaud Note 和可穿戴 AI 录音硬件 NotePin。两款产品累计销量突破了100万台。软件层面, Plaud Intelligence 内置了多款主流大模型,能将会议、通
Plaud 是如何做大模型产品的?Plaud 中国区 CEO、AI 产研负责人莫子皓,在这篇文章中详细介绍了 Plaud 「软硬结合」的产品理念。有趣的一点是,「让人去对齐大模型,让大模型去引导人。」
我们的理念是通过软硬结合的方式去追求人与大模型结合的智能边界。我们坚信将会有新的 LLM native 的工作(不是办公)范式。
获取 - 提取 - 使用 (capture - extract - utilize)是 Plaud 选择的道路。
01 何为软硬结合?
硬件不是为软件服务,软件也不是为硬件服务,软硬结合为大模型服务。 大模型需要什么?
大模型需要足够多的 context
Plaud 一方面是可穿戴设备(贴在手机背面我们也理解为可穿戴设备的一种),另外一方面是获取用户 off-line context 的传感器。
但是 plaud 和手机的关系不是互相排斥的关系,因此手机摄像头拍照功能,手机屏幕的输入功能,也都能成为我们 context 的一部分。
这也是为什么这一次 Plaud 的更新包含了图片/文字输入等不同模态的输入。
大模型需要知道人的意图
选择开关机,选择点击标注重点,这些都是对大模型有意义有价值的对齐的信息。
我对 24 小时 always-on 的录制音频或者视频或者无规律的间歇性录制音频视频的方式都不太认可。这是因为让用户表达并让大模型知道意图的成本远比事后大模型自己分析挖掘猜想找到用户意图的成本要低很多,而且带来的准确性也比事后的模糊度带来更大的使用上的优势。
而一场对话中间,大家低头记笔记大部分的目的是为了记住这一刻的观点或者灵感,事后再进行整理和细化。
这也是为什么这一次 Plaud 的更新一个很重要的功能点是 press to highlight,在开启 Pluad 录音的过程中,只需要点击一下按钮,Plaud 就会自动记录 hightlight,并且自动帮你总结这段时间的内容压缩成短句,同时在结束后的 summary 里面会单独把 hightlight 拎出来去做更深入的展开。
大模型需要足够多的表达场景
大模型就像一个全知全能的神,只能让「神」在你的一次点击之后在你规定的地方和你说话,这是对神的能力的极大限制。
无法展开太多,只能说这里有很多有意思的事情可以做。
总的来说,硬件是使用大模型智能的钥匙,软件是使用大模型智能的介质,而大模型的智能才是皇冠上的那颗明珠
我们的大模型产品理念:通过软硬结合去追求人与大模型结合的智能边界。
02 把一切反过来想
我的头像是我写的几句话一直都很喜欢:
Plaud is not getting things done is getting context in
Plaud does not help you to work better we help you to think better
Plaud does not generate polished files we generate sparkling ideas
我们学习巨人的经验但我们不去模仿,没有人能通过模仿别人走向卓越。
大家做许多产品用户问一个问题能生成非常长的报告,大模型帮助用户去寻找更多的公开的信息,让用户可以做各种 research,从少变多。
我们选择帮用户记录更多未公开和未结构化的私有信息,大模型帮助用户把这些信息变成足够短足够精炼和足够有用的「智能」,从多变少。
大家做许多产品让人去问大模型,并且让大模型去给答案。
我们选择让大模型主动问人并且主动给出答案。
大家做许多产品让大模型和人对齐,一步一步引导大模型产出好结果。
我们选择让人和大模型对齐,让大模型引导人一步一步问出好的问题。
总是用户在提问提要求,总是让模型去找更多的信息,我们试图反过来。
所有人都在服务使用工具创造价值的人,程序员 / 设计师 / 文档使用者。
我们选择服务用对话来创造价值的人,销售 / 顾问 / 非文档使用者。
我们的大模型产品理念:不模仿、不抄袭、不妨反过来想。
03 我们与大模型的关系
我的签名:不是整理和总结价值,而是智识价值。
我特别坚定的相信大模型已经在很多方面(接近所有)都已经远超人的能力,那么我们现在去使用模型的方式和我们跟模型的关系就应该是让人和模型对齐。
大模型在超长文本处理上所突破人类边界的点在,一方面突破了记忆力的上限,另外一方面突破的注意力带宽的上限。而模型具备人所不具备的全面的智慧和知识。总结以上的这几个点,模型自然而然可以发现和找到一些我们都想象不到的角度和价值。
人总是很难跳出框架去想象自己做不到的事情,小学生肯定无法去设想大学生之前玩的是什么游戏,但是这就是产品经理的价值和工作所在,想象,并交付超出预期的产品和价值。
我们的大模型产品理念:插上想象的翅膀,寻找和使用智能的边界。
04
到底什么是 「格式」 信息与智能传递的本质
编程语言是人在学习机器说话,让机器可以听懂人的命令。
而大模型之伟大,是机器学会了人是怎么说话的,机器可以和人交流。
但是我们总沉浸在让大模型去做 ppt 去做网页去去写文档。只是这些所有的 format 和格式是人和人交流所需要的介质,所以我们总是在让大模型去帮助人来和人交流。
我们再次反过来想,我们是不是可以让人去帮助大模型来和大模型交流?如果 LLM - A 或者 agent A 的输出是下一个 LLM -B 或者 agent-B 的输入,那么 ppt pages pdf 都不重要甚至都极度低效。那么应该以什么方式交流?人在里面是什么角色?
我们有答案,只是我们会用一款产品来把我们的答案呈现。
在我看来写 prompt 写代码 和 写文章本质上是一样的事情,而文字和语言才是人的思维想法的承载器,我们在这一块让 LLM 参与的实在是太少了。
我们的大模型产品理念 思考大模型和 agent 之间是怎么交流 如何让让去帮助大模型思考和协作。
05
capture - extract - utilize
我相信,对话就是智能。但是过去蕴含在对话里面的智能都没有能被很好的获取,更不用提使用。因此 Plaud 第一步做的 Capture 就是把我们的 context 如何能够更好更全面的记录下来。
而到了 extract,我特别不喜欢会议纪要这个词。这个词天然就有一种只是记录的感觉,记录下来就是为了存档,为了后面查漏补缺使用。但是智能一定不仅仅是这样,智能是多维的,智能是有表象和内在的,智能是生产资料。
所以我最喜欢说的是,summary 是获取信息的终点,但是是工作发生的起点。
而为什么我总用工作不用办公这个词,这就只能意会不能言传,而我们会用 enhance performance & enhance productivity 来衡量我们使用智能的结果。
Plaud 的理念是通过软硬结合的方式去追求人与大模型结合的智能边界
Plaud 坚信将会有新的 LLM native 的工作(不是办公)范式
虽然我们已经卖了 100 万台,也发布了我们 app3.0 和 最新的 plaud intelligence,但我们觉得我们也才刚刚开始。
最后作为产品经理,要非常感谢 OpenAI 和 ChatGPT,让我这种上个时代的移动互联网产品经理找到了激情和梦想,为我创造了伟大的时代。ChatGPT 也是这个时代做的最好最伟大的产品,让我看到了硅谷的荣光。也要感谢 Cursor 和 Dia,是你们这种构建一个 environment 让人与 LLM 协作,让工作在这个 environment 发生的产品设计给了我很多的灵感。
以我面试总喜欢说的话作为结尾。我这一代产品经理,是看着 CS183A 入行的,听着 YC 的讲座学做产品的,那已经是 10 年前了。当时绝对没法想象,10 年后的自己,可以有这样一个做全球产品的机会,去和老师们在同一个舞台表演,万万不能辜负这个伟大的时代,一切只是为了做出伟大的产品。
来源:晚晚的星河日记一点号