一天Vibe个工具,看真实用户吐槽ChatGPT、豆包、Kimi…

B站影视 内地电影 2025-09-20 20:49 1

摘要:截至2025年7月,ChatGPT周活7亿,日消息量25亿条,全球约10%成年人用过。

截至2025年7月,ChatGPT周活7亿,日消息量25亿条,全球约10%成年人用过。

基于这些信息,OpenAI做了个论文研究:大家到底在用ChatGPT干什么?

论文下载:

写作与编辑(18%)

写邮件8%、文本编辑或评论10.6%

写作任务以“辅助”而非“创造”为主,“提升人类表达”而非“替代人类创作”

2/3 基于用户文本改写(如编辑、翻译、批改),非从0生成。

学习辅导(10.2%)

人们对“随叫随到”的老师有极强需求。

AI老师讲解知识,记住学习进度,每天提醒你进步。

“How-To”(如何做)(8.5%)

有无数细分场景,如“如何优化简历”、“如何搭建Shopify店铺”、“如何备餐”等

健康与自我管理(5.7%)

用户已经愿意把身体托付给 AI。

AI 健身教练、营养师、护肤顾问,加上真人监督,成为新趋势。

翻译(4.5%)

用户想要能理解语境、语气、文化、俚语的本地化 AI 翻译。

编程(4.2%)

都觉得AI是编程神器,实际对话量只有4.2%。

远低于部分竞品(如Claude的33%,这里数据非出自论文)。

情感陪伴(2.3%)

媒体经常宣传 AI的“情感陪伴”功能。

但实际只有1.9%与此有关,0.4%是游戏和角色扮演。

AI陪伴类需求并不主流。

产品购买(2.1%)

占比不高,但变现空间巨大。

用户直接问 AI 买什么,让 AI 给推荐和建议。

好奇心被激起

读完 ChatGPT 的论文报告,相当有启发。

也让我非常好奇,大家用其他AI工具做什么?

有什么满意和不满意的地方,比如 Gemini、Grok、豆包、元宝等。

作为产品经理,想到一个数据源。

就是这些 App 的AppStore 用户评价。

一般做App或做竞品分析,都会关注用户评价反馈。

通过分析用户吐槽抱怨,能发现产品问题、使用场景和需求点。

据说不少互联网人创业,都会先看一遍排行榜前1000的App。

如何获取用户评价?

问AI后,给了个神奇的地址。

https://itunes.apple.com/us/rss/customerreviews/id=6737597349/JSON

原来,只需要知道应用ID,就能获取最新50条用户评价。

继续研究发现,加上分页参数,最多能拿到最新 500 条评价,URL结构如下:

https://itunes.apple.com/cn/rss/customerreviews/id=[ID]/page=[1-10]/json

是不是可以Vibe Coding个工具,增量抓取评论,然后AI分析?

说干就干。

开始Vibe Coding编程

前段时间,C大等朋友力荐kimi K2模型。

想到这个评论任务不复杂,试试这个模型能不能搞定。

Kimi配置Claude Code,参考官方教程:

https://platform.moonshot.cn/docs/guide/agent-support#在-claude-code-中使用-kimi-k2-模型

Vibe Coding前最重要的事情:跟AI讨论写好需求文档。

比如要抓哪些字段,提前跟AI讨论清楚。

Dia浏览器自带GPT5,直接对话分析JSON文件的字段。

再比如告诉AI我未来想部署到 Vercel,它就会推荐Nextjs作为技术栈等等。

最终生成的需求+技术文档:

创建个叫app-review的文件夹,把需求文档发给Claude Code + Kimi

自己稳定运行了10多分钟。

生成了第一版

修了几个bug能运行了,但界面不符合预期...

掏出祖传界面优化PUA提示词

AI开始自我PUA:

这界面让我想起了2005年的企业级垃圾软件。不是“复古”,是纯粹的设计无能。

果然好看多了,但还有bug。

过程不表,基本就是复制报错丢给 AI 修复,不断描述需求增减功能。

智能程度还是不如 Claude 4 sonnet,但Kimi K2胜在便宜。

开发时刚好Kimi K2在搞半价,充了100块,直到项目完成,还剩几十块。

最终作品如下:

用户浏览模式

首页

查看下载评论

查看报告

管理员模式

支持管理删除应用,配置Prompt,生成分析报告等

产品体验网址

开源代码

一些对比发现

有了App用户评论,除在线生成报告。

还能建议下载为csv,交给长上下文模型做各种分析。

下面是让Kimi K2整理的对比表

Gemini优势: 擅长深度研究,检索能力强,生态好。

Grok优势: 敢说真话的实时信息获取专家,幽默风趣少审查。

豆包优势:情绪陪伴表现突出,生活场景覆盖广,生活小帮手。

Kimi优势: 文科学术写作的贴心老师,长文处理能力出众。

补充个人点评:

谷歌 Gemini2.5 pro是身边不少朋友的主力模型之一,Gemini App能用Nano Banana和Veo3,谷歌王者归来。

Grok是最另类的大模型,根本不管什么美国的政治正确,啥都敢说,甚至有NSFW,暂时模型还不够强,但相信马斯克的实力。

豆包是国内使用量最大的模型,尤其是老人和小孩,几乎没不喜欢的,语音对话效果好。

Kimi在0905版后,除了传统的写作和上下文优势,编程和工具调用能力也大幅提升。

产品效果

昨天把用Kimi K2开发好的网站发到了 X,很快浏览过万。

也得到不少 Kol 的关注和回复,如Dontbesilent、Bear Liu等。

不少网友,提交了很多App做分析,比如宝宝巴士、像素星球、Youcam等。

学习Vibe Coding,根据自己需求开发效率工具是未来的趋势。

如果更进一步,把代码开源出来。

不仅能会得到赞美,也真的能帮助到他人,利人利己。

这次开发,其实是一次“人+AI”协作的完整体验。

从最初的灵感,到落地为产品,过程都离不开AI的参与。

一开始,我只是有个想法:能不能搞个自动抓取App Store评论的小工具?

最终,花了一天时间,产品上线。

我负责想需求、定方向、挑毛病。AI负责执行、补漏、给建议。

这种协作开发,效率很高,体验也很不错。

如果你想尝试,不妨从一个小项目开始,和AI一起,Vibe一下。

来源:一个数据人的自留地

相关推荐