用嘴开发小程序日志——安心声音

B站影视 韩国电影 2025-03-10 15:59 1

摘要:在AI技术的浪潮中,编程和产品开发的门槛正在被逐步打破。本文作者通过AI编程技术,从零开始开发了一个名为“安心声音”的小程序的全部经历,供大家参考。

在AI技术的浪潮中,编程和产品开发的门槛正在被逐步打破。本文作者通过AI编程技术,从零开始开发了一个名为“安心声音”的小程序的全部经历,供大家参考。

年前学会了AI编程的入门技巧,做了个《定制新年问候表情包》的小网站。当时很兴奋,但是最终却没能发挥什么作用。

于是我陷入沉思,我觉得我“有了AI编程这个锤子,目前缺一个好的钉子”,还是得找到生活中的“真需求”……

直到最近,我发现小红书上有条帖子。是一个独立开发者在问大伙需要什么APP的。有个回复是这么说的,希望有这样的APP:

独居女性APP,里面都是男性的声音,放大音量,让门外听到家里有男的,有狗。音频内容有,谁啊?再敲门?

和我老婆讨论了下,这个需求的存在是因为“独居女性”是一个有一定风险的属性,也时常会发生一些危险的案件。所以会通过一些措施来伪装成“非独居女性”。最简单的就是各大外卖、快递平台的性别改成男的。

以上为DeepSeek找到的案例。

这背后也说明了“独居女性”存在一定的“风险防控”需求,在某些情况下,她们需要尽可能地减少风险事件的发生,保证那些需要“报警”应对的情况不会发生。

那么为什么是用“发出声音的”程序来满足这种需求呢?

大部分“独居女性安全指南”都指出,可以通过“注意与规避危险情况”、“伪造非独居女性的迹象”、“购买安全措施(监控类、报警类、防身类)”等方式来尽量避免风险。

“注意与规避危险情况”这种属于个人行为,目前无法使用程序来解决。(除非发展出带有用户环节和行为识别的穿戴设备,以及基于识别情况进行决策的AI能力。)

“购买安全措施(监控类、报警类、防身类)”这类方式已有很多成熟的产品,上网就能买到对应的内容,比如防狼喷雾、报警器……

以上两个方向用产品功能满足的可行性不高,只能聚焦于“伪造非独居女性的迹象”这一点。

在这个方向上,目前只能看到“伪造外卖、快递平台信息”、“门口摆放男性鞋子”、“晾晒男性衣物”等手段。这种方式有可能在长期的接触与对接中露馅,比如一个快递员经常派件,在接触过程中都发现对接人只有“女性”,加上这种“独居女性安全指南”的手段现在大部分人都知道。那么“独居女性”的标签是有可能被拆穿的。

那么便可以利用声音在使得这个“伪装”更可信,通过声音来模拟存在一个“伴侣”,从而保持“非独居”的人设。

由于这个需求的核心功能十分简单,AI coding能完全hold住,结合目前AI语音技术非常成熟,因此这个方向相有可能的。于是我便想用AI编程来实现以下我所设想的这个小需求。

以下是成品展示~

整体上分为两个页面,预设了6个场景:

接听语音:这个场景下会模拟一个男生在与你进行微信,并告诉周围的人,他待会回来接你。适用于夜路回家的情况。应门声音:这个场景下会模拟一个男生应门,然后让你去接待。用于告知门外的人,里面是有男生的。同时也交代了“为什么接下来是女的在说话”。接收外卖:这个场景下会模拟一个男生应门,并告知外卖放在门口即可。聚会社交:这个场景下会模拟多人聚会的声音,告知里面很多人。咳嗽声音:这个场景下会模拟男生咳嗽。脚步声音:这个场景下会模拟沉重脚步声。

下面就分享下,我在弄这个小程序时候的思路。

产品功能梳理

由于对这个功能还仅仅是本人的设想,未能得到价值的验证。所以第一个版本为MVP版本,需要尽量只有核心功能。像是什么“自定义音色”、“自定义语音内容”、“自由录制语音”、“一键报警”这些功能都先砍掉。

先提供几个常见场景,把核心的【场景列表】和【音频播放】功能做出来。

我这里借用了DeepSeek,让他帮我梳理功能。虽然他输出了不少冗余的功能,但是基本上删删改改就能继续用了。

可行性研究

接着我要进行这个功能的可行性研究,这里除了AI编程之外,需要研究的就是语音内容了。

在这里的需求是“真实”、“沉稳”的声音。因此需要排除机械感很重的配音(比如剪映上的配音能力),然后需要排除掉过于优美的声线(比如MiniMax上的各种预设音色)。

最后我看到了MiniMax上的声音克隆。于是我试着找了个朋友的音色录制了下,发现还挺自然。

落地建设

当可行性都研究好后,就是开干的过程了。主要分为原型设计和功能实现两步,这里都是用AI来替我完成的。

用“嘴”设计原型

在前面的功能梳理环节,我已经让DeepSeek帮我生成好了功能的文字描述。我只需要打开Mastergo,把需求输入进去,它就帮我生成了高保真的原型界面。

由于有两个页面,所以需要分开两次输入。以下为我所选择的成品。

其实AI的成品还是有不少问题的,我们可以选择在Mastergo上二次修改,或者在AIcoding环节,让AI帮我们去掉无关的功能。

用“嘴”写代码

当原型满意后,我就直接把DeepSeek给我的需求和原型图,丢给windsurf帮我写代码。然后通过微信开发者工具调试。

其中有BUG的部分,就直接截图圈起来,让AI帮我修改。

hhh,有种PUA赛博程序员的感觉了。

最终经过N轮的“用嘴开发”,这个仅有两个页面的功能便完成了。但其实这里也调试了我几个小时,还是会存在指令不到位的情况,当然也有我描述不够详细的原因。整体来说,Claude 3.7相比起3.5来说,还是强大了不少的。

来源:人人都是产品经理

相关推荐