实测Kimi「OK Computer」:快、强,还有点浪漫

B站影视 韩国电影 2025-09-30 17:42 1

摘要:文章实测 Kimi「OK Computer」全栈助理,其能自主规划并完成网站开发、财报分析等多类任务,交付质量高且速度快。同时解读该功能命名的人文渊源,展现其在工具调用与审美设计上的优势。

文章实测 Kimi「OK Computer」全栈助理,其能自主规划并完成网站开发、财报分析等多类任务,交付质量高且速度快。同时解读该功能命名的人文渊源,展现其在工具调用与审美设计上的优势。

大家好,我是冷逸,今天给大家实测Kimi最新推出的全栈助理「OK Computer」。

事情是这样子的。几天前,我收到了一封Kimi的感谢信,说感谢我去年以打赏的方式陪伴Kimi成长。要把我的打赏金额换为等额的会员权益,可以第一时间体验最新的模型能力。

说真的,没想到Kimi还能记得我们第一波的打赏用户,这真的太走心了吧!所以我毫不犹豫就冲了他们家的最高档Moderato会员(可以使用20次「OK computer」),还赠送了5个月的会员。

氪金后,很快就收到他们家「OK Computer」的内测邀请(所有打赏过的用户,也都会优先收到体验邀请)。

据介绍,「OK Computer」是Kimi的全新Agent模式,通过更多轮次推理、更多工具调用、更多token消耗,带来更多智能。它能自主规划并完成从需求调研到产品方案、交互设计、前端开发的整个过程,最终交付高品质的全栈研发任务。

简单说就是,干活多多,智能多多。

那这,必须实测一波。

01 一手体验「OK Computer」

前几天,在云栖大会上看到一个很有意思的产品,叫“AI交易所”(一个撮合AI需求方和开发者的平台)。我试试,看能不能用「OK Computer」把网站原型做出来。

1)开发「AI交易所」网站

打开Kimi官网kimi.com,勾选“OK Computer”,就可以使用了(也可以看到自己的使用额度)。

输入任务:#项目模板搭建一个面向AI需求方(买家) 和AI开发者(卖家) 的在线交易平台,提供安全高效的撮合机制,支持 AI 相关服务、产品和Agent的发布、购买、洽谈与展示。#功能需求1. 用户系统注册与登录:支持手机号注册。用户角色:需求方(Buyer)、开发者(Seller),可兼任。个人中心:Buyer:需求管理、交易记录、收藏的服务Seller:服务/模型发布、报价管理、交易记录2. AI服务/产品的发布与展示开发者发布功能:填写服务介绍、功能范围、价格(固定价/议价)、交付周期。展示页面:服务详情页:功能、价格、案例、评分排行榜/推荐页:根据热度、评分、成交量展示搜索与筛选:按价格、标签、AI领域(如语音、图像、文本、视频)、交付周期3. 需求发布与撮合Buyer 可以发布明确需求(如“需要一个图像识别Agent,预算 2000 元”)。系统为其推荐合适的 Seller,或者 Seller 主动投标。4. 交易系统撮合逻辑:支持议价、固定价直接下单。支付流程:资金托管(Escrow),交付确认后释放资金。订单管理:状态流转(待确认 → 开发中 → 待交付 → 已完成 / 已取消)。5. 信用与评价完成的订单支持 Buyer 对 Seller 评分与评价。平台展示开发者的信誉等级、成交历史。6. 展示与推荐首页板块:热门需求、优质开发者推荐、近期成交展示。动态墙:实时滚动展示最新成交。案例库:展示优质的成功案例。

先看成品。

体验网址:

整体功能很齐全,是我想要的网站原型。它是怎么做的呢?

任务发给它,Kimi会马上开机(虚拟电脑),给你干活。

它做的第一件事,就是化身项目经理,分析整个需求,将项目拆分成11项子任务。

接着,继续化身产品经理、UI设计师,写PRD(产品需求文档)和视觉设计方案,明确网站功能有哪些,采用什么视觉设计。

因为我们这个网站对图片的需求比较多,Kimi会自己搜索相关的图像素材,甚至还自己生成一张背景图。并创建资源文件夹,把他们都下载下来。

接下来,化身前端开发工程师,进行HTML页面开发,陆续开发了网站的主页(index.html)、服务市场页(marketplace.html)、需要发布页(demands.html)和个人中心页(profile.html)。

最后,是部署前的工作,Kimi继续化身测试工程师和运维工程师,对整个页面做最终的功能测试和优化,并部署到服务器。

可以看到,「OK Computer」第一次检查时发现终端运行失败,它又尝试了新的端口,最终部署成功。

最后交付给我们的链接,可公网访问,也可分享给他人,手机和电脑都能打开。

体验网址:

同样的Prompt,我又跑了一次,这次更加科技现代感一些。

体验网址:

2)像素风专访节目

然后,我们让Kimi再跑一个更复杂一点的。

Prompt是:# 🎯 项目目标创建一个完整的像素风网页应用,模拟欧美电视新闻/音乐专访节目,主题为 **「Coldplay 演唱会 Kiss-cam 风波与公共隐私讨论」**,包含 **3 分钟双人音频** 与 **20 张同步像素风配图**。—# 🎨 视觉风格要求* **整体风格**:8-bit 像素风 + 欧美电视台新闻/演唱会转播元素(直播角标、新闻跑马灯)* **色彩方案**:复古游戏色调(#FF6B6B、#4ECDC4、#45B7D1、#96CEB4)* **角色设计**:像素小人 2 位* 主持人(欧美新闻主播风格)* 嘉宾(媒体/文化评论员风格)* **背景元素**:* Coldplay 演唱会体育场舞台* 巨大观众区(手环荧光、手机屏幕)* Kiss-cam 像素化大屏幕取景框* 像素化社交媒体界面* 演播室评论场景—# 🎙️ 音频内容要求* **时长**:3 分钟(180 秒)* **语言**:英文(新闻播客风格)* **形式**:双人对谈* **主题**:围绕 Coldplay 演唱会 kiss-cam 风波引发的隐私、社交媒体传播、品牌反应与未来展望* **结构**:* **0–30s 开场**:主持人介绍事件背景* **30–90s**:事件传播链(现场大屏→观众录制→社交媒体)* **90–150s**:后续反应(公司调查、艺人回应、粉丝文化)* **150–180s**:未来展望(隐私提示、演唱会管理、平台责任)角色设定:* **Host (Anchor)**:冷静、专业* **Guest (Commentator)**:媒体/社会学分析,解释事件如何成为全球话题—# 🖼️ 配图生成要求* **数量**:20 张像素风插图* **尺寸**:320×240(复古游戏机分辨率)* **切换频率**:每 9 秒一张,与音频同步* **内容类型**:* **角色立绘(6 张)**:主持人/嘉宾的不同表情与姿态* **场景插图(8 张)**:1. 演播室场景(新闻主播台)2. 体育场夜景(Coldplay 舞台灯光、荧光观众)3. 巨型屏幕上 Kiss-cam 框(人群像素马赛克处理)4. 粉丝区近景(挥舞荧光棒)5. 社交媒体界面(像素化推文/评论)6. 公司会议室(剪影风格)7. Coldplay 舞台背景(灯光与纸屑)8. 新闻直播图文条(“Privacy Debate”)* **数据可视化(6 张)**:* 热度曲线、转发量柱状图、传播链路示意、隐私风险矩阵、Fact-check 流程、未来改进清单> 提示词模板:> **[pixel art], [8-bit retro game style], [Western TV news broadcast + stadium concert scene], [bright retro colors], [320×240 resolution], [no real faces recognizable]**—# 💻 网页功能需求1. 自定义像素风音频播放器2. 音频与图片时间轴同步(每 9 秒切换)3. 像素 UI 控制面板(播放、暂停、倍速、字幕开关)4. 响应式设计(桌面端 & 移动端,保持像素清晰度)—# 🛠️ 技术实现方案### 第一步:音频生成* 用英文 AI 语音生成 3 分钟双人对谈(两种声线:Anchor/Commentator)* MP3 格式,128kbps,44.1kHz* 脚本分 4 段(每 30 秒一段,便于同步)### 第二步:图像生成* 使用像素风模型生成 20 张图,统一调色与风格* 确保体育场、舞台、新闻演播室元素一致### 第三步:网页开发* 技术栈:HTML5 + CSS3 + JS* Audio API 同步图像轮播* CSS3 像素动画(渐入、闪烁字幕条)* Canvas 绘制像素化进度条—⚠️ **合规与叙事边界*** 不展示可识别私人面孔,仅用马赛克/背影表现观众* 讨论焦点放在公共事件、隐私议题与文化反应* 网页页脚加声明:*“This is a pixel-art simulation for educational and creative purposes, not depicting any individual.”*

最终成品,真能播放,页面好看也好玩。就是这Prompt,挺费脑子的。

体验链接:

3)上市公司财报分析

那我们来一个简单点的。

Prompt是:对 阿里巴巴 做一份数据驱动的财务分析,产出非常多样的图表(如时序、对比、构成、分解、敏感性等),每图配清晰解释与结论,整体可以使用稍柔和版的 Neo-Brutalism 风格呈现。使用plotly绘制图表。

产出的报告很牛,所有数据真实、可信。

股价时序图,比财经网站更靠谱、更好用。

这市场敏感性分析,在别的地方基本上是属于付费内容。

刚开始,Kimi给我交付的结果,有2张图表无法显示。我们直接口喷需求让他改,很快就修复了问题。

这是最终的链接,欢迎大家查看。

4)小游戏集合网站

帮我clone一下这个repo(https://github.com/he-is-talha/html-css-javascript-games/tree/main),然后做一个小游戏的主页将里头的所有游戏都Server起来,要每一个游戏都可以玩,并且帮我部署这个主页。网页的风格要偏现代风,比较酷炫。

这页面,很酷炫。

所有游戏真能玩。比如这个射箭游戏,我就玩得不亦乐乎。

体验地址:

5)《流浪地球2》解析PPT制作一份关于《流浪地球2》电影的视觉符号深度解析PPT,15页,只使用电影原图与影视/学术深度解析文章。

做PPT,果然还得看Kimi。这回,终于有AI产品把Html PPT和传统PPT给打通了。

之前的html式PPT,很多人反馈转为PPTX/PDF格式后,效果大打折扣,文字错乱、排版混乱,根本没法用。Kimi这应该是第一个既能用coding模型写出精美PPT又能下载PPT格式不丢效果的Agent,真的太牛了。

这PPT贼好看,内容贼精彩。

6)情绪调酒器

帮我做一个调酒模拟器,用户可以选择调酒材料,自己的心情(如:开心、失落等),以及想要的口味(如:偏甜、果味浓),就能创造一款专属饮品,体验调酒的乐趣。

这个也很好玩,可以根据情绪DIY饮品。

体验地址:

我调制了一杯「欢乐时光」,你敢喝吗?

整体体验下来,给我的感觉是:1)生成速度很快。我的6个case,基本都是5-8分钟就生成好了,比动辄上10分钟的Manus和Genspark都要快。毕竟自家基模,做Agent应该不会慢。2)交付质量很高。无论是精准Prompt还是简单Prompt,Kimi都能交付高质量的产出物。尤其是模糊表述时,它还能给你惊喜。3)审美在线。K2 Agent模型从诞生之初,就具有超高的审美表现,而现在已经迭代到了K2 Turbo,审美更是在线。4)低幻觉。这一直是Kimi的优势,它自家底模的百科知识和RAG在降幻觉方面做得很不错,内容幻觉率低。02 关于「OK Computer」

「OK Computer」有何来历?我问了下Kimi。

这个名字来自于英国摇滚乐队Radiohead在1997年发行的第三张录音室专辑。这张专辑就像一枚时间胶囊,把上世纪末的焦虑、霓虹与尚未命名的数字黎明一并封存。

这是该专辑的封面,交错的车道、模糊的车流以及很多诡异的符号乱码……像不像极了现在AI生成的图片?

这张专辑的核心主题是技术时代的人类异化,探讨在科技新时代,人类该如何保持自身的本质和情感。主唱Thom Yorke曾总结这张专辑:“拥抱未来,对未来有敬畏感,在一间大的房间里,所有的电子设备都坏了,你听到的声音就是OK Computer。”

歌词内容深刻讨论了现代社会中科技、消费主义、政治异化、人类情感疏离等主题,被视为是对21世纪信息化社会的预言性作品。

专辑名称「OK Computer」灵感,来源于1978年道格拉斯·亚当斯(Douglas Adams)的科幻广播剧《银河系漫游指南》(The Hitchhiker’s Guide to the Galaxy),其中有一句台词是:

“Okay, computer, I want full manual control now.”(好的,电脑,我现在要全部手动控制。)

Kimi对自己第一款全栈助理的命名,没有选科幻片里常见的赛博音节,也没拿神话或数学典故,而是挑了一句带着 Britpop冷感、又暗藏人文体温的玩笑式口令。

“OK Computer?”

“OK, computer,Kimi已开机。”

03 写在最后

从我自己实测来看,Kimi这个全栈助理「OK Computer」会的挺多,多的能干,干的挺好,而且速度还挺快。

它内置了20多种工具,比如列待办事项、写Python代码、操作终端、浏览网页、文字搜索、图片搜索、图片生成、音频生成、接入专业财经数据源、网站部署等,能适应广泛的任务需求。

它能像团队一样干活,按需启动一支包括产品经理、设计师、数据分析师、前端工程师在内的AI开发团队,自主调研、规划、分析、设计、开发和部署,交付高质量的产出物。

而且,审美也很在线,满足responsive和mobile-friendly。

自从K2发布后,无论是身边的开发者还是普通用户,大家基本都认可:Kimi这次是真·站起来了。

在我自己常用的AI Chatbot中,Kimi也一直是那个高频AI之一,聪明、实用,还有人情味儿。

OK, computer,Kimi已开机,开始你的创造吧。

来源:人人都是产品经理

相关推荐