摘要:大家好,我是喜欢研究AGI的一枚产品经理,平时主要从事新能源汽车智能座舱、AI大模型应用等相关工作。另外,我超爱自驾游~
大家好,我是喜欢研究AGI的一枚产品经理,平时主要从事新能源汽车智能座舱、AI大模型应用等相关工作。另外,我超爱自驾游~
有感而发:“学习AI的最好方式,就是利用AI学AI”。
01 | Claude被低估了!
从过年到现在,3个月的时间里,AI的发展,可谓是一日千里。短时间内,诞生了成百上千的AI产品,但总的归纳来看,大概有这么几大类:
以DeepSeek为代表的,通用型模型即产品;以即梦为代表的,多模态AI应用型产品;以Manus为代表的,整合创新类Agent产品;以Cursor为代表的,专用领域AI提效产品。其中,像DeepSeek这种,相当于随着它的产品和品牌知名度的提升,背后的模型也广为人知。而即梦、Manus这种,背后用的哪家的模型,或者集成了几个模型,用户并不清楚(当然用户也不care这个问题)。
因此,当一款AI产品慢慢获得了用户的良好口碑,并且它所提供的服务真的能够解决用户痛点,就间接的证明它背后的技术能力是足够硬派的。也可以说,它背后所用到的大模型底座,实力在线!
那这时候,这类产品背后所用到的模型、agent,以及它基于此所做的技术和业务层面的二次创新,都是值得我们去深入研究的。
去年早些时候用过Cursor的人,一定还记得,那时候它的能力跟官网的宣传是不匹配的,就是它的实际编码能力,以及IDE的使用上,或多或少还是有些问题的。但是自从Claude3.5发布后,整体体验真的就是上了一层大大的台阶。而自从Claude3.7正式发布后,可以说,Cursor现在真的是一个不折不扣的高级别编码专家了。
如此一来,我们不仅仅需要知道Claude在编码层面的实力,也更应该全方位地去了解Claude3.7的真实力。
简单概述下Claude3.7的亮点及差异化能力:
1. 通用能力
• 语言理解与生成:能够处理和理解自然语言文本,生成流畅、连贯且符合语义的回答。
• 知识问答:具备广泛的知识储备,可回答涵盖多个领域的问题。
• 文本创作:能创作故事、诗歌、新闻报道、邮件等多种类型的文本内容。
2. 差异化功能
• 混合推理模式:结合了即时响应与深度推理能力。在标准模式下,能快速回答简单问题;在扩展思考模式下,可进行自我反思,逐步剖析问题,最终给出精准且深思熟虑的回答。
• 用户可控的思考预算:通过 API,用户可以自由控制模型的思考 token 数量,从而在回答速度与质量之间进行灵活权衡。
• 强大的编程能力:在代码生成、前端开发、复杂代码库管理以及全栈开发等领域表现出色,能一次性生成大量代码,并支持跨文件分析和理解整个项目结构。
• Claude Code 智能编码工具:集成终端的智能编码助手,可通过自然语言指令完成代码搜索、文件编辑、测试运行、Git 提交等复杂流程,节省开发时间。
• 超大上下文窗口:支持 128,000 tokens 的上下文记忆,能够处理整个代码库而无需拆分代码。
• 安全性与透明性提升:误拒无害请求的概率降低了 45%,增强了对提示注入攻击的防御能力;通过“草稿纸”功能,将模型的推理步骤直观呈现给用户,增加了模型的可解释性。
3. 独有能力
1. 在代码理解、代码维护、全栈开发和相关的推理和记忆能力上,全面领先于其他竞品模型。
2. 具备类多模态大模型的能力。比如:用户可输入图文信息,Claude可输出网页信息,在网页中为用户展示图表、数据等动态可交互的富文本信息。
综上,因为Cursor,让大众知道了Claude。但是对于Claude的认知和使用上,我们不能仅停留在编码层面。尤其是它的多模态输入和输出能力,可以在工作、生活和学习等多方面,给予我们非常大的帮助和赋能。
举例。
如果你是一个学生,正在写AI相关的论文,你需要在论文中插入多个跟AI架构、AI大模型设计相关的结构图,这时候你要么上网搜,要么自己画一个简单的。但是你知道吗,你利用Claude的,可以分分钟给你画出一个结构清晰、脉络清晰,而且还注有公式和功能说明的结构图。
同样的,如果你是一个程序员或产品经理,正在研究AI相关知识,那么最好的学习方式之一,就是利用AI学习AI!比如让Claude给你输出各种大模型结构和流程图,你就可以更清晰的明白其运行原理。
好了,下面就用一个实操案例,跟大家分享下如何利用Claude输出大模型结构图。
02 | 如何利用Claude,助力工作、学习和自媒体
首先,最简单的体验方式就是直接去官网claude.ai体验,只不过这需要科学的上网方式,相信很多人搞不定。
其次,第二种大家都能体验到的方式,就是利用Cursor间接使用Claude画图。
第一步,下载Cursor并安装,然后注册登录。左侧是编码区,右侧是对话区。注意,右侧对话框中的模型,要手动选择Claude3.7sonnet。
第二步,输入你的需求,比如下面这段文字,输入后它就会基于需求绘制网页。
- 绘制 MoE混合专家模型 结构图(SVG)
- 元素不重叠,避免内容过于拥挤,整体布局要美观
- 如有必要,请添加相关简要公式来解释关键计算
- 使用简洁精确的专业术语
- 数学公式使用公式字体;英文使用 times new roman 字体,中文使用微软雅黑
第三步,等它画完后,会在右侧告诉你它主要的输出内容有什么,同时给你创建了一个可视化的本地网页,你在浏览器中打开网页查看即可,如下如所示,就是它的输出结果↓
如果你觉得这个图形结构不完美,你可以继续告诉它怎么调整,同样的需求你还可以得到下面这样的图↓
怎么样,大家看明白了吗?如果你有自己想要学习的架构或结构,就引用我上面的prompt提示词,自行修改即可。不管是学习使用、工作使用,甚至和我一样,写一篇自媒体文章,都妥妥够用。
下面再给大家展示下Transformer和DeepSeek的模型结构图,都是同理使用Cursor+Claude3.7输出的↓
好了,以上是给大家提供一个思路,对于正有此需求的朋友算是一个抛砖引玉的tips,大家多试多练,也欢迎多多探讨和交流~
来源:ID2008912004