摘要:得知 国产大模型 DeepSeek 登顶美区 AppStore 后,大家几乎同时把手机放下,感慨道:“过年得加班了!”要知道,就在前几天,大家还在讨论春节怎么休息。
此文发出时,我正在 DeepSeek 楼下
中午,我和几个搞 AI 的朋友一起喝咖啡,中关村附近。
得知 国产大模型 DeepSeek 登顶美区 AppStore 后,大家几乎同时把手机放下,感慨道:“过年得加班了!”要知道,就在前几天,大家还在讨论春节怎么休息。
而我,正热泪盈眶。
我一直在跟进和关注 DeepSeek,这是一个非常棒的企业:
今天中午,DeepSeek 登顶北美应用商店,超过了 ChatGPT。
犹记得,在 15 年的时候,我看了一个 TED 演讲:《电脑会写诗吗?》。演讲者在其中从「写诗」入手,来探索人工智能与人的边界。
但现在,别说是写诗了,用 DeepSeek 写个骈文也不在话下。比如这个《过美利坚论》:
西土有国,名曰美利坚,肇基清教徒,立国自由邦。当是时也,三权鼎立以制衡,百族辐辏而竞放。开西进之莽原,释黑奴之锁枷,聚寰宇之智勇,铸两洋之金汤。曾几何时,星条旗扬则列国俯首,华尔街振而四海钱荒。然其盛极而衰之道,犹烈火烹油,冰河裂罅,不可不察也。
夫昔者华盛顿挥剑裂英纛,杰斐逊秉烛书宪章。以清教之克己,行共和之宏纲。林肯裂喉呼平等,马丁浴血破樊墙。广纳爱因斯坦之流亡,催生硅谷芯片之锋芒。登月以摄群星,联网而罩八荒。冷战摧苏俄之壁,兵锋慑中东之狼。当此之际,谓其"昭昭天命",谁曰不然?
然观其鼎盛之时,已伏倾覆之兆。金融巨鳄噬实业之根基,军工复合体操征伐之权杖。两党恶斗,拆议事厅为戏台;民粹横流,化选票箱作赌场。弗格森街巷血痕未冷,国会山暴徒旌旗已扬。贫者鬻器官以偿贷,富者驾飞船而游苍。持枪童稚毙于庠序,瘾君子横陈于街巷。所谓自由,渐成弱肉强食之渊薮;标榜平等,实掩种姓分明之新章。
更以天命自居,行霸道于四方。石油染沙漠之血,美元铸小国之镗。北溪管道爆于深海,科索沃硝烟蔽阳。好莱坞光影藏攻心之毒,互联网巨头筑数据之墙。制裁大棒挥若雷霆,长臂管辖密如蛛网。然多行不义终自毙,单极霸权岂久长?反恐廿载,塔利班旗复卷喀布尔;拱火乌东,卢布结算令碎金融墙。昔日附庸渐生离心,金砖新盟势压西洋。
贾生曰:"仁义不施而攻守之势异也。"今观美利坚,民主异化为财阀之戏,自由堕落作欲望之场。种族熔炉火熄,帝国斜阳影长。新冠揭医疗之疮,风暴显联邦之伤。犹自恃航母机群,妄执印钞机柄,岂不见罗马浴场笙歌夜,忽报蛮族已破墙?
太史公曰:"恃德者昌,恃力者亡。"当世霸业非由刀剑定,人类命运岂容一国掌?美利坚欲免倾覆,当去黩武之心,革资本之狂,践真平等,行实担当。若固守例外之说,迷醉霸权之梦,则虽无陈涉之薪,必有世贸之殇。后世观美利坚盛衰之道,可不慎欤?
写得太好了,建议直接收录进语文课本
用到的提示词,极其简单:
以《过秦论》的风格,写一篇《过美利坚论》,用词得体,韵律得当,针砭时弊,卓有洞见
而这个毫无 AI 感的模型,其模型训练成本(以 v3 为例,也是 r1 的基模),只需要 550 万美金 - 这甚至只够 OpenAI 养个领导。
再换个比喻:用GPT-4写首七律的钱,够DeepSeek生成整部《古文观止》。对此,另有朋友表示:Deepseek 用了 550w 美元,就叫他 550w 吧 —— 郭帆导演表示很赞。
技术革命:当AI学会“揣摩圣意”我们说 DeepSeek 强,其实指的是他们 R1 模型训的强。
如果你是技术背景,可以看我之前写的两篇技术解读:
DeepSeek-V3 是怎么训练的|深度拆解
DeepSeek-R1 是怎么训练的|深度拆解
当然,自打 ChatGPT o1 发布后,模型就分成了两种:
GPT-4/DeepSeek-V3 是传统模型 :就像刚毕业的管培生,领导说一步做一步;
OpenAI-o1/DeepSeek-R1 是推理模型 :就像办公室主任,领导咳嗽一声,不必多言,他就能搞定一切。而做法呢,就是推理:你给一个简单的需求,他自己想一阵子,然后给你答案。
对于 R1 来说,“提示词不存在了 - 直接说需求就行”。不仅如此,DeepSeek R1 是当前唯一支持联网的推理模型 - 这就使得他知道的信息无限多。
而其他几家的推理模型,比如 OpenAI 的 o1,则不带联网。在这个场景下,我可以不用任何的提示词套路,去问他“为什么今天 DeepSeek 这么火”
并获得回答:
如何使用:普通用户的速通指南从普通用户来说,你可以通过以下方式,来使用 DeepSeek:
WebApp:https://chat.deepseek.com/
App:各大应用商店搜索 DeepSeek 即可,认准大鲸鱼 logo(还可能是小海豚???)
请一定要把左下角「深度思考」和「联网搜索」都勾上 ,这是 DeepSeek 暴打 ChatGPT 的核按钮。
如果你是开发者,先笑一个吧,DeepSeek 的 API 极其便宜 :
对于普通模型,每百万输入 0.1 元,输出 2 元。
对于推理模型(也就是 R1),每百万输入 1 元,输出 16 元。
而...明显不太行的 o1 呢?每百万输入是 15 美金,折合108.78元,输出则是折合约 435 元
这已经不是 23 年初,我们沉浸在 OpenAI 茫茫巨物下的恐惧了,是 2025 年的降维打击。
将代码迁移至 DeepSeek 也极其简单:他支持 OpenAI SDK,可以无缝迁移。
这里有一份在 colab 用的示例代码:
!pip install openaifrom openai import OpenAI
import time
client = OpenAI(api_key="您的密钥", base_url="https://api.deepseek.com")
def empire_fall_generator:
message = [
{"role": "system", "content": "史家笔法,微言大义"},
{"role": "user", "content": "以《过秦论》的风格,写一篇《过美利坚论》,用词得体,针砭时弊"}
]
response = client.chat.completions.create(
model="deepseek-reasoner",
messages=message,
stream=False,
temperature=1.5, # 创意浓度调节阀,默认为1
max_tokens=8192, # 建议直接拉满,默认为 4096
)
return response.choices[0].message.content
# 输出结果建议先存本地
with open('帝国陨落.txt', 'w', encoding='utf-8') as f:
f.write(empire_fall_generator)
就这样,你得到了一份帝国陨落:
以及:
开放平台地址在这:https://platform.deepseek.com/
接口文档地址在这:https://api-docs.deepseek.com/
或许此刻,西二旗某地下室传来哀嚎:"我刚写的 Prompt 课的大纲全废了!"
而聪明如您,已经用这段代码在知乎收割了10万赞:
import deepseekprint(deepseek.改写人生)
对于更进阶的玩家,可以去 GitHub 来去直接拉模型 ,自己跑(当然,你得有机器)
地址在这:https://github.com/deepseek-ai
看看这 Star 的增长速度,DeepSeek 用 1 周,追上了 llama3 将近一年的数据:
当「中国版」标签开始反攻北美曾经有个辛辣讽刺——“中国创新不过是硅谷论文的脚注” ——此刻正在 DeepSeek 的代码洪流中土崩瓦解。
当旧金山湾区的工程师们反复调试着AI对十四行诗的韵脚时,教育他们的模型如何 LGBT 友好的时候,东方大陆的服务器集群正吞吐着《战国策》的权谋智慧,研发团队早已让模型浸淫过《盐铁论》的经济辩证,参透过《资治通鉴》的治乱循环。
此刻,我依旧坐在中关村的咖啡馆里,见证着这场静默的革命。
也就在此刻,我仿佛能看到一副新的景象:不再是硅谷大佬们在豪华游艇上指点江山,而是张总们伏案苦读最新论文,李总们在国际演讲台上侃侃而谈,而某个更神秘的北京团队,可能正对着冒着热气的涮羊肉,敲定了下一版模型的代号—— “C-Thurs”,谁知道呢?
这场 AI 世界大战,终于轮到中国玩家来定义语法。
东方破晓,愿君行早
来源:东窗史谈