Token纪元:从「马力」到「人天」再到「兆字元时」的认知革命

B站影视 港台电影 2025-06-09 16:36 2

摘要:马力神话:瓦特用“马力”将蒸汽机抽象为直观生产力符号,0.9 马力的奔驰汽车开启了机器替代牛马的时代。人天困境:知识经济用“人天”量化脑力劳动,但效率参差、996 文化暴露其本质缺陷——无法衡量真实价值。AI 冲击:当 AGI 完成“30 人天”任务仅需“1

作者 | 姚旭晨

——从「马力」到「人天」再到「兆字元时」的认知革命

在这个系列里,我们详细阐述生成式人工智能的字元(Token)是如何作为像“水电网”一样的基础设施改变每个人的未来:

当 AI 成为基础设施,谁来计量它的劳动?

答案是:一个新单位,叫 马斯(MTH,兆字元时)

马力人天,再到马斯

一部人类生产力的进化史,藏在这条计量单位的变迁里。

系列文章索引:

Token 纪元 1:从马力到人天——一场被单位改变的工业革命

核心问题:工业革命如何通过“马力”和“人天”定义生产力?AI 时代需要怎样的新单位?

马力神话:瓦特用“马力”将蒸汽机抽象为直观生产力符号,0.9 马力的奔驰汽车开启了机器替代牛马的时代。

人天困境:知识经济用“人天”量化脑力劳动,但效率参差、996 文化暴露其本质缺陷——无法衡量真实价值。

AI 冲击:当 AGI 完成“30 人天”任务仅需“1 小时”,旧单位彻底失效,呼唤新标尺。

隐喻未来:从“马力”到“马斯”,单位的进化史,本质是文明对生产力的认知革命。

Token 纪元 2:为什么需要为 AI 时代建立全新生产力计量单位

核心问题:Token 为何成为智能时代的“水电网”?它与传统资源有何本质不同?

Token 定义:字元(Token)是 AI 的“语言燃料”。

基础设施化:AI 公司买硅买电,卖 Token 智能,商业逻辑类似农夫山泉“买水卖品牌”。

历史教训:NASA 因单位混乱损失 1.9 亿美元,Token 亟需统一度量衡,避免重蹈覆辙。

Token 纪元 3:智能社会的三大关键指标——容量、速度、价格

核心问题:如何像管理水电一样精准计量 Token 资源?

容量(MT/GT/TT):Token 用量决定 AI 任务规模上限。

速度(T/s/KT/s):200T/s=AI 的“2G 网速”,1GT/s= 秒出小说——吞吐率决定用户体验。

价格(¥/MT):GPT-4 生成百万字元需 430 元,成本是电力的千倍,算力稀缺性拉高溢价。

能耗真相:生成 1TT 消耗 4.5 万度电,需 7 座三峡供电——Token 是“烧电的字元”。

Token 纪元 4:AI 的算力网络,为什么还停在 2G 时代?

核心问题:为何 AI 生成仍像“拨号上网”?算力基建如何跨越代际鸿沟?

2T 现实:人均 200T/s= 生成短文需 10 秒,视频渲染等几分钟——体验堪比 2G 时代加载网页。

基建挑战:实现 1TT/s 需 5.4 亿块 GPU+7 座三峡电站,成本 = 中国全年 GDP,技术代差悬殊。

通信启示:从 2G 到 5G,网络速度提升千倍;AI 需同等算力革命,建“智元基站”铺路。

未来愿景:5T 时代 =1GT/s 算力普惠,个人可实时生成 3A 游戏画质,社会效率指数级跃升。

Token 纪元 5:从人天到马斯——AI 劳动力的崛起

核心问题:当 AI 按“马斯”计价,人类劳动力价值如何重构?

成本碾压:开发网站 = 人类 6 天 $4800 vs AI 1 小时 $8,效率差 600 倍,白领工种首当其冲。

单位定义:1 马斯 =1 小时消耗百万 Token,AI 任务明码标价,“脑力外包”进入工业化时代。

就业冲击:律师、设计师、程序员面临替代,卢德运动或将重现,但抗拒终是徒劳。

价值重估:人类工作转向创意与监管,体力劳动时薪 $100 vs AI 马斯单价 $1,差距撕裂市场。

Token 纪元 6:字元时代的文明跃迁——人类社会的下一场大重构

核心问题:当 Token 流速超越人脑,文明将走向何方?

硅基觉醒:AI 每秒处理万亿字元,碳基生物彻底退出重复劳动,仅存创意与伦理角色。

教育革命:“学力”替代学历,人人配备“爱因斯坦 AI 导师”,知识获取成本归零。

经济悖论:GDP 统计失效,Token 创造的价值无法用传统货币衡量,新体系呼之欲出。

文明分界:Token 或成碳基与硅基文明的“罗塞塔石碑”,未来史书写此刻的度量衡革命。

让我们开始吧~

从马力到人天

一场被单位改变的工业革命

1. 马力:蒸汽时代的功率

“这台 2025 年小米 Su7 Ultra 的峰值功率是 116 千千克·米 / 秒。”

听到这样的数字,大多数人可能只觉得一串冰冷的物理单位,脑海里根本浮现不出这台车到底有多强。

但如果换一种说法:“这台小米 Su7 Ultra 的峰值功率高达 1548 匹马力。”

想象一下,1548 匹马同时拖着你飞驰而去,是不是一下子就具体生动了?

这就是单位的魔力。为了让人们更好地理解蒸汽机的功率,18 世纪的工程师瓦特发明了“马力”这个词。简单来说,1 马力大约相当于一匹马在 1 秒钟内将 75 公斤的物体提升 1 米所做的功。

卡尔·奔驰的第一部汽车只有 0.9 马力,但它拉开了用四个轮子代替四个蹄子的生产力巨变之幕。

从第一辆 0.9 马力的奔驰汽车,到今天 1548 马力的电动车,动力的跃升见证了人类用机器替代牛马的工业奇迹。

而 1548 匹马力究竟有多猛?简单算算,它意味着可以在 1 秒钟内把 116 吨的重物提升 1 米!放在现实中,这台 2.5 吨重的汽车,从静止加速到 100 公里每小时,只需要短短两秒钟。

“马力”这种单位形象而易记,广泛流传。相比之下,另一个与动力相关的词——“扭矩”就没这么幸运了。尽管它同样重要,却因“牛顿·米”、“公斤·米”、“磅·英尺”这些复杂的表达方式,始终难以深入人心。

在那个工业咆哮的年代,飞速旋转的引擎成了生产力的象征——织布机的轰鸣、钻探机的咆哮、船只劈波斩浪,飞机腾空,火箭冲天,乃至阿姆斯特朗踏上月球的第一步,都离不开“马力”这一物理底层单位。

2. 人天:数字时代的工作量

直到某天,人类发明了名为"办公室"的新式工厂,西装革履的"知识工人"开始用键盘代替扳手,用 PPT 代替车床。人类的“生产力引擎”从轰鸣的机器变成了安静的办公室。无数打工人坐在电脑前,埋头处理文档、设计方案、计算表格、撰写报告、运营推广——每一天,像牛马一样辛勤劳动。

于是,“人·天”这个新计量单位应运而生。就像 19 世纪用马力衡量蒸汽机,20 世纪用"人天"量化脑力劳动。完成一项工作,究竟需要几个人、几天?比如开发一个小网站,也许是“3 个人天”;准备一份发布会 PPT,可能是“30 个人天”或“1 个人月”。

然而,这个单位有个天生的 Bug:人的工作时间并不一致。有人 8 小时认真努力,有人 12 小时摸鱼划水,还有人白天摸鱼晚上加班。到底怎么算?全凭“良心”打分。

当工程量巨大的时候,多加人是无法带来效率的线性提升的。《人月神话》早就揭示了这个单位的 bug——就像往怀孕项目里塞 9 个孕妇不会让宝宝 1 个月就出生,某些工作根本无法通过堆程序员来加速。

当年的牛马已经被发动机解放,成了餐桌上的美味。现代的牛马打工人,也在盼望着有一天能彻底“自由”,过上“要么户外钓鱼,要么办公室摸鱼”的理想生活。

这一切的转机,或许就靠正在崛起的“通用人工智能”(AGI)。未来,许多打工任务将由智能体 (Agent) 代劳——从计划、决策到执行,统统自动化。

但问题来了:这些 AI 智能体的工作量要怎么衡量?难道要说“GPT 干了 3 个人天”?光想就让人忍俊不禁!显然,新时代需要一个全新的度量单位。

不再是“马力”,不再是“人天”,那应该是?

答案也许是——“兆字元时”。

3. 马斯:通用人工智能时代的效率计量

读到这里,你可能不由自主地回头又看了一眼:“兆字元时?这是什么新玩意?”

别急,拆开来慢慢看:“兆·字元·时”。

“兆”指的是一百万 (Mega),这个你大概在“兆字节”(Megabyte,MB)里见过:一张 CD 大约是 700 MB,一张软盘 1.44 MB。

“字元”(Token)则是大模型处理信息的基本单位,相当于 AI 理解语言的“食粮”。

而“时”当然就是时间,一小时。

所以“兆字元时”(Mega-Token-Hour,MTH)可以理解为:一个智能体每小时消耗多少百万个 Token 去完成任务。

不过,这名字的确太绕口了。就像过去“千克·米 / 秒”被“马力”取代一样,人类总喜欢用更简洁、生动的词汇来帮助记忆。

还记得电费的单位“千·瓦·时”(kWh) 吗?咱们平常叫它“度”。“这辆电车有 100 度电”,听起来既直观又好理解。

同理,未来的“兆·字元·时”或许也会简化为一个新词——比如叫“马斯”,缩写 MTH,源自 Mega Token Hour。

帮助解放牛马打工人的智能体们,可以用马斯去衡量它们的功力。

想象一下,未来的工作场景:

“这个 2 分钟的抖音短视频,AI 智能体只用了 5 马斯。”

什么意思?就是说,AI 在一小时内,消耗了 500 万个 Token,完成了选题策划、脚本撰写、AI 配音、配乐剪辑、字幕生成、视频制作、平台发布,甚至包括用户标签分析和发布时间优化。成本?也许只要 10 块钱!

再比如:

“要为这家新开的餐厅做个在线点餐小程序,需要 20 马斯。”

也就是说,一个智能体连续工作 5 小时,每小时吞掉 4 百万 Token,完成从界面设计、功能开发、支付对接、测试部署,到广告文案、配图美化,甚至连虚拟好评都一并打包完成。

以前,打工人按“人天”卖命;未来,AI 按“马斯”结算劳动成果。

老板看着表,微微一笑:“这活,花了 1 马斯?智能体干得漂亮,划算!”

本文将带你走进这个正在到来的新世界:

一个用“字元”、“字元时”、“字元每秒”来重新定义生产力的世界。

先来预告几个有趣的事实:

字元 (Token) 是一种消耗传统资源的新质资源。简单说:字元是一种消耗资源的资源。(如果用拼音说,ziyuan 是 ziyuan,消耗 ziyuan,语义很关键。)

用 Token 生成一整套英文版 Wikipedia,需要大约 300 度电。这些电量,能把一辆 100 度电的电动车充满 3 次,跑上两千公里往返京沪。

1TB 的流量可能只需几百块人民币,但购买 1T Token 的 AI 智能,在 2025 年可能要花 800 万人民币,堪比数字黄金。由此可见,Token 如今仍是一种稀缺的“新型燃料”。未来,什么时候能让普通人也拥有 1T Token 的“智能”随用随取?

要打造一个每秒万亿字元(1 TT/s,太字元每秒)的算力中心,可能需要掏出 2021 年全中国 GDP 的资金购买 GPU,还得 7 座三峡大坝全天候供电。即使是在筹划的地球最强雅鲁藏布江水电站,也需要两座才行。

AI 新基建的商业本质:买传统资源,卖智能资源:字元。买的是硅芯片和电力,卖的是 Token 智能。这模式,跟“Buy Commodity,Sell Brand”这种传统品牌有点像:农夫山泉买水卖品牌瓶装水,麦当劳买肉卖品牌汉堡,德芙买可可粉卖品牌巧克力。未来,AI 公司买硅买电,卖 Token,卖智能。

这就像电力时代初期的场景重现:当爱迪生的电表开始转动,人们第一次意识到"看不见的能源"也能精确计量。不同的是,这次我们计量的不是电子流动,而是智能的跃动。

为什么需要为 AI 时代建立

全新生产力计量单位?

现代文明建立在精确计量之上。

就像普罗米修斯带给人类火种,而瓦特带给世界蒸汽机,真正改变生活的却是那些不起眼的计量表。日常生活中,我们早已离不开这些单位:

电力,用“千瓦时”(kWh)计量,

电池容量,用“毫安时”(mAh)计量,

网络流量,用“KB / MB / GB / TB / PB”计量,

网络速度,用“KB/s / MB/s / Gbps”计量。

这些计量单位不仅帮助我们理解“资源”,更和“钱”直接挂钩:

居民月用电 500 千瓦时,电费约 250 元

电动车 100 度电,家用充电 35 元,公共充电桩可达 150 元

充电宝 一万毫安时,成本价约 20 - 50 元,共享充电宝每小时 2 - 5 元,可以给 iPhone 14 充满 2 - 3 次 (iPhone 14 电池容量为 3279 mAh)

移动流量 10GB,月费 30 元;50GB,约 80 元,

宽带 100Mbps 包月 99 元,500Mbps 包月 169 元。

资源 = 计量单位×价格,资源越贵,单位越重要。

那么,大语言模型(LLM)呢?

LLM 的基础资源单位,叫 Token(字元)。一个 Token,可能是一个字母、一个单词、一个子词(subword),取决于模型的编码方式。

1. 字元是什么?

在 AI 世界里,Token 就像电力世界里的电子,是最基础、最核心的资源单位。

Token 是语言的最小处理单元。只要一个字或者一个词能够被 Unicode 表示,它就能被字元 (Token) 表示。

不同于传统人类语言的“字”或“词”,Token 是为了让计算机能高效处理文本而划分的单位:

一个英文单词 apple 通常是一个 Token;

一个中文单词字符 黑 和 莓 可能分别是两个 Token;

对于复杂词汇,如 internationalization,可能被切分成 international + ization 两个 Token。

一个单字也有可能被拆分,比如中文字“猫”在早期的 ChatGPT-3.5 和 4 中被拆分分成了 3 个字元 (因为它的 unicode 表示是 3 个字节),在后期的 ChatGPT-4o 中因为字元表扩张又被单独用一个字元表示。

字元是一种比词或者字更小的表示单位,用它可以灵活表示各种单词的意思。比如”莓”是一个单独的字元,那么黑莓、蓝莓、草莓就可以通过组合去望其形而知其意。其他也有一些例子:

门楼,角楼,钟楼:每个字都是一个字元,共有字元是“楼”,楼前面的字表示方位

茶盅,酒盅,药盅:每个字都是一个字元,共有字元是“盅”,盅前面的字表示容器中的物体

如果有些词从来没有见过,也可以通过单字组合大概知道新词的意思,例如:链球状菌,芽孢杆菌,弧水菌,耐酸菌;尘肺症,纤化症,颤舞症,血凝症。

字元的颗粒度并非最小。比如英文单词的最小组合单位是英文字母,但字元的颗粒度要比字母大。ChatGPT 早期出过一个 bug:它数不清 strawberry 中到底有几个”r”。这是因为 strawberry 这个单词就是一个字元,在计算机中用一个数值表示。这个就好像给你一滴水,让你数数里面有多少水分子。

2. 为什么是字元?

因为无论内容多复杂,最终在大模型眼中,一切都归结为一串字元流。 正如电流通过电线,Token 流经神经网络——激活、计算、再输出。

Token 是 LLM 的“粒度”。

每生成 1 万个 Token,模型要经历数千亿次矩阵运算。

每消耗 1 万个 Token,背后可能是几瓦时的电力消耗。

每百万 Token 输入和输出,直接影响推理成本和用户体验。

正因为 Token 是 AI 运作的“基本颗粒”,所以:

API 计费按 Token 数计(如每 1K Token 价格 0.003 美元);

大模型参数优化时,也以 Token 吞吐量(Token/s)为核心指标;

未来智能生产力的规模、能耗、效率,也都围绕 Token 展开。

3. 为什么今天大家对 Token 还很陌生?

因为 缺少统一、标准化的计量体系

不同模型、不同平台,对 Token 的定义和计价方式都有微妙差异,导致:

用户在不同模型间切换时,不知道实际花了多少资源;

企业难以精准预算 AI 系统的运行成本;

市场难以透明、规范地交易 Token 资源。

这种混乱的状态,就像工业革命初期各地市斤、英镑混杂,商旅往来极其不便。

历史上,人类因为计量混乱,吃过很多大亏。

比如:

温度单位:华氏度 vs 摄氏度;

距离单位:公里 vs 英里;

重量单位:斤 vs 磅;

日期格式:年月日(中国)、月日年(美国)、日月年(英式)。

甚至,1999 年 NASA 的“火星气候轨道器”因为将“磅力”误当成“牛顿”进行操作,导致飞船高度过低,最终坠毁火星大气层,损失高达 1.93 亿美元。

秦始皇灭六国,历史书里重点记的不是战争,而是他统一了度量衡——这是千秋功业,百姓用斗舀米,商人用尺量布,才不至于各说各话,交易混乱。

正如开尔文所说:“当你能够衡量你所说的内容并用数字表达时,你对它有所了解;但是当你无法衡量它或用数字表达它时,你的知识就是贫乏的和不令人满意的。”

未来的智能社会,Token 就像水、电、流量一样,是不可或缺的“新型资源”。但遗憾的是,今天的 Token,既没有明确的度量标准,也没有普及的价格标尺,企业和用户往往“用起来没感觉,花钱时一脸懵”。

——智能时代的“度量衡革命”,从这里开始。

智能社会的三大关键指标

容量、速度、价格

1. 数量单位:T 体系,从字节到字元的进化

正如存储空间有“Byte / KB / MB / GB / TB”的层级单位,Token 也需要自己的标准量纲。

为了避免误解,T 有三层含义:

物理世界,T= 特斯拉(磁场单位);

数字世界,T=Tera(万亿);

智能时代,T=Token(字元)。

比如:“5TT”= 5 万亿个 Token。

举个例子

普通一篇博客:5 KT;

大英百科全书:约 53 MT;

英文维基百科:约 6.4 GT;

GPT 训练数据:常以 TT、PT 计量。

未来,企业购买 AI 资源,就像买流量套餐一样。比如:10 GT 的套餐,够一个小公司用一个月的客服与内容生成。

电池类比

购买 Token 包 = 购买“AI 电池”,例如一块容量 50MT 的“字元电池”。调用模型时,Token 消耗,电量递减。复杂任务可能会快速消耗大量 Tokens,就像玩游戏会让手机电池掉电更快;而简单任务则相当于低功耗模式,可以更持久地使用这块“电池”。

遗憾的是,Token 不像电池,无法提前“充好电”,只能按需实时计算——你无法揣着“50MT 的充字宝”走天下。

2. 速度单位:T/s 体系,智能的"流速"革命

与网络带宽(MB/s)类似,大模型的处理速度也需要单位标注,建议采用:

举例

某高端 GPU 单卡性能为 50 KT/s,即每秒可处理 5 万个 Tokens;若某任务需处理 30 MT,以 100 KT/s 吞吐速度,仅需 300 秒(5 分钟)即可完成。

某低端 GPU (“中国特供”)单卡输出性能为 1.85 KT/s,即每秒可处理 1850 个 Tokens;若某任务需处理 30 MT,以 1.85 KT/s 吞吐速度,需要 4.5 小时才能完成。

吞吐速度的重要性,决定了等待时间。

就像:

56K 猫时代下载 DVD=200 小时,

家庭充电桩 120V 为电动车充满 =70 小时,用 240 伏 (Level 2) 充电,需要 10 小时,那就可以做到白天用车,夜间充满。

笔记本跑大模型,2 T/s= 永远等不完。

如果某家 AI 公司卖你 5 GT 的 Token 包(超大流量),但带宽只有 30T/s,那一个月最多只能消耗 78 MT 的字元,堪比“无限流量,龟速限速版”。

这事在现实世界中还真有,比如某网盘,给你 2TB 的空间,但是下载速度给限流了~

所以,未来你买 AI 服务,记得看两个数: 一个看容量(Token 包多大),一个看速度(T/s 够不够快)!

3. 成本单位:¥/MT 与 kWh/MT,

智能的"价格标签"

既然 Token 是资源,也应该有价格标签和能耗指标。类似电费以千瓦时(kWh)计算、网络花费用 GB 计算,我们也可以定义大模型使用成本和能耗:

价格:¥/MT(每百万字元花费多少元人民币)

能耗:kWh/MT(每百万字元需要消耗的千瓦时),kWh/TT(每万亿字元需要消耗的千瓦时)

实例

2025 年初的时候,DeepSeek-chat 的百万字元输出定价为 8 元 /MT,DeepSeek-reasoner 的百万字元输出定价为 16 元 /MT。而耗电大概为 0.045 度 /MT。

英文版的 Wikipedia 大致有 64 亿 token,也就是 6.4GT。

若是 1GT 的输出则定价为 8000 元人民币,耗电为 45 度电。也就是说,一辆一百度的电车的电量仅仅支持输出 2 Giga Tokens(十亿字元)。需要 3 辆 1 百度电的电车才能有足够的电力去生成整个英文 Wikipedia。

若是 1TT 的输出则定价为 800 万元人民币,耗电为 4 万五千度电,大概是一个小县城一小时的用电量。

所以,Token 虽然只是“字元”,但消耗的是真金白银与实打实的电力。这种"电力→智能"的转化效率,堪比炼金术士梦寐以求的"点石成金"。目前这个转化率还停留在工业革命初期的蒸汽机水平——瓦特改良的蒸汽机热效率仅 3%,而现代内燃机可达 40%。

在 4G/5G 早已普及的当代,很多人一个月消耗的数据流量就轻易超过了 1TB,一个月花费几百人民币。而 输出 1TT 的智能则需要 800 万人民币的花费,这意味着我们当前的算力还需要几个数量级的提升,同时成本还需要几个数量级的下降

4. 能源视角:Token 是极度消耗资源的字元

为了帮助大家更直观地理解,我们将新提出的 Token 计量体系与传统资源进行对比:

但这个表格还藏着一个事实:Token 不是“读”出来的,而是“算”出来的。而这个“算”的过程,极其昂贵。

今天,1TB 的流量只要几十块钱,但 1TT 的 Token,可能需要 800 万元人民币。

在 1TB 的流量都已经是白菜价的今天,1TT 的智能还是白粉价。咱们还需要能够大规模生产 Token 的“算力工厂”(黄仁勋把它叫 AI Factory)。

这种"数字黄金"的特性,让人想起 19 世纪铝比黄金还贵的历史——直到电解法出现前,拿破仑三世用铝制餐具招待贵宾,而普通宾客只能用金餐具。

这就是智能社会的现实:算力是新的燃料,Token 是新型资源。

人类正走进一个时代:数据是原料,算力是工厂,Token 是产品。AI 的成本,决定了智能经济的规模。

AI 的算力网络,

为什么还停在 2G 时代?

实现单机达到 1GT/s的算力,其实并不难。难的是:能不能给每一个人都配备 1GT/s 的字元速度。

在 2025 年的今天,大多数人体验大模型写作,依然停留在一个肉眼可见的缓慢过程:等待十几秒,屏幕上刷出几千字;要生成一段几秒钟的视频,可能得等上几分钟。

什么时候大模型的输出速度才能快得飞起?

2025 年的 GPU 技术大会 (GTC),Nvidia 的黄仁勋在台上侃侃而谈新的数据中心能力,而有一张图预示了未来”AI 新基建”的走势:

请注意看图的横轴:“TPS for 1 User” —— 每个用户能分配到的字元速度,单位是 Token Per Second。纵轴则是“TPS/MW” —— 每兆瓦电力可以支持的 Token 速度,代表了算力中心的能效水平。

这张图的亮点在于,顶级算力 Blackwell 系列,已经能把单用户的字元速度推到 500 TPS,也就是每秒 500 字元。

看起来还不错对吧?其实不然!问题的关键在于图上那个小字:“for 1 User” —— 这是按全民普及来计算的单位。

也就是说,如果每人都开一台 AI 助手,服务器能为每人分配的,依然只有区区 200 T/s 的字元速度。

实现单一 1GT/s 的算力不难,难的是可以给 每个人都实现 1GT/s 的算力。即使在 2025 年,老黄的算力图里,也只是给出了每个人 200 T/s 的算力。

想象一下,如果今天你的 5G 手机突然降级到 2G 网络——微信消息要转圈半分钟,刷短视频成了奢望。这正是当前 AI 算力面临的现实:虽然实验室里能达到 GT/s 级别,但人均算力却停留在 200T/s 的"2G 时代"。

从 200 T/s 到 十亿 /s (GT/s) ,离我们想象中“秒出小说,实时剪片,随叫随答”的 AI 生活,差得还很远哩。

这让我想起 1900 年的纽约:虽然爱迪生的珍珠街电站已运营 18 年,但普通家庭仍主要用煤油灯,因为电力太昂贵且稀缺。

1. 通信网络如何跨越的?

AI 算力就得怎么跨越。

别小看这个“字元速度”的单位!它就像手机网络的“下载速度”,决定了体验的上限。

还记得手机从 2G 到 5G 的升级之路吗?在早期 2G 时代,只有区区 5KB/s,随着网络扩容,在 5G 时代甚至能够达到 1GB/s。

这需要巨大的算力投资,并且生产出来的算力可以通过既有的无线网络和宽带网络上传下传。仿照通信网络,我们也粗浅提出了对应的 2T、3T、4T、5T AI 字元算力网络的标准和类别。

2G 时代,我们用 BBS,网页要加载一分钟;

3G 时代,微博和朋友圈兴起,图片能刷,视频还得缓冲;

到了 4G,短视频狂潮来袭,抖音、快手随刷随看;

5G甚至可以实现 4K 直播,几乎零等待。

而“智元网络”——也就是大模型的计算速度,今天却还在 2T 阶段:每秒 1,000 字元的极限,只有 10 秒才能生成一篇短文,还是个“半人工”体验。

2. 从“算力基站”到“算力城市”

每一轮网络速度的升级,都需要大量基建投入。

中国目前有:

5G 基站:231 万个

4G 基站:603 万个

2G/3G 基站:250 万个

相对应的,未来“智元网络”也需要铺设 AI 基站,也许就是黄仁勋口中的“AI 工厂”(AI Factories),或者叫“智元发电站”。

而你买的不再是流量包,而是 Token 包,不再是宽带带宽,而是字元带宽(T/s)

当我们在 2025 年抱怨"生成 5 秒视频要等好久"时,就像 2005 年用 56K 调制解调器下载 MP3:一首 3MB 的歌曲需要 7 分钟,而今天同样的时间足够 5G 网络下载 4K 电影。

未来的"5T 时代"将带来这些变革:

创作民主化:个人能实时生成 3A 游戏画质内容

教育革命:每个学生拥有 1GT/s 的"爱因斯坦 AI 导师"

医疗普惠:乡村诊所获得与三甲医院同等的 AI 诊断能力

等有一天,人人都能拥有 5T 时代的 1GT/s 算力,也许就像我们今天拥有 5G 手机那样普通。而那一天的 AI 助手,才真正配得上“实时伴侣”四个字。

3. 跨越算力鸿沟的挑战

要实现从 200T/s 到 1GT/s 的跃迁,需要突破三重障碍:

硬件墙:量子计算 / 光学计算等新范式

能源墙:核聚变 / 太空太阳能等新能源

架构墙:神经形态计算等新架构

技术进步是指数级的,但人类的适应能力是线性的。这些指数级的技术进步狂奔到飞起,而社会应用还在蹒跚学步。

站在 2025 年这个"AI 的 2T 时代"回望,那些抱怨生成速度慢的声音,或许会像今天我们回忆"拨号上网的吱吱声"一样,成为数字文明进化的珍贵注脚。

从人天到马斯

AI 劳动力的崛起

从“人·天”到“马斯”,未来的 AI 智网像极了电力时代的重启。只不过,这次传输的不再是电,而是字元本身。

在传统工程世界中,任务成本一般按“人时”(man-hour)或“人天”(man-day)计价。这套单位在外包行业尤其常见,比如在美国,一个软件工程师的 man-hour 常常在 $100 到 $300 之间,一些顶尖咨询公司甚至高达 $900/ 小时。

以下是美国各类职业的典型收费标准:

其中不少工种,尤其是 初级软件开发、法律文件写作、设计初稿等,正迅速被 AI Agent 取代。而像汽车维修、水管检修等实体劳动,虽暂难完全 AI 化,但机器人辅助也已在路上。

这种计价方法,某种意义上反映的是“人力劳动的价格”。但当 AI Agent 出现后,一切正在悄悄改变。

那么,AI Agent 的“工作量”怎么计?我们提出一个新单位:“Token-Hour”(字元·小时)或者“Mega-Token-Hour”(兆·字元·小时,简称 MTH,马斯),用于衡量 AI 的计算工作量与效率。简单来说,就是 AI 完成任务时,消耗了多少“字元(Token)”,以及这些 Token 的消耗速率。

我们来看一个对比案例:

是的,只需 1 小时,AI Agent 就以 8 马斯(Mega Token Hours)的成本完成了原本需 6 人天的任务。

这让我想起 19 世纪纺织工人的卢德运动——当机械织布机的效率是手工的 200 倍时,抗拒变革终将是徒劳的。区别在于,这次"机器"不仅能纺纱织布,还能写代码、打官司、做设计。

当 AI Agent 逐步成熟,“1 小时”可能进一步压缩成几分钟。兆字元小时(MTH)——我们可以用一个更通俗的中文简称:“马斯”,来代表这种 AI 劳动力单位。就像过去用“马力”衡量引擎效率,现在我们可以说:“这任务消耗了 8 马斯”。

从“马力”到“马斯”,工作的事,又一次交回了“机器牛马”们。

2. Token 智网:AI「国家电网」的

吞吐率决定能效和可行性

如果说过去的工业社会靠电力驱动,那么 Token 纪元的社会,将靠“字元”驱动。

AI Agent 的任务完成速度,取决于两件事:“够聪明”与“跑得快”。

聪明,是 AI 模型是否足够理解人类意图并完成任务;

跑得快,则取决于背后的字元吞吐率—— 也就是算力基础设施的速率极限。

这就像当年 56K 猫下 DVD——不是你没资源,而是根本下不完。直到光纤网络普及,蓝光碟片才真正进入家庭。吞吐率的高低,决定了 AI 是否能“实用”。

我们来看看现实中一个惊人的算力场景。以下数据参考自 DeepSeek 开源的评估报告:

每块 H800 GPU:约 20 万人民币

功耗约 300W(瓦)

当前 8 块 GPU 组合下的推理吞吐率:14,800 token/s

电费按 0.6 元 /kWh 计

我们计算几个量级的吞吐目标下的成本:

想象一下——

达到 1 TT/s(太字元每秒)的算力,意味着:

需要 5.4 亿块 GPU、108 万亿人民币投入(相当于中国 2021 年 GDP)、每秒消耗 4.5 万度电、每小时耗电 1.62 亿度。

三峡大坝每小时发电 2250 万度,要供电这个数据中心,得整整 7 个三峡大坝同时工作!

而 2024 年全中国平均用电每小时约为 11 亿度。这意味着这个超算中心会消耗 全国 15% 的电力

难怪黄仁勋的演讲图表,吞吐率只画到了“200T/s for 1 user”。算力、电力,甚至国家财政,根本不够用。

而云服务厂商们也早已开始布局核电,OpenAI 的 Sam Altman 主导的“星际之门”计划,5000 亿美元投资并不是空穴来风。

3. 我们需要多少字元?

太字元的意义

那 1 TT/s 的吞吐率可以支持多少人类使用呢?

以最近 Manus 中一个 AI Agent 的平均任务为例,约需 24 万 tokens(0.24 MT)。那么 1 TT(=1000 GT = 1,000,000 MT)就能支撑:

每秒完成 4166 万个任务

覆盖 14 亿人,每人每 33 秒完成一个中等难度任务

试想,我们日常办公中,一天能完成多少个类似的小任务?如果通用人工智能可以做到每 33 秒替你完成一个复杂任务,那人类打工人是不是可以真正上班“摸鱼”了?

从这个角度看,一个全国级别的 AGI 算力中心,也许真的足以支撑 14 亿人全职用 AI 办公。

当我们实现了 1 TT/s 的算力时,社会会变成什么样子?畅想一下:

生产率悖论:GDP 统计方式彻底失效

就业重构:90% 白领工作转型为 AI 管理岗

教育革命:"学力"取代"学历"成为核心指标

创新爆炸:个人可实现科研机构级创新

就像 1870 年代无法想象电气化社会,今天的我们也难以预见 1TT/s 算力带来的文明跃迁。唯一确定的是,正如法拉第面对电磁感应实验时的那句著名回答:

"一个刚出生的婴儿有什么用?"

—Token 经济这个婴儿,终将长成改变世界的巨人。

字元时代的文明跃迁

人类社会的下一场大重构

我们对 Token 的理解,其实是一场认知的进化旅程。这个旅程,像极了电力时代初期人们对“瓦特”和“度数”的摸索,随着 AI 的发展,Token 也将成为一种新的社会标准。

这个认知,可以分为六个层次:

第一层:Token,语言模型的基本单位

在最基本的层面上,token 是语言模型的处理单元。就像电子在电路中流动一样,token 在 AI 模型中流动。理解什么是 Token 字元是理解 AI 经济的第一步。

第二层:Token 的规模与聚合

单个 Token 不足以描述实际应用,正如一滴水不足以丈量江河。当 Token 数量级从千、万、兆扩展,我们需要像 KT、MT、GT 这样的进位单位,来构建 宏观认知,也像计算机存储单位一样,逐步从 KB 走向 TB。

第三层:Token 流动速度与吞吐量

Token 的生成并非瞬间完成,它受到模型算力、内存、带宽的约束。“Token 吞吐量”(T/s 或 KT/s)这个概念,就像网络带宽,决定了 AI 实际工作的响应速度和规模上限。

第四层:Token 的经济学属性

当 Token 成为可计价的资源,它也进入了经济学的范畴。不同服务商以“$/KT”或“$/MT”计价,模型能力越强,价格也随之波动,逻辑上与电力、水资源、云存储的分级定价极为相似。不同的服务提供商根据模型能力提供不同的费率,类似于分级定价的公用事业服务。

第五层:Token 的能源效率

Token 处理的能源效率(以 kWh/GT 计)在环境和经济层面都很重要。更高效的模型每个 token 消耗的能量更少,从而降低成本并减少环境影响。

第六层:Token 驱动的生产力革命

Token 的最终价值,体现在它所完成的工作量。以“兆字元小时”(MTH) 或“马斯”为单位来衡量生产力,为我们提供了一个将 AI 方法与传统人工方法进行比较的框架,成为新工业时代的 生产力度量基石

这六层的理解和规划,为我们展示了一个基于资源经济的将来:Token 像电力一样通过「智能网格」按需分配。每个人、企业、市场、以及国家都会有对应的产品、市场、和商业模式。

1. 从个人到国家,

字元经济将全面渗透

个人使用

个人用户可能会有专属的字元配额:

基础套餐:每月包含 1 MT

高级套餐:每月 10 MT,并享有优先处理(更高的 T/s)

专业套餐:每月 100 MT,并可使用专属模型

企业资源规划

公司可能会为不同部门分配字元预算:

市场部:每月 50 MT 用于内容生成

客服部:每月 100 MT 用于自动回复

研发部:每月 200 MT 用于数据分析

字元交易市场

未来我们可能会看到字元期货和现货市场的出现:

购买下季度交付的 1 GT 处理能力

在高峰或低谷时段交易字元资源

对冲字元价格波动的风险

企业通过 TT 级算力期货对冲模型训练成本。

而当这些字元的产生和交易越来越多,就像基本的大宗商品或者耗材资源一样,需要国家层面的政策与统一协调。

国家政策措施

字元资源,终将进入公共治理视野:

Token 碳税:按消耗电力征收,鼓励绿色模型

Token 配额:按用途划分,优先保障公共服务

Token 交易监管:防止投机,保护社会公平

跨境 Token 流动监管:守护数据主权,维护国家安全

2. 从“马力”到“马斯”:

人类文明的标准进化

历史上,计量单位的进化,往往意味着一次技术革命的降临:

蒸汽时代,诞生了“马力”;

电气时代,诞生了“瓦特”;

信息时代,诞生了“比特”;

智能时代,正在诞生“马斯”。

从「马力」到「瓦特」,从「人天」到「马斯」,人类始终通过标准化单位驾驭技术革命。

通过现在就建立这些标准,我们将更好地为未来做好准备——一个字元资源与电力、水资源、带宽同等重要的经济时代。

当 AI Agent 以马斯 (Mega-Token-Hour) 取代人天 (Man-Day),人类终于从重复劳动中解放——这才是工业革命 4.0 的真正内核。人类在实现 1 TT/s 的超算中心的时候,反过来回忆现在,有致敬一句前辈的老话:用“人天”来计算 AI 的效率,就像用蜡烛丈量太阳。

新世界的“瓦特计”已经诞生,它的名字叫:字元 当 AI 成为基础设施,字元经济将是衡量智能社会的标尺。Token 经济的终极意义在于:人类第一次能够精确测量并管理自己的集体智能。当未来史学家回望这个时代,或许会如此评价:

"21 世纪 20 年代,人类发明了字元 Token——这个看似简单的计量单位,最终成为了区分碳基文明与硅基文明的罗塞塔石碑。"

——而我们,正在书写它的第一行定义。

今日好文推荐

“不是 Cursor 不够强,是 Claude Code 太猛了” !创始人详解Claude Code如何改写编程方式

我用大模型砌“屎山雕花”:5天肝出几万行代码!产品经理的AI编程翻车记

13 年苦熬到 170 亿市值,一夜间被用户抛弃!一封“AI吹”全员信让网友“不喷不行”

技术更新 or 组织重塑,企业如何用好“数据智能”?

来源:InfoQ

相关推荐