首页  /  百年辉煌  /  正文

百年辉煌

从Token到“词元”,变化背后的分量很重,安全风险要警惕

发布时间 : 2026-03-28 16:00:51        来源 : 党建在线     浏览次数 :

科学圆桌会丨人工智能研究者:从Token到“词元”,变化背后的分量很重

2026-03-27 20:29:34 来源:新华社

日前,在中国发展高层论坛2026年年会上,国家数据局局长刘烈宏明确将Token称为“词元”,并将它定义为“结算单位”。作为一名长期跟踪人工智能发展的研究人员,我一下子就捕捉到这个表述的变化。这个变化背后的分量很重。

它意味着,我国人工智能正在从“能力布局”迈向“能力结算”,从模型好不好,转向智能服务如何计量、如何定价、如何交易。过去,很多企业采购软件,买的是许可证、账号数和部署周期;如今,越来越多企业采购的,是可调用、可核算、可复盘的智能服务量。

词元,正是那个把智能服务折算成成本与价值的刻度。真正值得重视的,不只是一个译名,而是一个计量体系正在成形。

数据显示,2024年初,中国日均词元调用量为1000亿;到2025年底,跃升至100万亿;到2026年3月,已突破140万亿,两年增长超过1000倍。自2026年1月底以来,有的模型企业创下20天收入超过2025年全年总收入的业绩纪录。

短短两组数据,已经足以说明一个事实:词元不再只是技术指标,而正在成为人工智能商业化速度、应用深度和产业景气度的重要观测值。

中文语境下,给Token定名为“词元”,格外有意义。它比“词”更准确,也比“令牌”“标记”更贴近语言处理场景。特别是强调了“基础单元”这个属性,既方便公众理解,也有助于产业、媒体和政策口径统一。

但如果把2026年3月23日看成“词元”横空出世的时刻,也并不准确。事实上,Token并不是大模型爆红后才临时冒出来的新词。

往前追溯,在学理脉络上,它可追溯至20世纪初研究者提出的type-token区分,随后进入语言学、计算语言学和自然语言处理领域,成为文本处理的基础概念。在中文规范体系,2018年已有计算机学科术语规范工具书,将相关场景下的Token译为“词元”。

词元本质上是大模型处理信息的最小信息单元。人类说出一句话之后,模型要先把文本切分成词元,再把词元映射成编号,随后才能完成关联、推断和生成。

这也是为什么同样一句中文,在不同模型里,词元数量往往并不相同。切分规则不同,成本就不同,速度就不同,可容纳的上下文长度也会不同。

为何词元调用量快速攀升到140万亿?答案不是简单的“聊天变多了”,而是应用形态变了。对话应用消耗词元,长流程任务更消耗词元,调用工具、读取文档、连续规划、多轮反馈,同样都要反复吃进上下文、生成新输出。表面看,用户只是让模型“帮我做件事”,而系统内部,实际上是一次次高密度的信息拆分、调用和结算。

正如刘烈宏在同一场演讲中所说的:人工智能正从“对话”走向“决策执行”,智能体正在驱动中国大模型应用规模爆发式增长。

另一方面,词元调用增长越快,越说明数据供给体系正在跟上模型推理与应用消耗的节奏,也说明数据、模型、场景与商业闭环开始贯通,“词元经济”雏形正在显现,“数据供给—价值释放”的良性循环已初现端倪。

但词元多,并不自动等于智能强。

我在和企业交流时,常会碰到一种误解:是不是词元消耗得越多,模型就越聪明、答案就越好?

事实并非如此。词元更像水表和电表,负责记录消耗,不负责保证质量。真正决定结果的,仍然是模型能力、数据质量、任务设计和提示组织方式。

一句话:没有高质量数据,词元只是空转;没有合适场景,再便宜的词元也难以转化出真正的生产力。

词元像是一块很小的砖,却可能正在垫高一个时代的门槛。很多人第一次听见“词元”时,会觉得它抽象、陌生。但从此刻起,词元正像“字节”“流量”“千瓦时”那样,成为普通人必须逐步理解的新单位。这也意味着人工智能开始被纳入更成熟的经济叙事。

2025年8月28日,参展商与观展者在2025中国国际大数据产业博览会会场交流城市数智化实践情况。新华社记者陶亮 摄

我第一次强烈意识到词元的这种叙事改变,不是在实验室,而是在一张预算表前。

前段时间,我和几位企业负责人讨论大模型接入方案。大家谈完模型能力、幻觉率、知识库召回率,财务负责人忽然指着一行费用问我:为什么这套系统不是按账号数收费,也不是按调用次数收费,而是按“月度词元消耗量”核算?

那一刻,我意识到,词元已经像工业时代的度电、互联网时代的流量一样,成为企业理解人工智能时代“成本”的新度量衡。它不只服务于技术研发,也会越来越多地出现在预算表、采购单、报价单和监管语境里。

我们当然不能把一个时代的变化,全部压缩进一个术语里。但有些时候,一个术语的正式定名,恰恰标志着一个产业阶段已经悄然切换。今天的词元,也许就站在这样的节点上。

等到更多人读懂词元,人工智能的落地方式也会被重新理解。以后再听到“这个模型很费词元”“上下文又超了”“本月词元预算不够了”时,我们不妨少一点陌生感。这也在提醒我们:人工智能已经不只是在展示聪明,它正在像水、电、网络和云资源一样,被精确计量,被持续调度,被大规模交易。 

真正变化的,也从来不只是一个中文名字。(作者系赛迪研究院人工智能研究中心副研究员钟新龙)



财经慧说丨“词元”火了,AI向“会办事”加速进化

2026-03-27 20:05:03 来源:新华社

策划:邹伟   主编:许晟、李延霞   记者:刘慧、高亢   摄制:潘一景   新华社国内部出品



AI赋能工程科技 中外专家共话前沿图景

2026-03-28 14:31:46 来源:新华社

近日,由中国工程院主办的工程科技创新论坛在2026中关村论坛年会期间举行。来自全球工程科技领域的专家学者齐聚一堂,“AI赋能”成为中外专家口中频频提及的热词。

“当前,以人工智能、机器人为代表的前沿技术,正推动工程实践迈入自动化、系统化、智能化的全新阶段,实现工程效率、工程质量与复杂问题解决能力的根本性提升。”中国工程院院长李晓红说。

图为工程科技创新论坛现场。新华社记者刘祯 摄

随着新一轮科技革命和产业变革加速演进,工程科技创新密集活跃,工程前沿不断取得突破。在本届中关村论坛年会上发布的《2025全球工程前沿》显示,人工智能助力工程范式迈向代际跃迁是2025年全球工程前沿体现的鲜明趋势之一。在遴选出的189个工程前沿中,74个与人工智能紧密相关。

在材料领域,人工智能正以大数据驱动、智能化设计与高通量自动化试验的新范式,加速材料的发现、优化和开发过程。

作为材料领域的重要应用方向,3D打印正推动材料向轻量化、个性化发展。中国工程院院士、西安交通大学教授卢秉恒表示,个性化产品一定程度上限制了3D打印产品的批量化生产,而利用AI建模,有望推动3D打印实现规模化生产。

新能源是驱动高质量发展的绿色引擎,也正受到人工智能的深度赋能。

专家表示,我国在新能源领域处于全球第一梯队,光伏、风电、动力电池等产业具有一定优势,但也面临能源系统灵活性的挑战、关键矿物供应的风险和长周期技术商业化难题。

“AI与能源的深度融合正在催生新的研究方向,AI驱动的新材料设计、综合能源系统韧性调控、高功率密度动力系统等,正推动能源体系向清洁化、智能化、高效化转型。”李晓红说。

在中国工程院外籍院士、芬兰瑞典工程院院士彼得·大卫·路德看来,能源是一个高度创新密集型的领域,AI已经在智慧能源系统等方面实现创新,未来AI将在能源领域扮演更重要的角色。

制造业同样正迎来AI赋能的热潮。数据显示,在我国的智能工厂,人工智能变革带动生产效率平均提升29%,产品不良率降低47%。

目前,我国已建成33家国家级制造业创新中心,在智能网联汽车、具身智能机器人等领域形成了一批重要科技成果,为工程科技创新提供了坚实支撑。

工程科技是推动人类社会发展的重要引擎,是连接科学发现与产业变革的关键桥梁。与会专家认为,在全球工程科技加速变革的背景下,开放协同、跨界融合正成为推动工程创新的必由之路。(记者刘祯)



小词元撬动智能经济大市场

2026-04-03 07:34:05 来源:人民日报

我国日均词元调用量突破140万亿,企业为提升效率付费意愿较强

小词元撬动智能经济大市场

数据来源:国家发展改革委、国家数据局

制图:沈亦伶

词元(Token),大模型处理信息的最小信息单元。我国日均词元调用量大幅增长,不仅折射智能经济的澎湃活力,也意味着一套新型商业逻辑正在加速演进。智能时代,有了可计量、可定价、可交易的词元,人工智能有望成为像水、电一样支撑社会运转的基础资源。

用户端,查资料、写代码、改文案;企业端,金融风控、智能客服、代码修正……如今,人工智能应用落地的每一个场景,都离不开对词元(Token)的海量调用。

词元,大模型处理信息的最小信息单元。今年3月,中国日均词元调用量突破140万亿,两年增长超千倍。怎么理解词元?词元和人工智能产业的关系是什么,未来发展趋势如何?记者进行了采访。

  词元调用量爆发性增长,背后是模型能力提升

有人疑惑,词元和常见的数据有何不同?

“人工智能大模型的本质是一套复杂的数学运算系统,它无法像人类一样直接读懂文字、听懂声音、看懂画面。”中国移动研究院网络与IT技术研究所副所长唐华斌说,人工智能大模型必须先将各类原始数据转化为自己能识别的“语言”,再通过运算输出结果,词元就是这套“语言”中最基础的单元。

具体来看,文字词元像“乐高积木”,一个单词或一个汉字被拆成一块块词元;音频词元像“乐谱上的音符”,一段声音被切成极短的时间片段,每一片包含音调、音量;视频词元像“拼图碎片”,每一帧画面被切成一个个小方格,并且还要考虑时间上的连续性……

“在大模型看来,三种模态的词元完全没有差别。在模型眼里,它不觉得自己是在读文字或看视频,它只觉得自己是在处理一串极其复杂的数字序列。”火山引擎智能算法负责人吴迪表示。

一个个基础的词元,构成了智能经济运行的“细胞”。今年3月,中国人工智能大模型周词元调用量连续3周占据领先地位,成为全球大模型应用活跃度最高的国家之一。

“词元调用量爆发性增长,最直接的原因是模型能力的提升。每一次模型能力的提升,就会解锁更多应用场景,从而使大模型词元调用量进一步激增。”吴迪介绍,以Seedance(豆包视频生成模型)2.0为例,生成1分钟视频大约会消耗超过100万个词元。

同时,新的应用形态、新的商业模式,也会驱动大模型词元调用量大幅上涨。唐华斌表示,最近兴起的智能体和传统单轮问答不一样,它的运行往往意味着更长的上下文、更频繁的模型调用、更多轮次的任务拆解,以及工具执行过程中的持续反馈。

“简单任务,如果只需要单轮或几轮工具调用就能搞定,消耗词元只需要几千;如果需要几十轮工具调用,则需要至少消耗几万词元乃至更多。”吴迪说,智能体等新业态的涌现,让词元调用量又进入了一个快速增长的通道。

  词元调用集中在信息密度高、迭代周期快的领域

60亿,是爱问答科技创始人李加义过去一年的词元调用量。

走进位于北京海淀区的AI原点社区,一间约16平方米的工作室里,李加义团队正在调试刚刚设计完成的AI玩具。

“这个玩具要具备交互能力,离不开相应的软件系统。放在以前,同等体量的软件系统开发至少要半年,还得多人共同配合。”李加义说,在AI大模型与辅助编程的深度赋能下,消耗数亿词元,开发周期被压缩至两个月。

2025年初,非计算机科班出身的李加义接触AI辅助编程工具后,借助新技术打破了软件开发的专业壁垒。“一年间,我们高效地完成了两款APP和一个AI玩具的开发设计。前不久,我们还将自研的AI硬件产品推向了国际消费电子展(CES)。”李加义说,AI助力不仅让开发成本大大降低,也让小微企业的创新探索有了更多可能。

软件开发,是人工智能应用落地的典型场景之一。总体看,词元调用量的分布呈现出鲜明的行业与场景特征,主要集中在那些信息密度更高、产品迭代周期更快以及模型与生产系统之间联系更紧密的领域。

以豆包大模型2.0为例,吴迪介绍,从行业分类看,互联网行业词元调用比例最高,消费电子、金融、新零售和商务服务紧随其后。

从场景来看,非结构化信息的处理和分析占比最大;教育、内容创作和“搜索与推荐”次之。

观察未来的发展趋势,软件开发、深度研究、个人助理等智能体应用场景或将成为词元调用量爆发的重要领域。“特别是软件开发,当前人工智能正从简单写代码转向理解整个项目,不仅能排查错漏、自动优化,甚至能通过智能体自主完成整个开发任务。代码上下文长、交互轮次多,企业为提升效率的付费意愿较强,这将成为一个巨大的需求增长点。”唐华斌说。

  词元可计量,人工智能有望成为社会运转基础资源

“今年1月底以来,有的模型企业创下20天收入超越2025年全年总收入的业绩纪录。这组数字背后,是一套以词元计费为基础的新型商业逻辑正在加速演进。”国家数据局局长刘烈宏表示。

回顾人工智能产业发展历程,过去一段时期,行业聚焦于模型性能的比拼,技术创新与商业落地之间缺乏可量化的衔接桥梁,难以形成“技术迭代—价值产出—持续投入”的良性循环。

“词元本身具备可计量、锚定算力能耗、跨模态通用结算的特点,使其能够成为连接技术供给与商业需求的结算单位。打个比方,大模型输出的智能好比电,智算中心好比发电厂,电用千瓦时来计量,智能调用就用词元来计费。”联想中国基础设施业务群战略管理总监黄山表示,展望未来的智能社会,人工智能有望成为像水、电一样运转的基础资源,随取随用,用多少买多少。

从词元的视角出发,打造智能经济新形态,我国有何优势?有哪些发展着力点?

算法创新持续实现突破,国产大模型通过底层架构优化,与全球顶尖技术的代差逐渐缩小。吴迪说,我国的大模型厂商做了非常多的算法创新,在推理成本、响应速度上不断优化,能以更少的词元完成复杂任务。

基础设施具备领先优势。每生成一个词元,都在调用数据中心的算力,伴随着电力消耗。我国已建成全球门类最全、规模最大的能源体系,电源足、电网强、市场活。唐华斌表示,我国发电供给持续提升、电力成本不断降低,能够有效降低词元调用成本。

“能耗和算力是词元调用的两个关键成本。让每个词元用更少的算力和更少的能耗生产出来,体现的是智算中心等基础设施的生产能力和效率。”黄山表示,要构建起安全、高效、普惠的人工智能基础设施,持续提升大模型推理效率、降低单个词元成本,让人工智能最大程度走向规模化应用落地。(记者 王云杉)



“词元”这么火,该注意点啥?

2026 04/07 07:38:30 来源:国家安全部微信公众号

近期,国家数据局正式定名的AI领域核心术语——词元(Token)成为网络热词。据统计,截至今年3月,我国日均词元调用量已超过140万亿,较2024年初增长1000多倍。“词元”这个新词实际上早已融入我们生活的方方面面。面对新技术新应用,我们既要主动拥抱、善加运用,又要防范风险、确保安全。

  什么是词元(Token)?

简单来说,词元是AI大模型处理信息的最小单元,兼具可计量、可定价、可交易三大特征。它不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”。词元应用场景远超AI领域,与日常生活紧密相关。

——身份凭证类,相当于数字世界的“临时身份证”,用于便捷登录各类平台、完成转账授权等,如微信登录第三方小程序、手机银行动态口令等,有明确有效期,兼顾便捷性与安全性。

——AI场景类,即官方定名的“词元”核心应用,是使用如AI写作、修图、剪辑等AI服务的消耗性资源。

——权益凭证类,可以理解成区块链场景下的“通证”,相当于数字化权益证明,如电子票、游戏皮肤、会员积分等,具有不易伪造、便于流转的特点。

  词元(Token)热潮下的信息安全隐患

随着词元的爆火,一些不法分子开始打起了词元的主意,伺机布设各种陷阱。同时,词元本身在使用过程中也存在一定的安全风险,需要我们加以防范。

——泄露劫持风险。不法分子可通过跨站脚本攻击(XSS)、公共Wi-Fi嗅探等方式,窃取、截获未加密的词元。一旦词元泄露,攻击者可直接盗用用户身份,获取隐私信息、登录账号、篡改数据,甚至实施诈骗、转账等操作,直接威胁个人财产安全。如果海量词元被汇总分析,则可能引发系统性风险,危害数据安全与国家安全。

——伪造篡改风险。若词元缺乏加密或签名防护,不法分子可直接修改词元的权限字段,伪造管理员身份绕过系统验证,非法获取用户敏感隐私数据、实施越权操作。同时,不法分子还有可能制造“虚假词元”,诱导用户泄露身份证号、手机号等隐私信息。

——诈骗陷阱风险。当前,各类“词元骗局”层出不穷:用低价AI词元套餐、词元投资等噱头,诱骗用户资金;冒充官方平台,以官方升级、验证为由,骗取个人隐私信息。尤其是宣称“囤词元能暴富”“场外交易赚差价”等行为,不仅涉嫌非法金融活动,还可能被境外间谍情报机关用以开展数据窃取、资金渗透,危害国家经济安全与数据安全。

  词元(Token)这么火,应该注意点啥?

面对词元热潮,我们既要理性看待其价值,又要注意信息安全、隐私安全,提高安全防范意识,做到了解词元、善用词元。

——认清词元属性。词元可作为数字身份凭证,并非投资品,防范以“词元投资”“高收益回报”“词元理财”“词元挖矿”等为噱头的各类骗局,切勿盲目购买未经官方认证的小众、虚拟词元,不随意注册来路不明的词元服务,从源头上避免因贪利、跟风导致的个人隐私信息泄露和财产损失。

——强化使用规范。使用词元相关服务时,优先选择正规平台与加密传输通道,不在公共网络、不安全环境下进行登录、转账、填写隐私信息等敏感操作;不点击陌生链接,不下载非官方APP,不扫描可疑二维码,及时更新设备系统与安全软件;严格保管词元口令、授权码及绑定的手机号、身份证号等信息,开启双因素认证,不共用账号,不设置通用密码,发现账号异常立即采取改密、解绑、报备等止损措施。

——遵守法律法规。面对词元等AI领域的新兴应用与概念,应保持理性认知,既不盲目追捧,也不跟风炒作,自觉遵守法律法规与监管要求,主动学习官方发布的词元安全知识与风险提示,提高辨别能力;科学区分身份凭证类、AI场景词元与区块链通证、加密货币,不参与非法加密货币交易,如遭遇诈骗、信息泄露或发现非法活动,应及时向有关部门反映。



低价套餐、诱导投资……“词元”热潮下这些安全风险要警惕

2026-04-08 08:16:17 来源:中央广播电视总台中国之声

近期,国家数据局正式定名的AI领域核心术语——词元(Token)成为网络热词。简单来说,词元是AI大模型处理信息的最小单元,兼具可计量、可定价、可交易三大特征。词元应用场景远超AI领域,与我们的日常生活紧密相关。

我们可以把“词元”理解为数字世界的“临时身份证”,用于便捷登录各类平台、完成转账授权等;它又相当于数字化权益证明,比如电子票、游戏皮肤、会员积分等;它还是AI写作、修图、剪辑等AI服务的消耗性资源。

随着词元的爆火,一些不法分子开始打起了词元的主意,出现一些以“低价词元套餐”“词元代理”等为幌子的消费陷阱。“词元”热潮下,有哪些风险需要警惕?

记者搜索社交平台发现,一些商家发布的二三十元大模型包月,且“词元”不限量的产品套餐比比皆是。相关产品介绍,一个API,也就是应用程序编程接口能通吃所有编程模型;还有商家发布关于AI算力“词元”代理的教程售卖帖,声称零门槛可直接上手赚佣金。

记者注意到,一些代理所发视频介绍“词元”经济的文案几乎一模一样。他们宣传,上手AI就像呼吸一样简单,实际情况真的如此吗?社交平台上,已有多位博主发帖提示关于“词元”的陷阱。

有从事科技领域的博主分析,那些截图和教程本身就是这门生意的一部分,但这还不是最重要的部分,当卖Token本身赚不到足够多的钱,他们发现更赚钱的东西,是卖“卖Token”的机会。你以为你在做AI的生意,其实你交的那几千块钱才是他们真正的利润来源。如果真的靠卖Token月入好几万,他为什么还要花时间教你?除非教你这件事本身比卖Token更赚钱。

也有博主坦言,做“词元”代理,卖应用程序编程接口赚钱实际上就是“韭菜盘”。

昨天(7日),国家安全部公众号发布了关于“词元”的安全警示,提示了泄露劫持、伪造篡改、诈骗陷阱等三方面风险。这些风险都有怎样的套路?

四川省人工智能学会常务理事余溢表示,“词元”本身并不会导致风险,而在于使用“词元”的方式。

余溢:现在非常多的第三方号称廉价的Token资源在卖,有好几种使用方式,有些会把它打包成“龙虾”的终端服务。假设你做新媒体行业,给你安装新媒体“龙虾”到本地之后,这个行为本身就导致能够获取到很多敏感隐私的数据。

余溢解释,“词元”就像一块面包,五星级酒店的面包和街边小店的面包不同,实际上是模型智力水平的体现,商家在其中钻空子“挂羊头卖狗肉”。

余溢:用低价的“词元”套餐骗你,说我是旗舰版的模型,实际上下面都是两三代之前的版本。骗你说是大模型,实际上下面都是中小模型,而且非常普遍。因为大部分“龙虾”干的活无外乎就是写文章、做PPT,生成图片,基本上用一些中小模型是能完成这个工作的,绝大部分普通人使用的时候没有分辨能力。

武汉某科技公司高管黄丽媛补充,“词元”背后消耗的是算力、大模型、电力资源等等,背后其实有成本,只是用户原来没有付费的习惯。现在基于一些优质大模型的工作,培养了用户付费的习惯本来是好事,但是骗子同样也盯上了“词元”热潮,冒充官方平台,以官方升级、验证为由,设下诈骗陷阱。

黄丽媛:假设100块钱人民币,我买了4000万的Token,看上去逻辑好像是通的,但是本质上其实就是偷换概念。Token本身不具有稀缺性,我们买的是它计量单位背后的算力、模型,以及AI反馈出来的结果。分享Key也是个骗局之一,比如我把我的Key给了骗子,如果我这个API是按照消耗来收费,可以理解为我把银行卡账号给了这个骗子,他可以无限从里面划钱。这也是国家安全部提醒的其中一种,就是“钓鱼型”的,我给你的账号升级一下,但你得授权给我你的个人账号,获取了这些他就可以拥有你的个人的信息。

黄丽媛提醒,目前关于“词元”的陷阱套路其实跟之前的“元宇宙”“Web3.0”一样,换汤不换药,都是利用用户对新事物的信息差从中牟利。

黄丽媛:对于普通个人来说,如果不是行家,首先有很多词不要信,比如“囤词元”可以暴富。第二,我们使用的这些所有的API Key都是验证过的,都是正规的站点、平台。如果你没有能力识别,不要轻易去陌生的网站输入Key,或者轻易绑定你的某个银行卡去消费,保不齐有一些爆火的平台,已经出现了钓鱼网站、高仿真的网站了。

此外,国家安全部提示,不法分子可通过跨站脚本攻击、公共Wi-Fi嗅探等方式,窃取、截获未加密的词元。一旦词元泄露,攻击者可直接盗用用户身份,获取隐私信息、登录账号、篡改数据,甚至实施诈骗、转账等操作,直接威胁个人财产安全。如果海量词元被汇总分析,则可能引发系统性风险,危害数据安全与国家安全。

北京数字经济与数字治理法治研究会副秘书长黄尹旭建议,大家需认清“词元”并非投资品,远离各类相关投资骗局;同时,保持理性认知,自觉遵守法律法规与监管要求,主动学习“词元”有关的安全知识与风险提示,提高辨别能力。