近期,AI领域核心术语“词元(Token)”热潮席卷全网。
数据显示,截至2026年3月,我国日均词元调用量已突破140万亿,较2024年初的1000 亿增长超千倍。从智能办公到日常交互,词元正悄然渗透进数字生活的方方面面。
“词元”:信息处理的最小单元
词元是模型处理信息的最小信息单元。它既可能是单个汉字、标点符号,也可能是词汇、词根或子词等,可覆盖文本、图像、语音、视频等多模态信息处理场景。
从属性特征而言,词元具备可计量、可定价、可交易三大核心能力。日前,在中国发展高层论坛2026年年会上,国家数据局局长刘烈宏表示,Token“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”,为商业模式的落地提供了可量化的可能。
当前,词元已广泛应用于各类AI服务场景,用户与AI的每一次对话、企业的每一次智能分析、开发者的每一行代码生成……本质上都是词元的拆分、调用与运算,都对应着GPU算力调用、电力消耗与数据传输。
词元发展带来的风险和挑战
新技术是一把双刃剑,词元在带来便捷与机遇的同时,也有风险和挑战。
一是“碎片式”泄密风险。以往防泄密风险都是以 “整份文件” 为目标对象,而词元可将涉密文本拆解为最小离散单元,单个词元看似无涉密属性,但经汇总拼接即可还原完整涉密内容,保密难度大幅提升。
二是泄露劫持风险。不法分子可利用公共 Wi-Fi 嗅探、跨站脚本攻击(XSS)等技术手段,窃取未加密传输的词元数据。一旦数据泄露,攻击者可盗用用户身份、越权访问系统、篡改数据,甚至通过海量词元汇总分析挖掘涉密信息,引发系统性安全风险。
三是诈骗陷阱风险。当前,不法分子借“词元”概念炮制的各类骗局层出不穷:冒充官方平台,诱骗用户隐私信息;以低价AI词元套餐、词元投资等为噱头实施诈骗;甚至借“囤词元能暴富”“场外交易赚差价”等名义开展非法金融活动,危害国家经济安全与数据安全。
四是“投喂式”泄密风险。在日常工作中,个别工作人员忽视保密制度要求,在非涉密AI工具、公共网络环境中输入工作秘密、内部敏感数据,这些数据拆分为词元被模型留存,或造成“投喂式”秘密泄露。
筑牢词元时代安全保密防线
筑牢词元安全的坚固防线,需要构建“监管—平台—个人”三位一体的协同治理体系。
强化监管引领。在为词元相关技术创新、产业发展留足空间的前提下,加快完善相关法律法规,健全词元数据安全、技术监管、市场规范等制度体系,明确行业标准、技术规范与各主体责任边界,加大对违法行为的打击力度。
压实企业责任。企业作为词元技术研发与应用的主体,要切实扛起安全主体责任,强化技术防护能力,完善数据加密、权限管理、风险检测等安全机制,坚守伦理底线,杜绝技术滥用,主动接受监管与社会监督,推动技术向善。
提升用户素养。用户作为使用者,要主动学习词元相关知识,明晰词元的技术属性与应用边界,提高风险防范意识,警惕各类词元相关虚假宣传与投资陷阱,注重个人信息与敏感数据保护,从自身做起防范泄密风险。
技术向善,方行致远;安全为基,方得始终。词元承载着人工智能产业的未来图景,也关乎着每一个人的数字生活,更维系着国家的数据安全命脉。面对词元驱动的智能浪潮,我们既要以开放姿态主动拥抱,让新技术充分释放科技赋能价值,也要时刻筑牢安全防线,方能行稳致远。
参考资料:
1.王志顺.词元安全关乎国家数据安全[N].新华网,2026-04-09.
2.邓也.拥抱“词元”,也要守住安全[N].四川日报,2026-04-09(006).
3.“词元”这么火,该注意点啥?[EB/OL].微信公众号“国家安全部”.2026-04-07.
4.“词元”时代到来,安全保密面临怎样挑战?[EB/OL].微信公众号“浙江保密”.2026-04-01.
来源:保密观
如遇作品内容、版权等问题,请在相关文章刊发之日起30日内与本网联系。版权侵权联系电话:010-85202353




全部评论
0条