4月29日消息,据媒体报道,今日,《全国数据资源调查报告(2025年)》在第九届数字中国建设峰会上发布。
报告显示,我国数据资源正以更大力度,赋能人工智能创新发展。
2025年,全国日均词元调用量从年初的超万亿增长到年末的100万亿,呈现指数级增长;全年词元累计调用量达到约21100万亿。
据了解,“词元”是Token的标准译名,是人工智能大模型为了高效处理数据,把数据进行拆分后的“最小信息载体”,可以理解为“字/词片段/符号”等。
比如“我爱中国!”,可拆分成“我”“爱”“中国”“!”4个词元。
如果说互联网时代信息传输的核心度量是流量,那么人工智能时代,这一关键指标正变为词元。
用户输入的每一个字,模型生成的每一段话、识别的每一幅图像,都在消耗词元。
文章来源:
我爱百科网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!