全国智算总规模居世界第二
- 2025-09-02 18:22:42
- 246
8月28日上午,2025中国国际大数据产业博览会(以下简称“2025数博会”)在贵州省贵阳市开幕。国家发展改革委党组成员,国家数据局党组书记、局长刘烈宏在开幕式上表示,今年将推出数据产权、数据创新型企业、数字产业集群等十几项产业政策,完善数据基础制度,优化发展环境。
国家数据局已累计发布
70个公共数据“跑起来”应用场景
刘烈宏提到,正在加快布局建设国家数据基础设施,开展可信数据空间、数场、数联网、数据元件、隐私保护计算、区块链等6条技术路线试点试验。截至7月底,已建成25个城市业务节点,涉及16个地方。目前,全国智算总规模78万Pflops,位居世界第二。
聚焦场景应用,刘烈宏表示,国家数据局已累计发布70个公共数据“跑起来”应用场景,进一步推动数据“供得出、流得动、用得好、保安全”,充分释放数据资源价值。目前国家公共数据资源登记平台已上线,登记数据资源、产品和服务超1.1万项,覆盖79个国民经济行业大类。
为推动数据产权制度加快落地,国家数据局发布《数据流通交易合同示范文本》,持续推进数据交易机构互认互通,搭建数据产品需求目录,加快繁荣数据市场生态。
刘烈宏介绍了一组数据:从场内数据流通交易的情况看,
上半年主要数据交易机构
新上架数据产品3328个同比增70%
今年上半年主要数据交易机构新上架数据产品3328个,同比增长70%,特别是人工智能领域的数据供给能力显著提升,上架高质量数据集产品同比增长2.8倍;从场外数据流通交易看,越来越多的经营主体通过多种渠道参与到数据要素市场化价值化进程中来,一批从事数据标注、治理、交易服务等业务的企业快速成长。
数据显示,2024年全国数据企业超40万家,产业规模5.86万亿元,较“十三五”末增长117%。2024年数据产业融资约1800起,市场信心进一步提升。
为壮大数据产业,刘烈宏透露,在去年印发《关于促进数据产业高质量发展的指导意见》基础上,近期正在部署一批数据产业集聚区建设试点,加快推动形成产业生态和规模优势。
据南都记者了解,今年是数博会成功举办的第十一年。本届大会由国家数据局主办、贵州省人民政府承办,以“数聚产业动能智启发展新篇”为年度主题,三天的会期内将举办26场交流活动,34场系列特色活动,共有1.6万余名嘉宾注册参会,375家中外企业参展。
观点
梅宏:建议推动公共数据开放与分级分类管理
日前,2025中国国际大数据产业博览会在贵州贵阳举行。8月27日,在“数字政府”交流活动上,北京大学信息科学与技术学部主任、中国科学院院士梅宏围绕数据要素化面临的挑战进行了深入分享。
梅宏表示,数据作为新型生产要素,与传统要素相比具有非竞争性、非排他性和可重复使用等特征,在生产过程中能够发挥独特作用。关键问题在于如何准确理解数据在生产函数中的地位。在他看来,数据既是生产变量,也像技术一样是一种效率提升的手段,因此其作用更为关键。
谈到推进数据要素化的实践时,梅宏总结了三方面的挑战。首先是数据共享与开放出现停滞甚至倒退。早在2015年,国务院就提出建设政府数据共享平台和推动公共数据开放的目标,政务服务便民化取得了显著成效,但公共数据的开放程度并未达到预期。
随着《数据安全法》《个人信息保护法》等法律的实施以及数据战略地位的提升,部分部门在共享上的意愿走低,公共数据开放竞争被进一步压缩,甚至从国际范围看数据的跨境流动也在趋严。梅宏强调,如果数据不能有效共享和流通,将会制约数字经济发展。
其次是公共数据授权运营路径过于单一。近年来,各地纷纷成立数据集团承接公共数据运营,但这些新机构在技术能力和体制机制创新方面仍有不足,难以激发民间和民营企业的创新活力。梅宏指出,公共数据本应体现“公共”属性,不能过度依赖授权运营而缺乏真正开放。他呼吁,应对政务数据和公共数据进行分级分类管理,推动真正意义上的公共数据开放。
“公共数据作为社会数据黏合剂甚至催化剂,对国家起到重要战略性基础作用,它的开放运营对于促进要素市场的发展、提升社会治理能力都具有很重要意义。”梅宏说道。
此外,数据应用被过度绑定在人工智能大模型上。梅宏表示,大模型训练固然是数据应用的重要场景,但并非唯一场景。传统的数据处理分析方法在许多领域依然不可替代。
他强调,“数据是体,智能为用”,二者如同燃料和火焰,没有燃料则火焰无法燃烧,强调数据质量决定大模型发展的“天花板”。当前社会对大模型的过度依赖,容易陷入“拿着锤子找钉子”的误区,从而加剧AI落地的困境。
梅宏最后强调,并非所有数据都能自然转化为生产要素,只有其中一部分具备相应价值。
张向宏:高质量数据成AI发展关键呼吁形成数据付费意识
“今年全行业最高频的热词有两个,第一个人工智能,第二个就是高质量数据集。高质量数据集构建已经引起了全社会的广泛关注和共识。”北京交通大学信息管理理论与技术国际研究中心(ICIR)特聘教授张向宏说道。随着人工智能正加速落地到千行百业,高质量数据集成为影响人工智能快速发展的重要燃料。
8月28日上午,张向宏接受媒体采访时指出,人工智能发展的三大要素算力、算法和数据中,新的瓶颈正在显现,即高质量数据的缺乏。
他提到,市场面临“作坊化生产”“企业规模偏小”以及“缺乏付费购买数据意识”等挑战。他呼吁,政府应率先建立制度化的数据购买和使用机制。
张向宏指出,目前我国高质量数据集的构建仍存在明显问题。首先,行业整体仍处于“作坊化生产”阶段,自动化和智能化程度较低。其次,数据建设企业规模偏小,水平不高。
更重要的是,社会整体缺乏“花钱买数据”的意识。无论政府、企业还是个人,普遍习惯于花钱买算力、买模型,却没有花钱购买数据的习惯。这导致政府无法直接公开涉密的原始数据层面,但又缺乏预算支持高质量数据集的加工和供给。企业之间也普遍存在“要上游数据免费给我,但不给下游数据”的单向共享现象。张向宏呼吁推动政府率先垂范,建立付费购买和使用数据的习惯,形成数据价值认可的氛围。
值得关注的还有,地方探索正在提供有益经验。例如,深圳继“算力券”之后推出“语料券”,在供给方、需求方和交易环节均给予补贴支持。供给方上传高质量数据集可获最高200万元补贴;需求方购买高质量数据集也可获补贴;交易环节则要求通过数据交易所完成。上海、北京等地也在探索类似机制,如语料交易在北京大数据交易所已占比超过八成,部分地区还在尝试以高质量数据集“作价入股”。
采写:南都记者李玲黄莉玲发自贵阳
- 上一篇:沈佳润史上最无语原唱
- 下一篇:美艘军舰名士兵逼近委内瑞拉