“数据的获取、处理和应用在人类社会发展中一直扮演着重要角色。从文明之初的‘结绳记事’,到文字发明之后的‘文以载道’,再到近现代科学的‘数据建模’,承载了人类基于数据和信息认识世界的努力和巨大进步。”1月10日上午,一场主题为“推进大数据应用 繁荣数字经济发展”的培训讲座正在月坛南街38号大院里进行。这是国家发改委“学习贯彻党的十九大精神”集中轮训系列讲座暨第37期“发展改革大家谈”。
开讲前,已经充分饱和的“教室”后方不断有新“学员”入场加座,甚至过道的空隙都被塞得满满当当,“三九天”的严寒也难挡大家的如火热情。这场讲座究竟为何如此“火热”?不仅因为“大数据”“数字经济”本身就是近来各界关注的热点话题,更是因为大家对此次培训的主讲人充满期待。梅宏,中国科学院院士,前不久在中共中央政治局第二次集体学习时就实施国家大数据战略为中央领导作了讲解,并谈了意见和建议。
本次培训由国家发改委秘书长李朴民主持。国家粮食局总工程师何毅、国家发改委人事司司长梁彦、高技术司司长任志武等参加。国家发改委机关和委属单位共600多名同志现场参加了学习。本次培训还开通了纵向网视频共享课堂,全国发展改革系统近2000名同志在38个分课堂进行了同步学习。
大数据开启第三次信息化浪潮
“大数据是信息化发展的新阶段。”这是习近平总书记在中共中央政治局第二次集体学习时作出的重要论断。
对此,专题辅导报告作了深入解读。梅宏首先回顾了大数据的产生和发展历程。“所谓大数据,是信息化到一定阶段之后的必然产物。大数据源于信息技术的不断廉价化与互联网及其延伸所带来的无处不在的信息技术应用。”他指出,大数据的出现有四个驱动力,即“摩尔定律”所驱动的指数增长模式;技术低成本化驱动的万物数字化;宽带移动泛在互联驱动的“人—机—物”广联连接;云计算模式驱动的数据大规模汇聚。
“大数据开启了信息化的第三次浪潮。”长期从事计算机领域研究的梅宏,见证了信息技术发展的历次浪潮。“PC机的广泛应用带来信息化的第一次浪潮,大约一直到上世纪90年代中期,是以单机应用为主要特征的数字化阶段。过去二十多年,从上世纪90年代中期到现在,信息化的第二次浪潮是以互联网应用为主要特征的网络化阶段。现在我们正在进入新的阶段,即以数据的深度挖掘和融合应用为主要特征的智慧化。”
在梅宏看来,信息技术的发展始终围绕能力、应用和成本三大目标。1946年~1995年,面向能力和成本的技术创新是信息技术发展的主线,揭示能力和成本规律的“摩尔定律”和“香农定律”分别主导计算机和通信技术的发展。1995年前后,互联网的商用价值开始显现,信息技术从能力主导向应用主导变迁,揭示应用和成本规律的“贝尔定律”和“梅特卡夫定律”占据主导地位。在这一阶段,技术发展与应用需求“双轮驱动”,相互促进,迭代发展,带来了20多年的持续高速发展。
梅宏预言,大数据应用需求将驱动信息技术体系重构,大约在2040年以后,面向能力和成本的技术创新将重新成为信息技术的发展主线,信息技术发展进入新的能力提升期。“在取得原理性突破之前,应用模式创新以及面向应用和成本的技术和集成创新仍将是发展主线。”
数字经济发展迎来历史性机遇
习近平总书记在中共中央政治局第二次集体学习时提出,要构建以数据为关键要素的数字经济。
数字经济是以新一代信息技术和产业为依托,继农业经济、工业经济之后的主要经济形态。数据是重要生产要素,网络是重要载体,信息技术应用是重要推动力。
梅宏认为,全球数字经济正处于成型展开期。这是根据英国经济学家卡萝塔?佩蕾丝对每次技术创新浪潮分导入期和展开期两个主阶段的划分。“从上世纪90年代中期开始,互联网进入商用并得到快速发展。历经二十多年的积累和储备,数据资源大规模集聚,其基础性、战略性凸显,我们将进入信息技术带动经济发展的爆发期、黄金期。”
中国在电子商务等数字化应用和信息技术创业投资方面已取得世界瞩目的成绩。根据麦肯锡2017年12月4日发布的《中国数字经济报告》,2016年,中国电子商务交易额占全球40%;中国个人消费交易额7900亿美元,是美国的11倍。此外,全世界262家“独角兽”(估值超过10亿美元的私营初创企业)中有1/3是我国企业,占全球“独角兽”企业总估值的43%。“中国正迎来发展数字经济的历史性机遇。立足新时代,发展数字经济是顺应时代趋势、抢抓发展机遇的重大战略。”梅宏说。
谈及我国大数据的生态现状,他指出,中国企业在现有大数据国际产业地图中极少出现,国际影响力不足;从事大数据应用的企业较多,掌握共性关键技术企业偏少。由于核心技术受制于人,我国信息技术长期存在“空心化、低端化”的问题。大数据是信息化发展的新阶段,信息技术体系进入“重构前夜”,我国信息技术发展将迎来“换道超车”的新契机。
“在大数据时代,软件开源和硬件开放已成为不可逆转的趋势,掌控开源生态,已成为国际产业竞争的焦点。参与融入、蓄势引领,是培育我国大数据产业生态的有效途径。”梅宏建议,应鼓励企业参与融入国际成熟开源社会,争取话语权;同时,汇聚国内软件资源和开源人才,打造自主开源生态,伺机实现引领发展。
发展大数据需规范引导审慎推进
大数据发展日新月异,已成为人类认识复杂系统的新思维、新手段,促进经济转型增长的新引擎,提升国家综合能力和保障国家安全的新利器,提升政府治理能力的新途径。
“当前大家更多地谈大数据的重要性,但在大数据的实际应用方面,还难尽如人意。”梅宏认为,当前,大数据应用尚处于初级阶段。描述性、预测性应用较多,指导性应用较少;基于单一数据源和已存在数据集的应用较多,基于多源多态数据和主动收集数据的应用较少;模型导向类应用较多,需求导向类应用较少。
他同时指出,大数据理论与技术也仍处于发展的早期阶段。尽管对大数据的定义已形成一致认知,但核心观点和命题尚存争议,比如,数据“大”与“小”的对立统一,“关联”与“因果”的辩证性等。对于未来是否有可能形成统一的“通用”技术体系,尚不明确。党政干部在利用大数据分析的结论辅助决策时,应该充分认识到,当前大数据的应用超前于理论,数据分析的结论往往缺乏坚实的理论基础,使用结论仍需保持谨慎。
谈到对数据共享开放的思考时,梅宏表示,重点是要打破信息系统之间的壁垒,但面临着一系列挑战,需要从法规、技术、标准等多方面协同发力破局。他建议,政务数据共享体系不宜一味追求物理集中,可逻辑互联先行,物理集中跟进。在一定层级上采用“物理分散、逻辑统一、管控可信、标准一致”的原则,在不改变现有信息系统与数据资源的所有权及管理格局的基础上,明晰责权利,即,数据应用部门提需求,数据拥有部门做响应,交换平台管理部门保流转。
此外,梅宏还注意到,我国各地数据中心建设存在过热的问题。他强调,各地在发展大数据的过程中,过于注重数据中心等基础设施投入,因地制宜和应用需求导向不够,可能导致超前投资、重复投资和能源浪费。“2016年,中国数据中心总耗电量超过1200亿千瓦时,已超过三峡水电站的全年发电量。”对此,他建议,我国近年数据中心投入应该做好顶层规划和示范引导,积极谋划,审慎推进。政府主导数据中心建设应在满足需求的前提下,力争高效率,不宜按照互联网企业先建设再发展、以低效率换取用户体验的“奢侈发展”模式。
对于大数据的未来发展,梅宏认为,“人们制造并采集数据的速度,总是领先于处理的技术,因此,大数据现象将长期存在。”