大数据应用发力亟须顶层设计——第3届科学数据大会侧记

发布时间:2016-09-01 作者:上海科学院
2016年09月01日    来源:上海科技报    作者:王毅俊
 
目前,科学大数据正以其前沿性、引领性、颠覆性的特质使科学研究发生深刻变革。与此同时,科学大数据不仅服务科学研究,也将服务于产业应用,促进行业发展。在国家大数据战略大背景下,无论是在科学研究领域上,还是国民经济建设中,科学大数据必将起到越来越重要的作用。日前,在上海举行的第3届科学数据大会上,专家们建议:加快推动国家科学数据的开放共享,积极谋划科学数据开放共享基础条件建设,加快科学数据服务创新发展。
大数据应用让科研发生变革
国家科技基础条件平台中心在大会上提供的数据显示,近十年我国公共财政先后支持建设了上万个规模不等、质量各异、应用程度不同的科学数据库。以生命科学领域为例,全国基因组测序仪每年产生原始数据10PB(存储单位,2的50次方个字节),中科院牵头立项的首个精准医学项目测序产生的原始数据量约为200-500TB(存储单位,10的9次方个字节)。重大科研基础设施建设与更新也引发数据的快速积累,比如大型强子对撞机实验每年采集的原始数据超过过去10年通过大型电子-正电子对撞机产生数据的600倍,散裂中子源每年产生原始数据1TB,遥感卫星每年产生数据超过3PB。国家科技基础条件平台中心主任叶玉江认为,正是这些海量科学数据,对生命科学、天文学、空间科学、地球科学、物理学等多个学科领域的科研活动带来了令世界瞩目的成果。大数据让科学研究方法发生了重要的变革,开展科学研究首先要尽可能多地收集、分析和研究与主题相关的科学数据。
大数据应用顽疾亟待破除
不过,在叶玉江看来,我国科学数据建设仍然没有形成有效的开放共享体系。一方面,科学数据广泛分布在课题组、科学家,甚至科研人员个人手中,一些行业部门或单位的数据库往往局限于本部门、本单位使用,甚至个人专用,缺乏部门间的交流和沟通,更没有形成面向社会的科学数据开放共享。另一方面,长期以来,由于国家和单位在科学数据方面的经费投入不足,导致许多科学数据库按照项目方式一次性建设,缺乏持续的数据来源,已濒临“死库”而逐渐降低或丧失其应用价值。这些问题已经成为科技界和科技管理部门正在思考并着力解决的突出问题。
中科院计算机网络信息中心主任廖方宇表示,科研信息化作为大数据时代的主旋律,无论是在信息技术产业还是在全球经济都扮演着助推器的作用,引起欧美一些发达国家高度重视。他们致力于将更多数据转化为知识,继而转化为生产力,领先于全球形成新的经济增长点。他构想,“十三五”期间,应发挥我国已有的基础和优势,做好顶层设计。
廖方宇还表示,在建设国家科学数据中心的过程中,需要通过政策解决科研单位和个人对于科学数据的“保护”,这是共享数据长期存在的问题。在服务硬件方面,则要着力提升网络传输能力、数据存储能力、数据处理能力和不同领域数据的融合能力。
 
  

相关信息