2015年11月30日,中国科学院计算机网络信息中心科学数据中心主任,CODATA中国委员会秘书长黎建辉(左)做客新华访谈,与网友交流科学数据公开相关话题。
以下为文字实录:
主持人:首先给大家简单介绍下中科院计算机网络信息中心数据中心的定位和职责?
黎建辉:中科院计算机网络信息中心是负责中科院信息化建设和管理信息化的一个机构,其中有好几个部门,我们数据中心关注科学数据,是推进整个科学院的数据开放和共享以及应用,使科学数据为国民经济建设和社会发展发挥更大的价值,这是我们在做的一些主要的工作。
主持人:科学数据公开确实会带来很多科技创新,像黎主任说的这些例子,这些数据的公开服务对象主要还是科学家,那么我们怎么是服务科学家的,具体做了哪些的工作,有何特色?
黎建辉:我们这边做几个方面的事情。第一,一个根本的宗旨就是让科学数据不要变成科学家个人的私有财产。由于在中国,所有科学家的科研活动和获取数据都是来自国家公共财政的钱,你用并不影响别人用,就有开放的天然的特点。我们做的一个工作一直是推动科学院的科学家把数据更便捷的开放。
第二,这些数据开放处理之后,我们需要把这些数据集成起来变成一个统一的服务平台,就是中国科学院数据云,为使用者提供一站式的检索和访问服务,这两件事跟今天的主题相关,就是推动科学家用成本低很方便的方式把数据释放出来,把这些数据汇集起来为科学发现和公众服务。
第三,我们一直跟科学家合作,推动大数据驱动下,或者数据密集型的科学发现的一种新的范式。在三五年前,微软的吉姆格雷写过一本书是《第四范式:数据密集型科学发现》,有一个最主要的观点就是未来的科学研究是基于大量的数据来做,合作的方式和研究的方式都会变化,通过这样一个变化让我们在科学发现里面解决一些以前解决不了的问题,甚至会解决更大尺度更复杂的问题。在这个过程里面,我们一直尝试在推动科学院的科学家怎么样用大数据的手段和技术开展数据密集型的科学发现,我们怎么样去提供更好的数据的基础设施储存、处理,包括一些新的工具。我们更好的给他们发展一些在科研活动里面新的方法和工具。