购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

三、信息时代下的大数据与云计算

大数据的爆发性增长和互联网技术的飞速发展催生了云计算。大数据巨大的数据量使得传统的单机运算无法进行,云计算通过将计算分布在大量的分布式计算机而非本地计算机或远程服务器中从而使数据得以利用,这样的服务基于互联网使普通用户受益,使得无法接触高性能计算的用户也可以享受每秒百万亿次的计算能力。

所谓的云计算,从广义上讲,它是一种动态的、易扩展的,且通常是通过互联网提供虚拟化资源的计算方式。从狭义上讲,它是指IT基础设施的交付和使用模式,通过网络以按需、易扩展的方式获得所需的资源(硬件、平台、软件)。提供资源的网络被称为“云”。云计算是分布式处理(distributed computing)、并行处理(parallel computing)和网格计算(grid computing)的发展,通过利用非本地或远程服务器(集群)的分布式计算机为互联网用户提供服务(计算、存储、软硬件等服务),从而有效地提高了对软硬件资源的利用效率,使用户通过云计算享受高性能并行计算所带来的便利。 MM67PeuwOT/rY6gFKagwQnqcMbzutBtq4NbbV2oSi4ExFysWQ2mh/MRdHe5facc+



四、科学研究的第四范式

随着大数据及相关信息技术的发展,科学研究的知识基础发生了革命性的变化。通过各类观察、感知、计算、仿真、模拟、传播等,科研领域的大数据正迅速产生、广泛传播和有效保存,正在逐渐成为科学研究的新基础和有力工具。尽管科学界一直在与数据打交道,但大数据的洪流也在改变着人们对数据及其作用的认识。当数据海量化、泛在化、开放化、网络化和计算化时,它的作用就发生了根本性变化。2007年,已故的图灵奖得主吉姆·格雷(Jim Gray)在他最后一次演讲中描绘了数据密集型科研“第四范式”(the fourth paradigm)的愿景。将大数据科研从第三范式(计算机模拟)中分离出来单独作为一种科研范式,是因为其研究方式不同于基于数学模型的传统研究方式。这为脑卒中的临床研究提供了新的方向。

2009年10月,微软公司发布了《第四范式:数据密集型科学发现》一书的英文版。这是国际上第一本系统描述大数据现象、深刻揭示其对科学研究的革命性影响的著作,对大数据时代如何理解和组织科学研究、科研管理和科研服务具有重要的意义。该书扩展了吉姆·格雷的思想,基于数字科研(e-Science)提出了科学研究的第四范式,即以大数据为基础的数据密集型科学研究,从地球环境、健康医疗、科学的基础架构以及学术交流等四个方面,对数据密集型科学研究的愿景进行了探讨,就如何充分利用科学发展的第四范式提供了深刻见解。2012年11月,《第四范式:数据密集型科学发现》一书的中文版出版。

e-Science这一术语最早由英国科学家于2000年提出,用以概括在信息化基础设施支持下所开展的科学研究活动所需要的一系列工具和技术。如今,随着大数据时代的到来,科学发展正在迈入一个新阶段,科研的方法也从之前的实验型科研(experimental science)、理论型科研(theoretical science)、计算型科研(computational science)推进到第四范式——数据密集型科研(data-intensive science)。科学研究第四范式,将带来科学研究的革命。当科研人员可以方便地从宏观到微观、从自然到社会获得海量实时的观察和(或)实验数据,当这些海量数据普遍地可网络获取、可计算、可开放关联,当对这些数据进行分析、更新、扩展的方法和技术成为科学家和公众的普惠性工具时,知识成为可以被及时更新、广泛连接、灵活计算的活的生命体,可个性化地、动态地、交互地、智能化地嵌入到人们的研究、学习、管理和生活中,许多激动人心的潜力将被进一步开发,许多未知的领域和方向将呈现在人们面前。通过第四范式——数据密集型科研将更加有利于临床医学的研究推动和发展。 MM67PeuwOT/rY6gFKagwQnqcMbzutBtq4NbbV2oSi4ExFysWQ2mh/MRdHe5facc+

点击中间区域
呼出菜单
上一章
目录
下一章
×