



数据从哪里来很重要,除了单位内部长期累积的数据库之外,用户也常有引入外部数据的需求。数据越多、越完整,越可以发挥其隐藏的价值。外部数据除了来自商业合作、策略交换外,开放数据(Open Data)是近年来兴起的一种数据发布方式。
开放数据是一种新型的数据发布方式,基于群众外包的概念,对数据采用管理机制,让数据不受版权、专利权的限制。开放数据将数据开放给公众,提供给所有人,大幅降低了数据取得的难度。任何人都可以使用开放数据,使得更多有趣的应用能够结合起来,进而创造更多的价值。
物联网的第一次革命是数字化,将大量的纸质数据电子化。得益于计算机的高速运算,节省了人力成本,以及缩短数据到信息的时间,数年来,人们累积了大量的数据资本。第二次的物联网浪潮是数据分析与人工智能,运算数据与演算法,从数据中探索有意义的知识,进而产生智慧。创新的本质在于创造与结合,我们相信将数据开放,能够带来新的价值。
简单衡量开放数据的两个特点是可用性与可取得性,即数据该用什么方式存取及可以用于何处。通过数据的互用性(Interoperability),数据得以流通与使用,开放数据得以发挥其真正价值。
公开的数据不一定是开放数据,开放数据必须要有更好的可用性与可取得性。可用性可以从数据的栏位、数据的可扩充性等指标来看,必须达到一定的质量水平,才有利用价值。可取得性通常可以通过数据释出的格式及渠道,是不是机器友善、机器可读的来衡量。例如,早期,许多人为了追求数量,在网上发布了许多相似的数据(有的以PDF格式出现)。然而,这种数据根本无法直接运用,充其量只能算是公开的数据,称不上是好的开放数据。
全球信息网(World Wide Web,WWW)创始者Tim Berners-Lee就基于数据的可用性与可取得性,提出了一套开放数据的星等制度,协助数据拥有者检视其数据的发布品质,并提供改善的方向。
以下为大家推荐几个国内外重点提供开放数据的平台。
● 北京市政务数据资源网:http://www.bjdata.gov.cn/。
● 上海市政府数据服务网:http://www.datashanghai.gov.cn/。
● 深圳市政府数据开放平台:https://opendata.sz.gov.cn/。
● 中国气象开放服务平台:http://openweather.weather.com.cn/。
● 中国国家数据中心:http://data.stats.gov.cn/。
● 英国国家数据中心:https://data.gov.uk/。
● 日本统计局:http://www.stat.go.jp/。
● 美国政府开放数据:https://www.data.gov/。
● 欧盟数据平台:https://www.europeandataportal.eu/。
● 世界经济贸易合作组织数据库:https://data.oecd.org/。
● 世界银行开放数据:https://data.worldbank.org.cn/。
● 世界卫生组织:http://apps.who.int/gho/data/node.home。
● Google BigQuery公开数据集:https://cloud.google.com/bigquery/public-data/。
● Google开放数据搜索:http://www.google.com/publicdata。
● 亚马逊开放数据:https://aws.amazon.com/cn/datasets/。