英语中的“互联网”(internet)一词由“互连”(interconnected)和“网络”(network)组合而成。所有连接到互联网的计算机、网站、服务器或设备,都拥有至少一个互联网协议地址(即IP地址),用于标识其位置。这相当于纬度和经度,用于确定用户在互联网中的位置。然而,IP地址并不直观,在浏览器中输入212.58.233.254比输入bbc.co.uk要复杂得多,也更不容易记住;加上所谓的动态IP地址让用户在互联网上的位置不断变化,进而增加了将用户定位到具体IP地址的难度。因此,我们在互联网架构中引入了一个便于用户操作的组件,称为域名系统(DNS)。
域名系统的诞生可以追溯到1983年,它由加州南加州大学的两位研究员保罗·莫卡派乔斯(Paul Mockapetris)和乔恩·波斯特尔(Jon Postel)发明。它类似于数字版的电话簿,可以帮助用户在不断发展的互联网上轻松追踪特定的网站、服务器或资源。然而,在域名系统问世之前,互联网“电话簿”实际上已经存在。在阿帕网时代,负责监管网络的人员就维护着一份名为hosts.txt的文件,其中记录了简单明了的重要网络节点地址。
每台连接到网络的设备都在本地存储了这份文件,但工作人员必须定期手动对其进行更新。随着用户数量不断增加,文件的更新工作变得越来越烦琐和耗时。因此,莫卡派乔斯和波斯特尔提出了域名系统的概念。域名系统可以将用户访问特定互联网位置的纯文本请求转换为计算机可以理解的请求。
时至今日,域名系统仍然不断更新,构建了一个分布式系统。全球各地的多个域名系统服务器相互协同,可以迅速进行地址转换。此外值得一提的是,波斯特尔还在1986年提出了顶级域名(TLD)的概念,如.com、.co.uk、.edu等。但遗憾的是,波斯特尔在1998年去世,年仅55岁。一时之间,部分参与互联网运营的人员忧心忡忡:由于波斯特尔还有太多关于互联网运作原理的秘密未公之于世,他的离世可能会对互联网的稳定性产生潜在影响。
从一个由人工手动维护的单一域名数据库,转向自动化、分布式的域名数据库,这实际上是互联网基础设施演进的缩影。然而,随着互联网的迅猛增长,域名系统的维护越来越具有挑战性,但令人惊讶的是,域名系统在这一演进过程中表现出惊人的稳定性,几乎没有出现重大问题。
我们对万维网的兴趣持续扩大,而万维网的应用范围也不断扩展,涵盖了应用程序、流媒体服务和云端文件存储等领域。与此同时,互联网的基础设施也在不断扩张和壮大。但是当追溯网络的发展历程时,我们不难发现其中的变化。最初,互联网是一个自由竞争的环境,其中以美国本土和个人创建的网站为主导。然而随着时间的推移,少数大型提供商掌握了垂直整合的网络界面,也就是将多个功能集成在一个平台上的界面。在这个演进过程中,通过铜电缆和连接传输的互联网数据,逐渐集中到了极少数的网站和平台上(后文详述)。
根据桑德怀恩公司(Sandvine) 的分析,全球互联网48%的流量由六家大型科技公司掌握,它们分别是网飞(Netflix)、微软(Microsoft)、苹果(Apple)、亚马逊(Amazon)、脸书(现更名为Meta)及谷歌母公司Alphabet。尽管这一比例在2022年下降了9%,但这依然表明,我们生活中的大部分内容以及构成这些内容的数据集中在少数几家公司手中,这一事实引起了人们的担忧。
早期互联网探索者曾梦想视频可以即时传输至全球,但当时,这还只是一个美好而遥不可及的梦。如今,这个梦想已经成为现实:互联网数据传输中,三分之二的内容是视频。网飞和YouTube的视频流量占据了整体视频流量的约四分之一,而抖音尽管经历了快速增长,其视频类互联网流量仅占总体流量的3.5%左右。