协议(Protocol)是通信的双方(或多方)必须都遵守的一组约定(规则)。
HTTP(Hyper Text Transfer Protocol,超文本传输协议)是用于从WWW(World Wide Web,万维网)服务器传输超文本到本地浏览器的传送协议。
HTTP 协议是 TCP/IP 协议族中应用层协议 , 通过 HTTP 协议 , 可以很容易实现 Web 通信 。HTTP协议是现在Internet上最重要、使用得最多的协议。它基于请求/响应,规定了浏览器可发送给服务器什么样的请求和得到Web服务器什么样的响应,也就是说,HTTP协议就是计算机与计算机之间用来传输信息的,它规定了浏览器和Web服务器之间通信的格式。
B/S模式即Web浏览器和Web服务器模式,它是基于HTTP协议的,用户界面是通过Web浏览器来实现的,主要业务逻辑在Web服务器端实现,形成所谓的三层架构,把各个功能模块划分为界面层(UI)、业务逻辑层(BLL)和数据访问层(DAL)三层,各层之间采用接口相互访问,并把对象模型的实体类(Model)作为数据传递的载体,如图 1.4 所示。三层架构区分层次的目的是“高内聚,低耦合”,开发人员分工更明确,将精力更专注于应用系统的核心业务逻辑的分析、设计和开发,加快项目进度,提高了开发效率,有利于项目的更新和维护工作。
图 1.4 界面层、业务逻辑层和数据访问层组成的三层架构
HTTP协议制订了通信双方需要遵守的规则。客户端向服务器提出请求、发送数据,如图 1.5 所示。服务器按照一定的规则做出响应,并返回客户端需要的数据。从本质上说,HTTP 协议是规定客户端怎么 “ 问 ”, 服务器怎么 “ 答 ” 的协议 。
HTTP通信机制是在一次完整的HTTP通信过程中,Web浏览器与Web服务器之间将完成下列 5 个步骤:
图 1.5 HTTP协议通信示意图
在HTTP工作开始之前,Web浏览器要通过网络与Web服务器建立TCP连接,一般TCP连接的端口号是 80。
一旦建立了TCP连接,由HTTP客户端(浏览器)发起一个请求。
例如:GET/sample/hello.jsp HTTP/1.1
浏览器发送其请求命令之后,还要以头信息的形式向Web服务器发送一些别的信息,之后浏览器发送一行空白行来通知服务器,表示它已经结束了该头信息的发送。
HTTP服务器则在那个端口监听客户端发送过来的请求。一旦收到请求,服务器向客户端发回响应消息,响应消息的状态行(第一行)是协议的版本号和应答状态码,比如“HTTP/1.1 200 OK”,消息的消息体可能是请求的实际数据等信息。Web服务器向浏览器发送头信息后,它会发送一个空白行来表示头信息的发送到此结束。
客户端接收服务器所返回的信息通过浏览器显示在用户的显示屏上,然后客户机与服务器断开TCP连接。
一次完整的HTTP通信过程如图 1.6 所示。
通常Web服务器向浏览器发送了请求数据,它就要关闭TCP连接,然后如果浏览器或者服务器在其头信息加入了这行代码:Connection:keep-alive,则TCP连接在发送后将仍然保持打开状态,这样浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。
HTTP请求方法通常包括GET和POST方法。
GET方法是默认的HTTP请求方法,一般用GET方法来提交表单数据,然而用GET方法提交的表单数据只经过了简单的编码,同时它将作为URL的一部分向Web服务器发送,因此如果使用GET方法来提交表单数据就存在安全隐患。例如下面的地址栏URL就是通过GET方法请求的:
图 1.6 一次完整的HTTP通信过程
“?”之后的内容就是参数即用户在表单提交的内容。另外,由于GET方法提交的数据是作为URL请求的一部分,而各Web服务器对URL有长度限制,解决办法就是修改nginx、tomcat等使用到的应用服务器,让它们支持更大的Request Header缓冲区,当然根本解决办法是不要通过GET方式传递超长的参数。
POST方法是GET方法的一个替代方法,它主要是向Web服务器提交表单数据,尤其是大批量的数据。通过POST方法提交表单数据时,数据不是作为URL请求的一部分,而是作为标准数据传送给Web服务器,从理论上讲,POST是没有大小限制的,它克服了GET方法中的信息无法保密和超长参数无法传输的问题。因此,出于安全考虑以及保护用户隐私,通常表单提交时采用POST方法。