第三章 http报文 - 《《HTTP权威指南》概念手册》

内容提要

内容提要

这一章内容较多，介绍了http报文的诸多相关概念，譬如起始行、首部、主体以及它们代表的含义等！同时还介绍了常见的状态码及其含义，常见的首部字段及其含义。本章内容较丰实，所以概念模糊的部分可以参阅原书相关章节！

　报文流

这是形容http报文的

http报文是以一种类似的流的方式来发送数据的，所以报文流讲述了http报文的一些客观状态，相关术语：流入、流出形容事务处理。http报文任何时候是从上游向下游流入的！其中进过的节点既可能是上游，有可能是下游，如果从某个节点流出，那么相对于此节点流入的那个节点，它就是上游，翻过它就是下游！

　报文的组成部分

首先说明，报文由三个部分组成，起始行、首部、主体。起始行和首部都是ascll文本，而主体则可以是任意类型文件，比如二进制，视频等！且起始行和首部都已一个crlf作为结束符，并且首部与主体之间应始终存在一个以crlf序列作为结束的空行。当然了为了兼容老版本的http，这里有时并不是那么严格要求非要crlf同时存在！

报文的语法

http报文分为请求报文和相应报文，其语法分别如下：

    //请求报文
    <method> <request-URL> <version>
    <headers>
    <entity-body>

    //响应报文
    <version> <status> <reason-phrase>
    <headers>
    <entity-body>

方法

安全方法

能在服务器端有操作的就是非安全方法，比如delete、put、post,不在服务器端有操作的就是安全方法，比如get、header，当然了安全方法并非不能在服务器端有操作，这是开发者可以控制的！

GET方法用于请求服务器端发送某个资源
HEADER方法跟GET方法类似，区别就是不返回主体
PUT方法用于向服务器端修改、插入数据
POST方法用于向服务器端发送数据
TRACK方法用于向服务器端请求报文在发送的过程中经过了什么修改，主要用于测试
OPTIONS用于请求服务器告知其支持什么功能
DELETE用于向服务器删除某个指定的资源
扩展方法其实类似于自定义方法

　状态码

100-199 信息性状态码
200-299 成功状态码（常见200表示请求成功）
300-399 重定向状态码（常见302重定向）
400-499 客户端错误状态码（常见404，请求资源不存在）
500-599 服务端错误状态码

常见状态码及其含义整理


    状态码                原因短语                     含义
    100                    Continue             说明收到了请求的初始部分，请客户端继续，发送了这个状态码之后，
                                            服务器在收到请求之后必须进行响应。
    101                    Switching Protocols 说明服务器正在根据客户端的指定，将协议切换成Update首部所列的
                                            协议
    200                 OK                    请求没问题，实体的主体部分包含了所请求的资源
    201                 Created                用于创建服务器对象的请求（比如，PUT）。响应的实体主体部分中
                                            应该包含各种引用了已创建的资源的URL，Location首部包含的则是最具体的引用。
    202                 Accepted            请求已被接受，但服务器还未对其执行任何动作。不能保证服务器会完成这
                                            个请求；这只是意味着接受请求时，它看起来是有效的。服务器应该在实体的主体部分包含对请求状态的描述，或许还应该有对请求完成时间的估计（或者包含一个指针，指向可以获取此信息的位置）
    203                 Non-Authoritative   实体首部包含的信息不是来自原远端服务器，而是来自于资源的一份副本。 
                        Information         如果中间节点上有一份资源副本，但无法或者没有对它所发送的与资源有关的
                                            元信息进行验证，就会出现这种情况
    204                    No     Content         响应报文中包含若干首部和一个状态行，但没有实体的主体部分。主要用于在
                                            浏览器不转为显示新文档的情况下，对其进行更新（比如刷新一个表单页面）
    205                    Reset Content         另一个主要用于浏览器的代码。负责告知浏览器清除当前页面中的所有HTML
                                            表单元素
    206                    Partial Content     成功执行了一个部分或Range(范围)请求。稍后我们会看到，客户端可以通过
                                            一些特殊的首部来获取部分或某个范围内的文档————这个状态码就说明范围请求成功了。
    注：在对那些包含了重定向状态码的非HEAD请求进行响应时，最好要包含一个实体，并在实体中包含描述信息和指向（多个）重定向URL的链接。如：
    HTTP/1.1 301 OK
    Location: http://www.gentle-grooming.com/
    Content-Length: 56
    Content-Type: text/plain
    Please go to our partner site,
    www.gentle-grooming.com
    300                    Multiple Choices     客户端请求一个实际指向多个资源的URL时会返回这个状态码，比如服务器
                                            上有某个HTML文档的英语和法语版本。返回这个代码时会带有一个选项列表；这样用户就可以选择它希望使用的那一项了。有多个版本可用时，客户端需要沟通解决。
    301                    Moved Permanently    在请求的URL已被移除时使用。响应的Location首部中应该包含资源现在所处
                                            的URL
    302                 Found                 与301状态码类似，但是，客户端应该使用Location首部给出的URL来临时定位
                                            资源。将来的请求仍应该使用老的URL
    303                 See Other             告知客户端应该用另一个URL来获取资源。新的URL位于响应报文的Location
                                            首部。其主要母的是允许POST请求的响应将客户端定向到某个资源上去
    304                  Not Modified         客户端可以通过所包含的请求首部，使其请求变成有条件的。如果客户端发起
                                            了一个条件GET请求，而最近资源未被修改的话，就可以用这个状态码来说明
                                            资源未被修改。带有这个状态码的响应不应该包含实体的主体部分。
    305                 Use Proxy              用来说明必须通过一个代理访问资源；代理的位置由Location首部给出。很
                                            重要的一点是，客户端是相对某个特定资源来解析这条响应的，不能假定所有请求。甚至所有对持有请求资源的服务器的请求都通过这个代理进行。如果客户端错误地让代理介入了某条请求，可能会引发破坏性的行为，而且会造成安全漏洞。
       307                    Temporary Redireat 与301状态码类似；但客户端应该使用Location首部给出的URL来临时定位资源
                                               。将来的请求应该使用老的URL
       400                 Bad Request         用于告知客户端发起了一个错误的请求
       401                 Unauthorized         返回适当的首部，用于获取客户端访问资源的权限
       402                 Payment Required    此状态码未使用，保留
       403                 Forbidden           服务器拒绝请求，可在响应主体中告知原因
       404                  Not Found           用于告知客户端请求的资源在服务器不存在
       405                 Method Not Allowd   告知客户端不支持当前方法，并在Allow首部返回支持的方法
       406                 Not Acceptable         没有客户端支持的资源类型
       407                 Proxy Authentication  跟401类似，不过用户代理服务器
                           Requireed 
       408                 Request Timeout     超时提醒
       409                  Conflict            请求会造成服务器冲突
       410                  Gone                   跟404一样，只不过服务器曾经拥有过该请求资源
       411                 Length Required    要求客户端发送Content-Length首部
       412                 Precondition Failed  部分条件验证不通过
       413                   Request Entity Too Large  客户端发送的主体超过了服务器的希望的长度
       414                 Request  URL Too Long   客户端请求的时间比服务希望的时间长
       415                 Unsupported Media Type     服务器无法理解客户端请求的主体类型
       416                 Requested Range Not    请求报文所请求的是指定资源的某个范围，而此范围无效或无法满足时
                           Satisfiable               ，使用此状态码
       417                    Expectation Failed         请求中包含Expect首部，服务器无法满足
       500                    Internal Server Error  服务器错误
       501                 Not Implemented         请求超出了服务器能处理的范围
       502                 Bad Gateway             作为代理或网关使用的服务器从请求响应链的下一条链路上收到了一条
                                                   伪响应（比如，它无法连接到其父网关）时，使用此状态码
       503                    Service Unavailable     用来说明服务器现在无法为请求提供服务，但将来可以。如果服务器
                                                   知道什么时候资源会变为可用的，可以在响应中包含包含一个
                                                   Retry-After首部。
       504                 Gateway Timeout         与状态码408类似，只是这里的响应来自一个网关或代理，它们在等待另
                                                   一服务器对其请求进行响应时超时了
    505                 HTTP Version Not        服务器收到的请求使用了它无法或不愿支持的协议版本时，使用此
                        Supported                 状态码。有些服务器应用程序会选择不支持协议的早起版本

常见首部字段含义介绍

注：首部分为通用首部、请求首部、响应首部、主体首部、扩展首部！
通用首部


   通用的信息性首部
   首部                                         描述
   Connection               允许客户端和服务器指定与请求/响应连接有关的选项
   Date                     提供了日期的时间标志，说明报文是什么时间创建的
   MIME-Version             给出了发送端使用的MIME版本
   Trailer                  如果报文采用了分块传输编码方式，就可以用这个首部列出位于报文拖挂部分的首部集合
   Transfer-Encoding        告知接收端为了保证报文的可靠传输，对报文采用了什么编码方式
   Update                   给出了发送端可能想要“升级”使用的新版本或协议
   Via                      显示了报文经过的中间节点（代理、网关）
   通用缓存首部
   首部                                 描述
   Cache-Control            用于随报文传送缓存指示
   Pragma                   另一种随报文传送指示的方式，但并不专用缓存

请求首部


    请求的信息性首部
    首部                                描述
    Client-IP               提供了运行客户端的机器的IP地址
    From                    提供了客户端用户的E-mail地址
    Host                    给出了接收请求的服务器的主机名和端口号
    Referer                 提供了包含当前请求URL的文档的URL
    UA-Color                提供了与客户端显示器的显示颜色有关的信息
    UA-CPU                  给出了客户端CPU的类型或制造商
    UA-Disp                 提供了与客户端显示器（屏幕）能力有关的信息
    UA-OS                   给出了运行在客户端机器上的操作系统名称及版本
    UA-Pixels               提供了客户端显示器的像素信息
    User-Agent              将发起请求的应用程序名称告知服务器
    Accept首部
    首部                                  描述
    Accept                  告诉服务器能够发送那些媒体类型
    Accept-Charset          告诉服务器能够给发送那些字符集
    Accept-Encoding         告诉服务器能够发送那些编码方式
    Accept-Language         告诉服务器能够发送那些语言
    TE                      告诉服务器可以使用那些扩展传输编码
    条件请求首部
    首部                                描述
    Expect                  允许客户端列出某请求所要求的服务器行为
    If-Match                如果实体标记与文档当前的实体标记相匹配，就获取这份文档
    If-Modified-Since       除非在某个指定的日期之后资源被修改过，否则就限制这个请求
    If-None-Match           如果提供的实体标记与当前文档的标记不相符，就获取文档
    If-Range                允许对文档的某个范围进行条件请求
    If-Unmodified-Since     除非在某个指定日期之后资源没有被修改过，否则就限制这个请求
    Range                   如果服务器支持范围请求，就请求资源的指定范围
    安全请求首部
    首部                                  描述
    Authorization           包含了客户端提供给服务器，以便对其自身进行认证的数据
    Cookie                  客户端用它向服务器传送一个令牌————它并不是真正的安全首部，但确实隐含了安全功能
    Cookie2                 用来说明请求端支持的cookie版本
    代理请求首部
    首部                                  描述
    Max-Forward             在通往源端服务器的路径上，将请求转发给其他代理或网关的最大次数————与TRACE方法一同
                            使用
    Proxy-Authorization     与Authorization首部相同，但这个首部是在与代理进行认证时使用的
    Proxy-Connection        与Connection首部相同，但这个首部是在与代理建立连接时使用的

响应首部


    响应的信息性首部
    首部                                        描述
    Age                     （从最初创建开始）响应持续时间
    Public                   服务器为其资源支持的请求方法列表
    Retry-After              如果资源不可用的话，在此日期或时间重试
    Server                   服务器应用程序软件的名称和版本
    Title                    对HTML文档来说，就是HTML文档的源端给出的标题
    Warning                  比原因短语中更详细的警告报文
    协商首部
    首部                                  描述
    Accept-Ranges           对此资源来说，服务器可接受的范围类型
    Vary                    服务器查看的其他首部的列表，可能会使响应发生变化；也就是说，这是一个首部列表，
                            服务器会根据这些首部的内容挑选处最合适的资源版本发送个客户端
    安全响应首部
    首部                                    描述
    Proxy-Authenticate      来自代理的对客户端的质询列表
    Set-Cookie              不是真正的安全首部，但隐含有安全功能；可以在客户端设置一个令牌，以便服务器对客户端
                            进行标志
    Set-Cookie2             与Set-Cookie类似
    WWW-Authenticate        来自服务器的对客户端的质询列表

实体首部


  实体的信息性首部
  首部                                          描述
  Allow                       列出了可以对此实体执行的请求方法
  Location                    告知客户端实体实际上位于何处；用于将接收端丁香到资源的位置上去
  内容首部
  首部                                          描述
  Content-Base                解析主体中的相对URL时使用的基础URL
  Content-Encoding            对主体执行的任意编码方式
  Content-Language            理解主体时最适宜使用的自然语言
  Content-Length              主体的长度或者尺寸
  Content-Location            资源实际所处的位置
  Content-MD5                 主体的MD5校验和
  Content-Range               在整个资源中此实体表示的字节范围
  Content-Type                这个主体的对象类型
  实体缓存首部
  首部                                                  描述
  ETag                        与此实体相关的实体标记
  Expires                     实体不再有效，要从原始的源端再次获取此实体的日期和时间
  Last-Modified               这个实体最后一次被修改的日期和时间