百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

应用层协议HTTP和HTTPS,一篇文章学会

off999 2025-03-23 22:19 76 浏览 0 评论

HTTP

HTTP 协议详解

HTTP(Hypertext Transfer Protocol,超文本传输协议)是用于分布式、协作式和超媒体信息系统的应用层协议。它最早用于万维网(WWW),是浏览器和服务器之间通信的核心协议。HTTP 协议是无状态的,意味着每次请求之间没有保持状态,这也带来了高效性和扩展性。


1. HTTP 的基本工作原理

HTTP 的工作方式是请求-响应模型。客户端(通常是浏览器)发送一个请求到服务器,服务器处理请求后返回一个响应。该模型包括以下步骤:

  1. 建立连接:客户端与服务器通过 TCP 连接通信,默认端口为 80(HTTPS 使用 443 端口)。
  2. 发送请求:客户端发送 HTTP 请求报文给服务器。
  3. 服务器处理请求:服务器接收请求并处理,例如返回一个网页或资源。
  4. 服务器响应:服务器将处理后的数据封装在响应报文中返回给客户端。
  5. 关闭连接:根据情况,连接可能会关闭,或者保持一段时间以等待更多请求(HTTP/1.1 默认启用持久连接)。

2. HTTP 请求报文

HTTP 请求报文由请求行请求头部字段请求体组成。

  • 请求行
    • 包含 请求方法请求 URIHTTP 版本,例如:
GET /index.html HTTP/1.1
    • 常见的请求方法
      • GET:请求资源,通常用于获取数据。
      • POST:向服务器提交数据(表单、文件上传等)。
      • PUT:上传文件或替换资源。
      • DELETE:删除指定资源。
      • HEAD:仅请求头部,不返回资源体。
      • OPTIONS:询问服务器允许的请求方法。
  • 请求头部字段
    • 包含了有关请求的额外信息,例如:
      • Host:指定目标主机。
      • User-Agent:客户端的类型和版本信息。
      • Accept:客户端支持的内容类型(MIME 类型)。
      • Content-Type:请求数据的类型,通常用于 POST 和 PUT 请求。
  • 请求体
    • 包含客户端发送的数据(在 POST、PUT 请求中使用)。GET 请求没有请求体。

3. HTTP 响应报文

服务器处理请求后,返回 HTTP 响应报文。响应报文包含状态行响应头部字段响应体

  • 状态行
    • HTTP 版本状态码状态短语 组成。例如:
HTTP/1.1 200 OK
    • 常见的状态码
      • 1xx:信息类,表示接收的请求正在处理。
      • 2xx:成功,表示请求已被服务器成功处理。
        • 200 OK:请求成功。
        • 201 Created:资源成功创建。
      • 3xx:重定向,要求客户端采取进一步操作。
        • 301 Moved Permanently:资源已被永久移动。
        • 302 Found:临时重定向。
      • 4xx:客户端错误,表示请求有问题。
        • 400 Bad Request:请求有语法错误。
        • 401 Unauthorized:未经授权,需要身份验证。
        • 404 Not Found:请求的资源不存在。
      • 5xx:服务器错误,表示服务器处理请求时出错。
        • 500 Internal Server Error:服务器内部错误。
        • 502 Bad Gateway:无效响应的网关。
  • 响应头部字段
    • 提供关于响应的额外信息,例如:
      • Content-Type:返回的资源类型(MIME 类型)。
      • Content-Length:响应体的长度。
      • Set-Cookie:设置客户端的 cookie。
  • 响应体
    • 包含服务器返回的资源数据,例如网页的 HTML、CSS、图片等。

4. HTTP 的版本发展

  • HTTP/1.0
    • 每次请求都需要重新建立连接,请求完成后立即关闭连接,导致了较大的性能开销。
  • HTTP/1.1
    • 持久连接:允许多个请求和响应在一个 TCP 连接中完成,大幅提高性能。
    • 管道化:可以并行发送多个请求,进一步提高效率。
    • 增加了更多的缓存机制、Host 字段等,提升了协议的扩展性。
  • HTTP/2
    • 基于二进制帧的通信,而不是文本形式。
    • 支持多路复用,即同一连接中可以并发多个请求和响应,不需要排队等待。
    • 支持服务器推送,即服务器可以主动向客户端发送资源,而不需要客户端请求。
    • 头部压缩:通过 HPACK 算法减少了 HTTP 报文的头部大小,进一步提升性能。
  • HTTP/3
    • 使用基于 QUIC 协议(基于 UDP)的传输,不再依赖 TCP。
    • 提供更快的连接建立时间,减少延迟,并进一步提升了传输效率和安全性。

5. HTTP 的特点

  1. 无状态:HTTP 不保留每次请求的状态。每个请求都是独立的,服务器无法通过协议自动记住客户端的状态。为了解决这一问题,通常通过 CookieSession 来进行会话管理。
  2. 灵活性:HTTP 可以传输任意类型的数据(文本、图片、视频等),通过 MIME 类型进行标识。
  3. 可扩展性:HTTP 允许通过自定义的头部字段扩展协议功能,例如支持自定义缓存策略、权限管理、内容压缩等。

6. HTTP 的安全性

HTTP 本身是明文传输的协议,所有的数据都可以被中途截获和篡改。为了解决这一问题,引入了 HTTPS(HTTP Secure)。

  • HTTPS
    • 通过SSL/TLS 协议对传输数据进行加密,保证数据的保密性、完整性和身份认证。
    • HTTPS 使用 443 端口,而不是 HTTP 的 80 端口。

7. HTTP 的缓存机制

为了提高性能,HTTP 支持缓存。常见的缓存机制有:

  • ExpiresCache-Control:指定资源的过期时间,减少服务器请求次数。
  • ETagLast-Modified:通过资源的标识符或上次修改时间,判断资源是否需要重新下载。

总结

HTTP 是现代 Web 通信的核心协议,具有简单、灵活、扩展性强等特点。通过各个版本的迭代,HTTP 的性能和安全性得到了显著提高,特别是在 HTTP/2 和 HTTP/3 中,解决了许多传统 HTTP 的性能瓶颈,使其更适用于现代网络应用。


HTTPS

HTTPS 协议详解

HTTPS(HyperText Transfer Protocol Secure,安全超文本传输协议)是在 HTTP 基础上加入了 SSL/TLS 加密协议,以确保数据在客户端和服务器之间的传输过程中的保密性、完整性和身份验证。HTTPS 是当前 Web 通信的安全标准,广泛用于保护敏感信息,如在线支付、登录认证等。


1. HTTPS 的工作原理

HTTPS 通过将 HTTP 和 SSL/TLS 结合在一起,提供加密和认证。其工作流程如下:

  1. 客户端发起请求
    • 用户在浏览器中输入 https:// 开头的 URL,浏览器会自动向服务器发起 HTTPS 请求。
  1. 服务器响应并发送证书
    • 服务器收到请求后,会将其数字证书发送给客户端。证书中包含了服务器的公钥和服务器的身份信息,由受信任的证书颁发机构(CA)签署。
  1. 客户端验证证书
    • 客户端使用内置的受信任 CA 列表来验证服务器的证书。如果证书可信且未过期,客户端生成一个随机的对称密钥,并用服务器的公钥加密该密钥,然后将其发送给服务器。
  1. 建立加密通道
    • 服务器使用私钥解密客户端发送的对称密钥,之后双方使用该对称密钥进行加密通信。
  1. 传输数据
    • 在加密通道上,客户端和服务器可以安全地交换数据,确保数据不会被第三方截获或篡改。

2. HTTPS 的主要组成部分

  • SSL/TLS 协议
    • SSL(Secure Sockets Layer):早期的加密协议版本,现已被 TLS 取代。
    • TLS(Transport Layer Security):SSL 的升级版本,提供更高的安全性。常用版本为 TLS 1.2 和 TLS 1.3。
  • 数字证书
    • 由**证书颁发机构(CA)**签发,包含服务器的公钥、域名、颁发机构信息和有效期等。证书的作用是验证服务器的身份,并协助建立安全连接。
  • 公钥和私钥
    • 公钥:用于加密数据,公开给任何人使用。
    • 私钥:用于解密数据,仅服务器持有,需严格保密。
  • 对称密钥
    • 在通信过程中临时生成,用于加密数据。由于对称加密速度快,效率高,适用于大量数据的加密传输。

3. HTTPS 的优点

  • 数据加密
    • HTTPS 通过 SSL/TLS 协议加密数据传输,确保数据在传输过程中不被第三方截获或窃听。
  • 身份验证
    • HTTPS 使用数字证书验证服务器身份,防止中间人攻击(Man-in-the-Middle Attack),确保客户端连接的是合法的服务器。
  • 数据完整性
    • HTTPS 能够检测数据是否在传输过程中被篡改,确保数据的完整性。
  • 用户信任
    • HTTPS 地址栏通常会显示绿色锁标志或其他安全提示,增强用户对网站的信任,特别是在涉及敏感信息的场景中,如电商、银行等。

4. HTTPS 的缺点

  • 性能开销
    • HTTPS 相比 HTTP,有额外的加密/解密计算开销,可能导致响应时间略长,特别是在握手阶段。
  • 成本增加
    • 部署 HTTPS 需要购买数字证书,且需定期续费。虽然现在也有免费的证书颁发机构(如 Let’s Encrypt),但可能不被所有浏览器信任。
  • 兼容性问题
    • 一些旧的设备或浏览器可能不支持最新的 TLS 版本,这会导致无法访问使用 HTTPS 的网站。

5. HTTPS 的实现与优化

  • 配置 HTTPS
    • 配置 HTTPS 时,需要在服务器上安装数字证书,并启用 SSL/TLS 协议。常见的 Web 服务器如 Apache、Nginx 都支持 HTTPS 配置。
  • 证书管理
    • 证书需要定期更新和管理,确保证书不过期,并且使用强加密算法(如 SHA-256 和 RSA 2048 位密钥)。
  • 性能优化
    • 使用 HTTP/2 或 HTTP/3 来减少 HTTPS 带来的性能开销。启用 OCSP StaplingSession Resumption 技术来优化握手过程,减少延迟。

总结

HTTPS 是保护 Web 通信安全的关键技术,提供了数据加密、身份验证和数据完整性保护。尽管引入了额外的性能和成本开销,但在现代 Web 环境中,特别是在处理敏感数据时,HTTPS 是不可或缺的。通过合理配置和优化,HTTPS 可以为用户提供既安全又高效的网络体验。


关于HTTPS的加密过程

在 HTTPS 通信过程中,私钥对称密钥是不同的概念,并且作用不同。

1. 私钥与公钥的关系

  • 公钥和私钥是一对用于非对称加密(也叫公开密钥加密)的密钥。非对称加密的特点是:
    • 公钥是公开的,任何人都可以用它来加密数据。
    • 私钥是保密的,只有服务器持有。用公钥加密的数据只能通过对应的私钥解密。

在 HTTPS 中,服务器会将公钥包含在数字证书中发送给客户端。客户端通过公钥对数据加密,而只有服务器能通过自己的私钥来解密这些数据。

2. 随机对称密钥的生成和作用

  • 随机对称密钥是客户端生成的,并且仅用于当前的会话。客户端生成这个对称密钥后,使用服务器的公钥对它进行加密,并发送给服务器。服务器收到加密的对称密钥后,使用自己的私钥将其解密,得到与客户端相同的对称密钥。之后,客户端和服务器都会使用这个对称密钥进行通信。对称密钥用于加密大量的数据,因为对称加密比非对称加密快得多,适合加密数据流。

3. 为什么需要对称密钥?

使用非对称加密虽然可以保证安全性,但其计算量大、速度慢,不适合用于加密大量的数据。所以,HTTPS 协议采用了一种混合加密机制:

  • 握手阶段使用非对称加密(公钥加密、私钥解密)来保护对称密钥的安全传输。
  • 一旦客户端和服务器协商出一个共享的对称密钥后,后续的数据通信就用对称加密进行,保证了高效和安全。

4. 私钥与对称密钥的区别

  • 私钥:服务器独有,用于解密客户端用公钥加密的数据。它是非对称加密算法的一部分。
  • 对称密钥:客户端生成的一个随机密钥,用来加密通信中的实际数据。这是对称加密的密钥,双方使用相同的密钥进行加密和解密。

5. 具体流程总结

  1. 客户端生成随机对称密钥
  2. 用服务器的公钥加密对称密钥,并发送给服务器。
  3. 服务器用私钥解密,获得对称密钥。
  4. 客户端和服务器通过对称密钥加密通信

通过这种混合加密方式,HTTPS 实现了安全、高效的数据传输。

加密的内容是哪些呢?

在 HTTPS 通信中,后续通过对称密钥加密的主要是数据的“内容部分”,即传输的实际应用数据,而不是整个数据包的所有部分。

1. 对称加密加密的数据内容

  • 对称密钥加密的通常是应用层传输的数据,比如网页的 HTML 内容、表单数据、API 请求和响应的 JSON 数据等。这是通信过程中需要保护的核心信息。

例如:

  • 用户向网站提交的登录凭证(用户名、密码)。
  • 在线支付的信用卡信息。
  • 电子商务网站的订单信息。

这些数据通过对称加密加密后,就算在传输过程中被第三方拦截,也无法直接读取,保证了数据的机密性

2. 整个数据包的结构

在网络传输过程中,数据包通常分为多个层次,以下是简化的结构:

  1. 应用层数据(HTTP 内容):这个部分是对称密钥加密的核心数据,如网页、表单数据、API 请求等。
  2. 传输层协议(TCP):封装了应用层数据的传输信息,比如端口号、数据段序列等。
  3. 网络层协议(IP):负责将封装好的数据包在网络中传输,包含 IP 地址等信息。

3. HTTPS 只加密应用层数据

HTTPS 的加密作用于应用层的 HTTP 数据部分,而不是整个数据包的所有层。具体来说,加密的是通过 HTTP 协议传输的内容,比如:

  • 浏览器向服务器发送的 HTTP 请求(请求头、请求体)。
  • 服务器返回的 HTTP 响应(响应头、响应体)。

HTTP 数据被加密后,在网络传输时作为传输层(TCP)和网络层(IP)的一部分进行传输。

  • 传输层(如 TCP)和网络层(如 IP)的头部信息通常不加密,因为它们涉及网络路由和数据包的传递功能,网络设备需要读取这些信息来确定数据包的传输路径。因此,IP 地址、端口号等不会被加密。

4. 加密的具体范围

  • 加密的内容:HTTP 请求和响应的正文(body)以及部分头部(headers)。敏感信息如 Cookie、表单内容、URL 参数等都属于加密范围。
  • 不加密的部分:传输层和网络层的信息(如 IP 地址、端口号)是公开的,用于数据包在网络中的传输和路由。

5. 加密的目的是保护数据的机密性

通过对称密钥加密,HTTPS 确保了客户端与服务器之间的传输内容无法被第三方窃听或篡改。即便攻击者截获了数据包,由于内容被加密,只有持有相同对称密钥的客户端和服务器才能解密数据。


总结

在 HTTPS 中,使用对称密钥加密的主要是应用层的数据,也就是 HTTP 请求和响应的内容(如网页内容、用户提交的数据)。传输层和网络层的信息不会被加密。加密的目的在于保护敏感信息的传输安全,防止被窃听或篡改。

相关推荐

使用 python-fire 快速构建 CLI_如何搭建python项目架构

命令行应用程序是开发人员最好的朋友。想快速完成某事?只需敲击几下键盘,您就已经拥有了想要的东西。Python是许多开发人员在需要快速组合某些东西时选择的第一语言。但是我们拼凑起来的东西在大多数时候并...

Python 闭包:从底层逻辑到实战避坑,附安全防护指南

一、闭包到底是什么?你可以把闭包理解成一个"带记忆的函数"。它诞生时会悄悄记下自己周围的变量,哪怕跑到别的地方执行,这些"记忆"也不会丢失。就像有人出门时总会带上...

使用Python实现九九乘法表的打印_用python打印一个九九乘法表

任务要求九九乘法表的结构如下:1×1=11×2=22×2=41×3=32×3=63×3=9...1×9=92×9=18...9×9=81使用Python编写程序,按照上述格式打印出完整的九...

吊打面试官(四)--Java语法基础运算符一文全掌握

简介本文介绍了Java运算符相关知识,包含运算规则,运算符使用经验,特殊运算符注意事项等,全文5400字。熟悉了这些内容,在运算符这块就可以吊打面试官了。Java运算符的规则与特性1.贪心规则(Ma...

Python三目运算基础与进阶_python三目运算符判断三个变量

#头条创作挑战赛#Python中你学会了三步运算,你将会省去很多无用的代码,我接下来由基础到进阶的方式讲解Python三目运算基础在Python中,三目运算符也称为条件表达式。它可以通过一行代码实现条...

Python 中 必须掌握的 20 个核心函数——set()详解

set()是Python中用于创建集合的核心函数,集合是一种无序、不重复元素的容器,非常适合用于成员检测、去重和数学集合运算。一、set()的基本用法1.1创建空集合#创建空集合empty_se...

15个让Python编码效率翻倍的实用技巧

在软件开发领域,代码质量往往比代码数量更重要。本文整理的15个Python编码技巧,源自开发者在真实项目中验证过的工作方法,能够帮助您用更简洁的代码实现更清晰的逻辑。这些技巧覆盖基础语法优化到高级特性...

《Python从小白到入门》自学课程目录汇总(和猫妹学Python)

小朋友们好,大朋友们好!不知不觉,这套猫妹自学Python基础课程已经结束了,猫妹体会到了水滴石穿的力量。水一直向下滴,时间长了能把石头滴穿。只要坚持不懈,细微之力也能做出很难办的事。就比如咱们的学习...

8÷2(2+2) 等于1还是16?国外网友为这道小学数学题吵疯了……

近日,国外网友因为一道小学数学题在推特上争得热火朝天。事情的起因是一个推特网友@pjmdoll发布了一条推文,让他的关注者解答一道数学题:Viralmathequationshavebeen...

Python学不会来打我(21)python表达式知识点汇总

在Python中,表达式是由变量、运算符、函数调用等组合而成的语句,用于产生值或执行特定操作。以下是对Python中常见表达式的详细讲解:1.1算术表达式涉及数学运算的表达式。例如:a=5b...

Python运算符:数学助手,轻松拿咧

Python中的运算符就像是生活中的数学助手,帮助我们快速准确地完成这些计算。比如购物时计算总价、做家务时分配任务等。这篇文章就来详细聊聊Python中的各种运算符,并通过实际代码示例帮助你更好地理解...

Python学不会来打我(17)逻辑运算符的使用方法与使用场景

在Python编程中,逻辑运算符(LogicalOperators)是用于组合多个条件表达式的关键工具。它们可以将多个布尔表达式连接起来,形成更复杂的判断逻辑,并返回一个布尔值(True或Fa...

Python编程基础:运算符的优先级_python中的运算符优先级问题

多个运算符同时出现在一个表达式中时,先执行哪个,后执行哪个,这就涉及运算符的优先级。如数学表达式,有+、-、×、÷、()等,优先级顺序是()、×、÷、+、-,如5+(5-3)×4÷2,先计算(5-3)...

Python运算符与表达式_python中运算符&的功能

一、运算符分类总览1.Python运算符全景图2.运算符优先级表表1.3.1Python运算符优先级(从高到低)优先级运算符描述结合性1**指数右→左2~+-位非/一元加减右→左3*//...

Python操作Excel:从基础到高级的深度实践

Python凭借其丰富的库生态系统,已成为自动化处理Excel数据的强大工具。本文将深入探讨五个关键领域,通过实际代码示例展示如何利用Python进行高效的Excel操作,涵盖数据处理、格式控制、可视...

取消回复欢迎 发表评论: