百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Nginx是什么?看我如何一步步给你讲透这个神奇的架构

off999 2025-04-09 18:57 14 浏览 0 评论

nginx是什么架构?是怎么样的?你是一个程序员,你在电脑上编辑了一段文本,将它保存为t x t文件,将它拖到浏览器打开就能看到文件里的内容。但这看起来太过单调,为了让画面更丰富,我们定个规则,在文本边上加两个h e符号,文本就以标题形式展示。加入u l和l i就能变成列表,加入i m g还能让u r l文本直接变成对应的图片。这些带尖括号的特殊符号,我们叫它标签,只要浏览器识别到这些标签就展示对应的样式。

为了将这个自带标签的文本跟t x t纯文本区分开来,我们给了他新的后缀名html。浏览器只要识别到文件是html就会解析里面的标签,这样我们就有了标题、输入框等各种丰富的内容了。这其实就是我们平时在浏览器中看到的网页。但不同的是,这个h t m l文件是浏览器从我们本地电脑文件中打开的,而我们平时访问的网页则是从某个远端服务器将文件传到我们电脑的浏览器后打开的。

那么问题就来了。我们是怎么获得这个远端服务器上的h t m l文件的?没有什么是加一层中间层不能解决的,如果有那就再加一层。这次我们要加的中间层是n g x,假设我们完全不了解n g x,来看一下它是怎么设计出来的。之前你点赞了吗?关注了吗?谢谢。

h t t p服务器是什么?想要让本地的浏览器获取到放在远端服务器上的h t m l文件,那很简单,我们可以在远端服务器启动一个进程,这个进程对外提供h t t p服务,说白了就是提供了一个u r l。用户在浏览器中输入这个u r l回车,浏览器就会向这个进程发起http请求。进程收到浏览器的请求后,就将h t m l文件发给浏览器,浏览器完成解析和展示完美。而像这种根据浏览器请求返回html文件的服务进程,其实就叫http服务器。

有了它,前端开发老哥写的各种h t m l文件就能部署到远端服务器上,对外提供网页服务了。反向代理是什么?但一个完整产品往往不只有前端页面,还有后端服务。比如某宝前端商城页面,需要从后端服务那获取最新的商品数据。假设现在前端页面已经被加载到浏览器中,浏览器会按页面里写好的代码逻辑向后端商品服务发起请求获取数据。

流量小的时候没什么问题,流量变大后,后端服务器扛不住的话,就需要增加商品服务的个数。服务变多后,每个都有对应的ip和端口,浏览器就不知道该访问哪个服务了。所以我们还需要在这几个后端服务前面加一个进程,对外提供一个u r l域名请求来了,由这个进程均匀转发给背后的几个服务,让每个服务都能处理上请求,也就实现了所谓的负载均衡。像这种屏蔽掉背后具体有哪些服务器的代理方式,就是我们常说的反向代理。

有了反向代理,我们对外就可以只提供一个u i l域名,背后根据需要随时扩缩容服务。这个反向代理的功能正好可以加到前面放h t m l文件的进程上。那现在这个过程就很灵性了。既可以为前端h t m l文件提供h t t p服务器的功能。

当h t m l文件被加载到浏览器并向后端发起请求的时候,这个进程还能为后端服务器提供反向代理的功能。模块化网关能力。既然是中间层,所有网络流量都要经过进程,那它高低也算个网关了。于是我们就可以顺理成章的在它上面加入一些通用网关能力。

比如加个日志记录每次调用的结果,方便后续排查问题。又比如加个对输入输出的内容进行压缩的功能,减少网络带宽消耗。又或者是对某个i p进行限流或封禁,甚至还可以修改输入输出的内容。能实现的功能实在太多,想象空间很大。

于是将这部分功能设计为开放接口,让用户通过自定义模块来实现特定功能。这还不够,现在这个网关只支持h t t p,我们其实还能扩展下,让它支持t c p、u d p、h t t p二和web socket。你能想到的我都要支持,我本来不支持的,就会有人通过自定义模块帮我支持。配置能力。

前面提到那么多种能力,用户肯定不会全用上。所以需要有个地方让人选择用哪些能力。于是我们可以加个配置文件,也就是n g x点com fig,用户想用什么能力就在配置文件上说明清楚就行,非常方便。单线程现在这个网关进程的主要任务就是跟上下游建立网络连接,顺便内部做下处理。

多个客户端请求通过网络进入到一个进程。如果用多线程并发处理,那就需要考虑并发问题影响性能,怎么办呢?很简单,外部不管有多少个网络连接,网关进程,收到客户端请求后,都统一塞到一个线程上。在一个线程上处理客户端请求,什么并发问题和线程切换开销完全不存在。多worker进程,但单个进程要单线程处理,那么多流量哪怕再快压力也不小。

万一这里面有美羊羊发的流量,你看见人那么久,怎么忍心让他久等?沸羊羊你说话你干嘛?怎么办呢?既然多线程不行,那我们就上多进程。于是可以将单个进程改为多个进程,我们管它们叫worker进程。进程之间互相独立,一个worker贵了并不影响另外一个worker进程。让多个worker进程同时监听一个ip地址,加端口一有流量进来,操作系统就会随机给到其中一个进程处理。

将进程数量设置为跟操作系统c p u核数一致,那每个进程都能得到一个核。开足马力猛猛干。听到这里问题就来啊,看到这里看到这里问题就来了,为什么多个进程同时监听一个端口,不会出现端口冲突?评论区告诉我答案。内存共享。

但多worker进程的情况下,同一个客户端的多个请求会随机打到某个worker。对于限流这种需要技术的场景,就会被分散到多个worker上单独计数。那还怎么限流?所以还需要给这些worker进程分配一个共享内存区域,方便多个进程之间共用同一份数据做逻辑,确保系统数据一致性。proxy cache作为网关,它在收到前端网页请求后会转发给后端,并将后端处理结果中转给前端。

如果它能将响应结果缓存起来,这样下次收到同样的请求,直接将缓存里的数据返回给前端,从而减少响应时间和网络负载。那这个数据是放在共享内存里面,内存贵不合适。我们可以维护一些磁盘文件,用于在前端请求后端的过程中暂存。后端响应的结果后面再有相同请求就可以将磁盘里的数据返回。

这就是经典的空间换时间,用廉价的磁盘空间换取网络传输和cpu计算耗时。对于后端响应较慢或重复请求较多的场景,读写磁盘总归。可以直接将请求打到后端来得快。这些用于缓存响应数据的磁盘文件就是所谓的proxy cache加入master进程。

但这还不够,现在每个worker会分走一部分流量。如果功能更新,所有worker同时一起重启,上面的网络连接就会全部断掉。更好的方式是创建worker和关闭worker挨个陆续执行。这样前端网页连接断开后,还能去连另外一个worker,保证任意时间一直有worker在工作,也就是所谓的滚动升级。

因此还需要一个新的进程,协调各个worker谁先谁后。这个协调进程就是所谓的master进程,让master读取前面提到的n g x点config配置,统一管理多个worker。n g x是什么?到这里,当初那个简陋的单进程网关服务就变成了一个支持动态配置多种通用网关能力和多种网络协议,单master多worker架构,多个worker进程之间共享内存和proxy cache,对外提供一个埃批加端口,支持h t t p服务器和反向代理的高性能网关服务。它就是所谓的n g x,它不仅支持日志限流等各种通用能力,还支持自定义网关能力。

只要你写好配置,就能让它给你当牛做马。性能上五万q p s非常轻松,应付你那只有几十q p s的服务更是绰绰有余了。现在大家通了吗?好了,如果你觉得这个视频对你有帮助,记得点赞并转发给你那不成器的兄弟。文字版的笔记见评论区。

最后遗留一个问题,想必大家也发现了,聊到现在它其实也只是某台服务器上的多个进程,一旦服务器贵了,n g x也就贵了,存在单点问题,那怎么解决n g x的单点问题呢?n g x有集群模式吗?评论区告诉我答案。

相关推荐

python入门到脱坑经典案例—清空列表

在Python中,清空列表是一个基础但重要的操作。clear()方法是最直接的方式,但还有其他方法也可以实现相同效果。以下是详细说明:1.使用clear()方法(Python3.3+推荐)...

python中元组,列表,字典,集合删除项目方式的归纳

九三,君子终日乾乾,夕惕若,厉无咎。在使用python过程中会经常遇到这四种集合数据类型,今天就对这四种集合数据类型中删除项目的操作做个总结性的归纳。列表(List)是一种有序和可更改的集合。允许重复...

Linux 下海量文件删除方法效率对比,最慢的竟然是 rm

Linux下海量文件删除方法效率对比,本次参赛选手一共6位,分别是:rm、find、findwithdelete、rsync、Python、Perl.首先建立50万个文件$testfor...

数据结构与算法——链式存储(链表)的插入及删除,

持续分享嵌入式技术,操作系统,算法,c语言/python等,欢迎小友关注支持上篇文章我们讲述了链表的基本概念及一些查找遍历的方法,本篇我们主要将一下链表的插入删除操作,以及采用堆栈方式如何创建链表。链...

Python自动化:openpyxl写入数据,插入删除行列等基础操作

importopenpyxlwb=openpyxl.load_workbook("example1.xlsx")sh=wb['Sheet1']写入数据#...

在Linux下软件的安装与卸载(linux里的程序的安装与卸载命令)

通过apt安装/协助软件apt是AdvancedPackagingTool,是Linux下的一款安装包管理工具可以在终端中方便的安装/卸载/更新软件包命令使用格式:安装软件:sudoapt...

Python 批量卸载关联包 pip-autoremove

pip工具在安装扩展包的时候会自动安装依赖的关联包,但是卸载时只删除单个包,无法卸载关联的包。pip-autoremove就是为了解决卸载关联包的问题。安装方法通过下面的命令安装:pipinsta...

用Python在Word文档中插入和删除文本框

在当今自动化办公需求日益增长的背景下,通过编程手段动态管理Word文档中的文本框元素已成为提升工作效率的关键技术路径。文本框作为文档排版中灵活的内容容器,既能承载多模态信息(如文字、图像),又可实现独...

Python 从列表中删除值的多种实用方法详解

#Python从列表中删除值的多种实用方法详解在Python编程中,列表(List)是一种常用的数据结构,具有动态可变的特性。当我们需要从列表中删除元素时,根据不同的场景(如按值删除、按索引删除、...

Python 中的前缀删除操作全指南(python删除前导0)

1.字符串前缀删除1.1使用内置方法Python提供了几种内置方法来处理字符串前缀的删除:#1.使用removeprefix()方法(Python3.9+)text="...

每天学点Python知识:如何删除空白

在Python中,删除空白可以分为几种不同的情况,常见的是针对字符串或列表中空白字符的处理。一、删除字符串中的空白1.删除字符串两端的空白(空格、\t、\n等)使用.strip()方法:s...

Linux系统自带Python2&yum的卸载及重装

写在前面事情的起因是我昨天在测试Linux安装Python3的shell脚本时,需要卸载Python3重新安装一遍。但是通过如下命令卸载python3时,少写了个3,不小心将系统自带的python2也...

如何使用Python将多个excel文件数据快速汇总?

在数据分析和处理的过程中,Excel文件是我们经常会遇到的数据格式之一。本文将通过一个具体的示例,展示如何使用Python和Pandas库来读取、合并和处理多个Excel文件的数据,并最终生成一个包含...

【第三弹】用Python实现Excel的vlookup功能

今天继续用pandas实现Excel的vlookup功能,假设我们的2个表长成这样:我们希望把Sheet2的部门匹在Sheet1的最后一列。话不多说,先上代码:importpandasaspd...

python中pandas读取excel单列及连续多列数据

案例:想获取test.xls中C列、H列以后(当H列后列数未知时)的所有数据。importpandasaspdfile_name=r'D:\test.xls'#表格绝对...

取消回复欢迎 发表评论: