百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Nginx的 location 多种匹配规则及优先级详解

off999 2025-01-08 16:30 14 浏览 0 评论

作为web服务器,能根据不同的url进行不同的处理算是nginx的一大主要功能,而这种路由选择都是通过配置文件中的location来完成的。这一节我们就来看看location是如何工作的。

基本格式

首先来看看默认配置是怎么样的

    server {
        listen       80 default_server;
        listen       [::]:80 default_server;
        server_name  _;
        root         /usr/share/nginx/html;
        # Load configuration files for the default server block.
        include /etc/nginx/default.d/*.conf;
        location / {
        }
        error_page 404 /404.html;
            location = /40x.html {
        }
        error_page 500 502 503 504 /50x.html;
            location = /50x.html {
        }
    }

location字段位于server字段中,在该server中起到路由的作用,语法规则如下

location [ = | ~ | ~* | ^~ ] url { ... }

location关键字后面接一个可选的修饰符,在后面接匹配条件,最后是一个大括号里面放要执行的动作。

一个server字段中可以有多个location字段,请求进来以后nginx会按照一定的优先级顺序去对这些location进行匹配,最后按照最优匹配的动作去执行。

如果没有特别指明动作,就是将请求的路径附加在root配置后面,返回对应的静态资源。

两种匹配方式

上面的基本语法中的url有两种写法,一种是前缀字符(prefix string),另一种是正则表达式(regular expression)。

前缀字符

当请求的url中的路径部分,也就是ip和端口后面开始的那部分,以location中定义的前缀开始的话,就认为满足匹配。

例如有如下配置

location /some/path/ {
    #...
}

那么当请求的路径为 /some/path/xiaofu.mp3 的时候就满足匹配,但是如果请求的路径为 /some/other/path/xiaofu.mp3 的话就不满足匹配

正则表达式

用 【~】 来表示区分大小写的正则表达式,用 【~* 】来表示不区分大小写的正则表达式。

下面的这个配置就表示请求的url中任意位置包含 .html 或者 .htm 都满足匹配

location ~ \.html? {
    #...
}

匹配优先级

上面一共有四种修饰符,我们知道了【~】 和【 ~* 】是用于正则表达式的,还有两个有是干嘛的呢?

这就涉及到匹配的优先级了。

【= 】表示精确匹配,【^~】 表示最佳匹配,两者都对应前缀字符匹配规则,看了下面的匹配顺序就了解它们俩是干嘛用的了。

  1. 首先尝试匹配所有的前缀字符规则,以最长的重合为最优匹配
  1. 如果有 【=】 对应的精确匹配满足,也就是说请求的路径和匹配规则完全相同,就直接用精确匹配的行为,不继续进行其余任何匹配了
  1. 如果有的话,保存最长重合的前缀字符匹配。如果最长重合的前缀字符匹配有^~装饰符,不再查找正则匹配规则,按最长前缀匹配的行为
  1. 依次进行正则匹配,以第一个匹配的为最优匹配。正则匹配的优先级高于前缀字符匹配,直接使用该正则匹配的行为
  1. 如果没有满足条件的正则匹配,使用前面保存的最长前缀匹配的行为
  1. 如果前缀符号和正则都没有匹配,返回404

基于以上的匹配顺序,可以有下面的一些实际操作建议

  • 将频繁访问的路径用=来做精确匹配,可以大量节约匹配时间
  • 因为正则匹配是从前往后按照第一个为准,所以正则匹配的前后顺序很重要,通常是越细致的越靠前

实际操作验证

说了这么多,来上手实际操作一下。

修改配置如下

location = / {
    return 601;
}       
            
location / {
    return 602;
}
location /user/ {
    return 603;
}
location ^~ /images/ {
    return 604;
}
location ~* \.(gif|jpg|jpeg)$ {
    return 605;
}

这里我没有准备实际的返回资源,而是用5个不同的返回码来区分匹配结果。

测试下语法正确性

(base) [root@ai-therm ~]# nginx -t
nginx: the configuration file /etc/nginx/nginx.conf syntax is ok
nginx: configuration file /etc/nginx/nginx.conf test is successful

然后重新载入一下配置

(base) [root@ai-therm ~]# systemctl reload nginx

从另一台机器上进行curl测试。

如果直接访问【/】,会因为精确匹配而不再继续往下,返回601

root@control-plane-1:~# curl -I 172.29.56.178/
HTTP/1.1 601 
Server: nginx/1.16.1
Date: Sat, 30 May 2020 16:20:55 GMT
Content-Length: 0
Connection: keep-alive

如果访问/user/xiaofu.mp3会因为没有合适的正则匹配而采用最长前缀批匹配返回603

root@control-plane-1:~# curl -I 172.29.56.178/user/xiaofu.mp3
HTTP/1.1 603 
Server: nginx/1.16.1
Date: Sat, 30 May 2020 16:26:34 GMT
Content-Length: 0
Connection: keep-alive

如果访问/user/xiaofu.jpg就会因为正则匹配优先级更高而返回605

root@control-plane-1:~# curl -I 172.29.56.178/user/xiaofu.jpg
HTTP/1.1 605 
Server: nginx/1.16.1
Date: Sat, 30 May 2020 16:26:38 GMT
Content-Length: 0
Connection: keep-alive

如果访问/images/xiaofu.jpg就会因为最佳匹配而忽略正则匹配规则返回604

root@control-plane-1:~# curl -I 172.29.56.178/images/xiaofu.jpg
HTTP/1.1 604 
Server: nginx/1.16.1
Date: Sat, 30 May 2020 16:29:06 GMT
Content-Length: 0
Connection: keep-alive

最后如果访问/test/xiaofu.html会因为没有别的匹配而只能进行/匹配返回602

root@control-plane-1:~# curl -I 172.29.56.178/test/xiaofu.html
HTTP/1.1 602 
Server: nginx/1.16.1
Date: Sat, 30 May 2020 16:33:55 GMT
Content-Length: 0
Connection: keep-alive
1

关于url结尾的【/】

  • 如果是location中的匹配规则,后面是否加【/】没有任何影响
  • 如果是请求的url中路径的根目录,例如 http://1.2.3.4 http://1.2.3.4/ 是没有区别的,因为浏览器会默认帮我们加上这个【/】
  • 非根目录下的/有无影响较大。例如 http://1.2.3.4/some/path/ 会去 /some/path/ 目录下寻找默认文件进行返回,而 http://1.2.3.4/some/path 则会去 /some/ 目录下返回名叫 path 的文件,如果找不到才会在末尾再加上【/】进行重定向继续查找 /some/path/ 目录下的默认文件

总结

  • 先进行前缀字符串匹配,再进行正则匹配。但是正则匹配优先级更高。
  • 前缀字符串按照最长匹配选择最优匹配,而正则按照先后顺序选择最优匹配。所以正则匹配规则要注意先后顺序,越精细的越靠前
  • 对于频繁访问的url,使用精确匹配【=】来加快返回速度

相关推荐

让 Python 代码飙升330倍:从入门到精通的四种性能优化实践

花下猫语:性能优化是每个程序员的必修课,但你是否想过,除了更换算法,还有哪些“大招”?这篇文章堪称典范,它将一个普通的函数,通过四套组合拳,硬生生把性能提升了330倍!作者不仅展示了“术”,更传授...

7 段不到 50 行的 Python 脚本,解决 7 个真实麻烦:代码、场景与可复制

“本文整理自开发者AbdurRahman在Stackademic的真实记录,所有代码均经过最小化删减,确保在50行内即可运行。每段脚本都对应一个日常场景,拿来即用,无需额外依赖。一、在朋...

Python3.14:终于摆脱了GIL的限制

前言Python中最遭人诟病的设计之一就是GIL。GIL(全局解释器锁)是CPython的一个互斥锁,确保任何时刻只有一个线程可以执行Python字节码,这样可以避免多个线程同时操作内部数据结...

Python Web开发实战:3小时从零搭建个人博客

一、为什么选Python做Web开发?Python在Web领域的优势很突出:o开发快:Django、Flask这些框架把常用功能都封装好了,不用重复写代码,能快速把想法变成能用的产品o需求多:行业...

图解Python编程:从入门到精通系列教程(附全套速查表)

引言本系列教程展开讲解Python编程语言,Python是一门开源免费、通用型的脚本编程语言,它上手简单,功能强大,它也是互联网最热门的编程语言之一。Python生态丰富,库(模块)极其丰富,这使...

Python 并发编程实战:从基础到实战应用

并发编程是提升Python程序效率的关键技能,尤其在处理多任务场景时作用显著。本文将系统介绍Python中主流的并发实现方式,帮助你根据场景选择最优方案。一、多线程编程(threading)核...

吴恩达亲自授课,适合初学者的Python编程课程上线

吴恩达教授开新课了,还是亲自授课!今天,人工智能著名学者、斯坦福大学教授吴恩达在社交平台X上发帖介绍了一门新课程——AIPythonforBeginners,旨在从头开始讲授Python...

Python GUI 编程:tkinter 初学者入门指南——Ttk 小部件

在本文中,将介绍Tkinter.ttk主题小部件,是常规Tkinter小部件的升级版本。Tkinter有两种小部件:经典小部件、主题小部件。Tkinter于1991年推出了经典小部件,...

Python turtle模块编程实践教程

一、模块概述与核心概念1.1turtle模块简介定义:turtle是Python标准库中的2D绘图模块,基于Logo语言的海龟绘图理念实现。核心原理:坐标系系统:原点(0,0)位于画布中心X轴:向右...

Python 中的asyncio 编程入门示例-1

Python的asyncio库是用于编写并发代码的,它使用async/await语法。它为编写异步程序提供了基础,通过非阻塞调用高效处理I/O密集型操作,适用于涉及网络连接、文件I/O...

30天学会Python,开启编程新世界

在当今这个数字化无处不在的时代,Python凭借其精炼的语法架构、卓越的性能以及多元化的应用领域,稳坐编程语言排行榜的前列。无论是投身于数据分析、人工智能的探索,还是Web开发的构建,亦或是自动化办公...

Python基础知识(IO编程)

1.文件读写读写文件是Python语言最常见的IO操作。通过数据盘读写文件的功能都是由操作系统提供的,读写文件就是请求操作系统打开一个文件对象(通常称为文件描述符),然后,通过操作系统提供的接口从这个...

Python零基础到精通,这8个入门技巧让你少走弯路,7天速通编程!

Python学习就像玩积木,从最基础的块开始,一步步搭建出复杂的作品。我记得刚开始学Python时也是一头雾水,走了不少弯路。现在回头看,其实掌握几个核心概念,就能快速入门这门编程语言。来聊聊怎么用最...

一文带你了解Python Socket 编程

大家好,我是皮皮。前言Socket又称为套接字,它是所有网络通信的基础。网络通信其实就是进程间的通信,Socket主要是使用IP地址,协议,端口号来标识一个进程。端口号的范围为0~65535(用户端口...

Python-面向对象编程入门

面向对象编程是一种非常流行的编程范式(programmingparadigm),所谓编程范式就是程序设计的方法论,简单的说就是程序员对程序的认知和理解以及他们编写代码的方式。类和对象面向对象编程:把...

取消回复欢迎 发表评论: