百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python 中的 UUID模块:生成唯一标识符

off999 2024-10-21 07:02 28 浏览 0 评论

前言

UUID,全称为Universally Unique Identifier,是一种128位的全局唯一标识符。这个标识符通过一定的算法计算出来,可以保证在一定的空间和时间上的唯一性。在Python中,UUID通常用于生成唯一的标识符,例如数据库表的ID字段、用户账号、订单等。

UUID的生成通常基于MAC地址、时间戳、命名空间、随机数或伪随机数等元素,以保证生成ID的唯一性。在Python中,UUID可以通过内置的uuid模块生成。该模块提供了多种生成UUID的算法,如uuid1()、uuid3()、uuid4()和uuid5()。

UUID的主要作用是让分布式系统中的所有元素都有唯一的辨识信息,避免数据库建立时的名称重复问题。此外,UUID还可以用于短时间内标记一个对象,或者可靠地辨别网络中的持久性对象

一.导入 uuid 模块

import uuid

二.基本用法

1.快速入门

生成 UUID

uuid.uuid4() 方法可以用来生成随机的 UUID。UUID 是一个类似于 xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx 格式的字符串。

import uuid
unique_id = uuid.uuid4()
print(unique_id)
#b8cbc6cd-2cf8-456d-80b1-050321151aad

获取 UUID 的各种形式

通过 hex、int 和 bytes 方法,可以获取 UUID 的不同形式,例如十六进制、整数和字节字符串。

import uuid


unique_id = uuid.uuid4()
        
hex_id = unique_id.hex
int_id = unique_id.int
bytes_id = unique_id.bytes
        
print(hex_id)
print(int_id)
print(bytes_id)
# 868cec4efaba4dbb86df73a08fd31afe
# 178848265901433220483206324019780590334
# b'\x86\x8c\xecN\xfa\xbaM\xbb\x86\xdfs\xa0\x8f\xd3\x1a\xfe'


三.UUID 的不同版本的用法

1.uuid1(): 基于主机和时间的 UUID。

import uuid


unique_id1 = uuid.uuid1()
print(unique_id1)
# e21ba897-ab08-11ee-9282-005056c00008

2.uuid3(): 基于命名空间和名字的 UUID。

用于根据给定的命名空间和名称生成UUID。该函数接受两个参数:命名空间和名称,并返回一个UUID对象。

import uuid  
  
# 定义命名空间和名称  
namespace = uuid.UUID('00000000-0000-0000-0000-000000000000')  
name = 'example'  
  
# 使用uuid3()函数生成UUID  
my_uuid = uuid.uuid3(namespace, name)  
  
# 输出UUID  
print(my_uuid)
# 0b409040-ac26-3ed8-b9d1-65c3178749d1

3.uuid4(): 随机生成的 UUID。

uuid4()函数是uuid模块中的一个方法,用于生成随机UUID。该函数不需要任何参数,并返回一个随机生成的UUID对象。

import uuid
unique_id = uuid.uuid4()
print(unique_id)
#b8cbc6cd-2cf8-456d-80b1-050321151aad


4.uuid5(): 基于命名空间和名字的 UUID,使用 SHA-1 散列算法。

uuid5()函数是用于生成基于SHA-1散列算法的UUID。这个函数需要两个参数:一个命名空间(namespace)和一个名称(name)。命名空间通常是一个已经存在的UUID,而名称是你想要为其生成UUID的字符串。

uuid模块中预定义了几个命名空间常量,包括:

  • uuid.NAMESPACE_DNS:当指定一个DNS名称时使用的命名空间。
  • uuid.NAMESPACE_URL:当指定一个URL时使用的命名空间。
  • uuid.NAMESPACE_OID:当指定一个ISO OID时使用的命名空间。
  • uuid.NAMESPACE_X500:当指定DER或文本输出格式的X.500 DN时使用的命名空间。
import uuid  
  
# 定义一个命名空间,通常使用预定义的UUID,比如DNS命名空间  
namespace = uuid.NAMESPACE_DNS  
name = 'baidu.com'  
  
# 使用uuid5()函数生成UUID  
my_uuid = uuid.uuid5(namespace, name)  
  
# 输出UUID  
print(my_uuid)
# 6121f649-ca8e-5e6f-847d-580647b71c0c


四.实际应用场景

uuid 模块在许多应用中都有着广泛的应用,以下是一些常用场景

  1. 数据库表ID字段:很多数据库表都有唯一标识符字段,用于区分表中的每一行记录。使用UUID作为这些字段的值可以确保数据的全局唯一性。
  2. 分布式系统:在分布式系统中,有时很难找到一个可靠的机制来生成全局唯一标识符。在这种情况下,可以使用uuid模块生成UUID来唯一标识各个节点或事务。
  3. 临时文件和资源名:当创建临时文件或需要为资源命名时,可以使用UUID来确保名称的唯一性,避免命名冲突。
  4. 用户会话管理:在Web应用程序中,用户会话是常见的需求。使用UUID可以确保每个用户会话在全球范围内的唯一性。
  5. 缓存和索引:UUID可以用作缓存的键或索引条目的标识符,确保它们的唯一性和稳定性。
  6. 事件跟踪和日志:在处理大量事件或日志数据时,使用UUID可以为每个事件生成一个唯一标识符,有助于跟踪和分析数据。
  7. 临时目录和文件名:当需要在程序中创建临时目录或文件时,为了避免命名冲突,可以使用UUID来命名这些文件或目录。
  8. API请求ID:在构建API时,为每个请求分配一个唯一的ID(使用UUID)可以帮助跟踪请求,并在出现问题时进行调试。
  9. 测试和模拟:在测试和模拟环境中,UUID可以用于生成唯一的测试数据或标识符,确保每次测试的独立性和可重复性。
  10. 多线程和并发编程:在多线程或多进程环境中,使用UUID可以作为线程或进程的唯一标识符,有助于管理和同步操作。


五. 注意事项

使用uuid模块的时候需要注意以下事项

  1. 全局唯一性:UUID的主要优势是它们几乎肯定是全局唯一的。然而,理论上仍然存在极小的可能性(尽管实际上几乎不可能)会生成两个相同的UUID。因此,在设计系统时,不应依赖于UUID的绝对唯一性,而应准备处理潜在的冲突。
  2. 版本选择:UUID模块支持生成基于不同算法的UUID,如UUID1(基于时间和MAC地址)、UUID3(基于名称和MD5散列)、UUID4(完全随机)和UUID5(基于名称和SHA-1散列)。选择适当的版本取决于具体的应用需求。
  3. UUID1的安全性:UUID1是基于MAC地址和当前时间戳生成的,因此可能会泄露有关生成UUID系统的信息。如果安全性是一个关键问题,使用UUID4可能是更好的选择,因为它完全基于随机数生成。
  4. 性能:生成UUID通常是一个快速的过程,但在性能关键的场景中,频繁生成UUID可能会影响性能。在这种情况下,可以考虑缓存UUID或使用其他唯一标识符生成策略。
  5. 存储和传输:UUID通常以字符串形式存储和传输,这可能会占用比必要更多的空间。如果空间是一个问题,可以考虑使用更高效的数据表示,如二进制格式。
  6. 可读性:UUID是一长串字符,对人类来说不易读也不易记。在需要用户交互或可读性的场景中,可能需要考虑使用更友好的标识符。
  7. 兼容性:UUID模块生成的UUID符合RFC 4122标准,这意味着它们应该与其他系统生成的UUID兼容。然而,在处理来自外部系统的UUID时,始终验证其格式和有效性是一个好习惯。
  8. 线程安全:Python的uuid模块是线程安全的,可以在多线程环境中安全使用。
  9. 依赖性问题:虽然UUID模块是Python标准库的一部分,但在某些受限环境中(如某些类型的嵌入式系统),可能不可用或需要额外的配置。
  10. 排序和索引:UUID不是为排序而设计的,因此,如果需要对UUID进行排序或索引操作,应考虑使用适当的数据库索引或排序算法。


更多用法参考官方文档

https://docs.python.org/3/library/uuid.html

相关推荐

Linux 网络协议栈_linux网络协议栈

前言;更多学习资料(包含视频、技术学习路线图谱、文档等)后台私信《资料》免费领取技术点包含了C/C++,Linux,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,Z...

揭秘 BPF map 前生今世_bpfdm

1.前言众所周知,map可用于内核BPF程序和用户应用程序之间实现双向的数据交换,为BPF技术中的重要基础数据结构。在BPF程序中可以通过声明structbpf_map_def...

教你简单 提取fmpeg 视频,音频,字幕 方法

ffmpeg提取视频,音频,字幕方法(HowtoExtractVideo,Audio,SubtitlefromOriginalVideo?)1.提取视频(ExtractVi...

Linux内核原理到代码详解《内核视频教程》

Linux内核原理-进程入门进程进程不仅仅是一段可执行程序的代码,通常进程还包括其他资源,比如打开的文件,挂起的信号,内核内部的数据结构,处理器状态,内存地址空间,或多个执行线程,存放全局变量的数据段...

Linux C Socket UDP编程详解及实例分享

1、UDP网络编程主要流程UDP协议的程序设计框架,客户端和服务器之间的差别在于服务器必须使用bind()函数来绑定侦听的本地UDP端口,而客户端则可以不进行绑定,直接发送到服务器地址的某个端口地址。...

libevent源码分析之bufferevent使用详解

libevent的bufferevent在event的基础上自己维护了一个buffer,这样的话,就不需要再自己管理一个buffer了。先看看structbufferevent这个结构体struct...

一次解决Linux内核内存泄漏实战全过程

什么是内存泄漏:程序向系统申请内存,使用完不需要之后,不释放内存还给系统回收,造成申请的内存被浪费.发现系统中内存使用量随着时间的流逝,消耗的越来越多,例如下图所示:接下来的排查思路是:1.监控系统中...

彻底搞清楚内存泄漏的原因,如何避免内存泄漏,如何定位内存泄漏

作为C/C++开发人员,内存泄漏是最容易遇到的问题之一,这是由C/C++语言的特性引起的。C/C++语言与其他语言不同,需要开发者去申请和释放内存,即需要开发者去管理内存,如果内存使用不当,就容易造成...

linux网络编程常见API详解_linux网络编程视频教程

Linux网络编程API函数初步剖析今天我们来分析一下前几篇博文中提到的网络编程中几个核心的API,探究一下当我们调用每个API时,内核中具体做了哪些准备和初始化工作。1、socket(family...

Linux下C++访问web—使用libcurl库调用http接口发送解析json数据

一、背景这两天由于一些原因研究了研究如何在客户端C++代码中调用web服务端接口,需要访问url,并传入json数据,拿到返回值,并解析。 现在的情形是远程服务端的接口参数和返回类型都是json的字符...

平衡感知调节:“系统如人” 视角下的架构设计与业务稳定之道

在今天这个到处都是数字化的时代,系统可不是一堆冷冰冰的代码。它就像一个活生生的“数字人”,没了它,业务根本转不起来。总说“技术要为业务服务”,但实际操作起来问题不少:系统怎么才能快速响应业务需求?...

谈谈分布式文件系统下的本地缓存_什么是分布式文件存储

在分布式文件系统中,为了提高系统的性能,常常会引入不同类型的缓存存储系统(算法优化所带来的的效果可能远远不如缓存带来的优化效果)。在软件中缓存存储系统一般可分为了两类:一、分布式缓存,例如:Memca...

进程间通信之信号量semaphore--linux内核剖析

什么是信号量信号量的使用主要是用来保护共享资源,使得资源在一个时刻只有一个进程(线程)所拥有。信号量的值为正的时候,说明它空闲。所测试的线程可以锁定而使用它。若为0,说明它被占用,测试的线程要进入睡眠...

Qt编写推流程序/支持webrtc265/从此不用再转码/打开新世界的大门

一、前言在推流领域,尤其是监控行业,现在主流设备基本上都是265格式的视频流,想要在网页上直接显示监控流,之前的方案是,要么转成hls,要么魔改支持265格式的flv,要么265转成264,如果要追求...

30 分钟搞定 SpringBoot 视频推拉流!实战避坑指南

30分钟搞定SpringBoot视频推拉流!实战避坑指南在音视频开发领域,SpringBoot凭借其快速开发特性,成为很多开发者实现视频推拉流功能的首选框架。但实际开发中,从环境搭建到流处理优...

取消回复欢迎 发表评论: