Python 中 必须掌握的 20 个核心函数——set()详解
off999 2025-09-09 09:26 39 浏览 0 评论
set()是Python中用于创建集合的核心函数,集合是一种无序、不重复元素的容器,非常适合用于成员检测、去重和数学集合运算。
一、set()的基本用法
1.1 创建空集合
# 创建空集合
empty_set = set()
print(empty_set) # set()
# 注意:{}创建的是空字典,不是空集合
not_a_set = {}
print(type(not_a_set)) # <class 'dict'>1.2 从可迭代对象创建集合
# 从列表创建(自动去重)
numbers = set([1, 2, 2, 3, 3, 3])
print(numbers) # {1, 2, 3}
# 从字符串创建(拆分为唯一字符)
letters = set("hello")
print(letters) # {'h', 'e', 'l', 'o'}
# 从元组创建
unique_nums = set((1, 2, 2, 3))
print(unique_nums) # {1, 2, 3}
# 从字典创建(获取键)
keys = set({'a': 1, 'b': 2})
print(keys) # {'a', 'b'}二、set()的高级特性
2.1 集合运算
a = {1, 2, 3}
b = {2, 3, 4}
# 并集
print(a | b) # {1, 2, 3, 4}
# 交集
print(a & b) # {2, 3}
# 差集
print(a - b) # {1}
# 对称差集(仅在其中一个集合中的元素)
print(a ^ b) # {1, 4}2.2 集合推导式
# 创建平方数集合
squares = {x*x for x in range(5)}
print(squares) # {0, 1, 4, 9, 16}
# 带条件的集合推导式
even_squares = {x*x for x in range(10) if x % 2 == 0}
print(even_squares) # {0, 4, 16, 36, 64}2.3 不可变集合frozenset
# 创建不可变集合
fs = frozenset([1, 2, 3])
print(fs) # frozenset({1, 2, 3})
# fs.add(4) # 报错:frozenset不可修改三、set()的实际应用
3.1 高效去重
# 列表去重
duplicates = [1, 2, 2, 3, 3, 3]
unique = list(set(duplicates))
print(unique) # [1, 2, 3](顺序可能不同)
# 文件行去重
with open('data.txt') as f:
unique_lines = set(f.readlines())3.2 快速成员检测
# 创建大型集合
large_set = set(range(1000000))
# 极速查找(O(1)时间复杂度)
%timeit 999999 in large_set # 约100纳秒
# 对比列表查找(O(n)时间复杂度)
large_list = list(range(1000000))
%timeit 999999 in large_list # 约10毫秒(慢100,000倍)3.3 关系测试
# 查找共同好友
alice_friends = {"Bob", "Charlie", "Diana"}
bob_friends = {"Charlie", "Diana", "Eve"}
common_friends = alice_friends & bob_friends
print(common_friends) # {'Charlie', 'Diana'}四、常见问题解答
4.1 为什么集合元素是无序的?
集合基于哈希表实现,为提高查询效率牺牲了顺序性。Python 3.7+中字典保留插入顺序,但集合仍不保证顺序。
4.2 如何保持去重后的顺序?
from collections import OrderedDict
duplicates = [3, 1, 2, 1, 3]
unique_ordered = list(OrderedDict.fromkeys(duplicates))
print(unique_ordered) # [3, 1, 2]4.3 集合可以存储什么类型的元素?
集合元素必须是可哈希的(不可变类型):
- 允许:数字、字符串、元组(仅包含不可变元素)
- 不允许:列表、字典、集合(可使用frozenset替代)
4.4 如何判断两个集合是否相等?
a = {1, 2, 3}
b = {3, 2, 1}
print(a == b) # True(集合不考虑顺序)五、性能优化技巧
- 预分配空间(Python 3.6+):
s = set(range(1000000)) # 比逐步add更快- 批量操作:
# 优于多次add
s.update([4, 5, 6])- 替代列表去重:
# 更高效的去重方式
unique = list(dict.fromkeys(duplicates)))六、总结
set()是Python中处理唯一性数据的核心工具,主要特点包括:
- 自动去重:确保元素唯一性
- 高效查询:O(1)时间复杂度的成员检测
- 集合运算:支持并集、交集等数学操作
- 内存效率:比列表更节省空间(对大型唯一数据集)
最佳实践建议:
- 需要去重或快速查找时优先使用集合
- 大型数据集初始化时直接传入可迭代对象
- 注意元素必须可哈希的限制
- 需要顺序保留时考虑OrderedDict替代方案
相关推荐
- 阿里云国际站ECS:阿里云ECS如何提高网站的访问速度?
-
TG:@yunlaoda360引言:速度即体验,速度即业务在当今数字化的世界中,网站的访问速度已成为决定用户体验、用户留存乃至业务转化率的关键因素。页面加载每延迟一秒,都可能导致用户流失和收入损失。对...
- 高流量大并发Linux TCP性能调优_linux 高并发网络编程
-
其实主要是手里面的跑openvpn服务器。因为并没有明文禁p2p(哎……想想那么多流量好像不跑点p2p也跑不完),所以造成有的时候如果有比较多人跑BT的话,会造成VPN速度急剧下降。本文所面对的情况为...
- 性能测试100集(12)性能指标资源使用率
-
在性能测试中,资源使用率是评估系统硬件效率的关键指标,主要包括以下四类:#性能测试##性能压测策略##软件测试#1.CPU使用率定义:CPU处理任务的时间占比,计算公式为1-空闲时间/总...
- Linux 服务器常见的性能调优_linux高性能服务端编程
-
一、Linux服务器性能调优第一步——先搞懂“看什么”很多人刚接触Linux性能调优时,总想着直接改配置,其实第一步该是“看清楚问题”。就像医生看病要先听诊,调优前得先知道服务器“哪里...
- Nginx性能优化实战:手把手教你提升10倍性能!
-
关注△mikechen△,十余年BAT架构经验倾囊相授!Nginx是大型架构而核心,下面我重点详解Nginx性能@mikechen文章来源:mikechen.cc1.worker_processe...
- 高并发场景下,Spring Cloud Gateway如何抗住百万QPS?
-
关注△mikechen△,十余年BAT架构经验倾囊相授!大家好,我是mikechen。高并发场景下网关作为流量的入口非常重要,下面我重点详解SpringCloudGateway如何抗住百万性能@m...
- Kubernetes 高并发处理实战(可落地案例 + 源码)
-
目标场景:对外提供HTTPAPI的微服务在短时间内收到大量请求(例如每秒数千至数万RPS),要求系统可弹性扩容、限流降级、缓存减压、稳定运行并能自动恢复。总体思路(多层防护):边缘层:云LB...
- 高并发场景下,Nginx如何扛住千万级请求?
-
Nginx是大型架构的必备中间件,下面我重点详解Nginx如何实现高并发@mikechen文章来源:mikechen.cc事件驱动模型Nginx采用事件驱动模型,这是Nginx高并发性能的基石。传统...
- Spring Boot+Vue全栈开发实战,中文版高清PDF资源
-
SpringBoot+Vue全栈开发实战,中文高清PDF资源,需要的可以私我:)SpringBoot致力于简化开发配置并为企业级开发提供一系列非业务性功能,而Vue则采用数据驱动视图的方式将程序...
- Docker-基础操作_docker基础实战教程二
-
一、镜像1、从仓库获取镜像搜索镜像:dockersearchimage_name搜索结果过滤:是否官方:dockersearch--filter="is-offical=true...
- 你有空吗?跟我一起搭个服务器好不好?
-
来人人都是产品经理【起点学院】,BAT实战派产品总监手把手系统带你学产品、学运营。昨天闲的没事的时候,随手翻了翻写过的文章,发现一个很严重的问题。就是大多数时间我都在滔滔不绝的讲理论,却很少有涉及动手...
- 部署你自己的 SaaS_saas如何部署
-
部署你自己的VPNOpenVPN——功能齐全的开源VPN解决方案。(DigitalOcean教程)dockovpn.io—无状态OpenVPNdockerized服务器,不需要持久存储。...
- Docker Compose_dockercompose安装
-
DockerCompose概述DockerCompose是一个用来定义和管理多容器应用的工具,通过一个docker-compose.yml文件,用YAML格式描述服务、网络、卷等内容,...
- 京东T7架构师推出的电子版SpringBoot,从构建小系统到架构大系统
-
前言:Java的各种开发框架发展了很多年,影响了一代又一代的程序员,现在无论是程序员,还是架构师,使用这些开发框架都面临着两方面的挑战。一方面是要快速开发出系统,这就要求使用的开发框架尽量简单,无论...
- Kubernetes (k8s) 入门学习指南_k8s kubeproxy
-
Kubernetes(k8s)入门学习指南一、什么是Kubernetes?为什么需要它?Kubernetes(k8s)是一个开源的容器编排系统,用于自动化部署、扩展和管理容器化应用程序。它...
欢迎 你 发表评论:
- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
