百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python 中 必须掌握的 20 个核心函数——set()详解

off999 2025-09-09 09:26 40 浏览 0 评论

set()是Python中用于创建集合的核心函数,集合是一种无序、不重复元素的容器,非常适合用于成员检测、去重和数学集合运算

一、set()的基本用法

1.1 创建空集合

# 创建空集合
empty_set = set()
print(empty_set)  # set()

# 注意:{}创建的是空字典,不是空集合
not_a_set = {}
print(type(not_a_set))  # <class 'dict'>

1.2 从可迭代对象创建集合

# 从列表创建(自动去重)
numbers = set([1, 2, 2, 3, 3, 3])
print(numbers)  # {1, 2, 3}

# 从字符串创建(拆分为唯一字符)
letters = set("hello")
print(letters)  # {'h', 'e', 'l', 'o'}

# 从元组创建
unique_nums = set((1, 2, 2, 3))
print(unique_nums)  # {1, 2, 3}

# 从字典创建(获取键)
keys = set({'a': 1, 'b': 2})
print(keys)  # {'a', 'b'}

二、set()的高级特性

2.1 集合运算

a = {1, 2, 3}
b = {2, 3, 4}

# 并集
print(a | b)  # {1, 2, 3, 4}

# 交集
print(a & b)  # {2, 3}

# 差集
print(a - b)  # {1}

# 对称差集(仅在其中一个集合中的元素)
print(a ^ b)  # {1, 4}

2.2 集合推导式

# 创建平方数集合
squares = {x*x for x in range(5)}
print(squares)  # {0, 1, 4, 9, 16}

# 带条件的集合推导式
even_squares = {x*x for x in range(10) if x % 2 == 0}
print(even_squares)  # {0, 4, 16, 36, 64}

2.3 不可变集合frozenset

# 创建不可变集合
fs = frozenset([1, 2, 3])
print(fs)  # frozenset({1, 2, 3})

# fs.add(4)  # 报错:frozenset不可修改

三、set()的实际应用

3.1 高效去重

# 列表去重
duplicates = [1, 2, 2, 3, 3, 3]
unique = list(set(duplicates))
print(unique)  # [1, 2, 3](顺序可能不同)

# 文件行去重
with open('data.txt') as f:
    unique_lines = set(f.readlines())

3.2 快速成员检测

# 创建大型集合
large_set = set(range(1000000))

# 极速查找(O(1)时间复杂度)
%timeit 999999 in large_set  # 约100纳秒

# 对比列表查找(O(n)时间复杂度)
large_list = list(range(1000000))
%timeit 999999 in large_list  # 约10毫秒(慢100,000倍)

3.3 关系测试

# 查找共同好友
alice_friends = {"Bob", "Charlie", "Diana"}
bob_friends = {"Charlie", "Diana", "Eve"}

common_friends = alice_friends & bob_friends
print(common_friends)  # {'Charlie', 'Diana'}

四、常见问题解答

4.1 为什么集合元素是无序的?

集合基于哈希表实现,为提高查询效率牺牲了顺序性。Python 3.7+中字典保留插入顺序,但集合仍不保证顺序。

4.2 如何保持去重后的顺序?

from collections import OrderedDict

duplicates = [3, 1, 2, 1, 3]
unique_ordered = list(OrderedDict.fromkeys(duplicates))
print(unique_ordered)  # [3, 1, 2]

4.3 集合可以存储什么类型的元素?

集合元素必须是可哈希的(不可变类型):

  • 允许:数字、字符串、元组(仅包含不可变元素)
  • 不允许:列表、字典、集合(可使用frozenset替代)

4.4 如何判断两个集合是否相等?

a = {1, 2, 3}
b = {3, 2, 1}
print(a == b)  # True(集合不考虑顺序)

五、性能优化技巧

  1. 预分配空间(Python 3.6+):
s = set(range(1000000))  # 比逐步add更快
  1. 批量操作
# 优于多次add
s.update([4, 5, 6])
  1. 替代列表去重
# 更高效的去重方式
unique = list(dict.fromkeys(duplicates)))

六、总结

set()是Python中处理唯一性数据的核心工具,主要特点包括:

  • 自动去重:确保元素唯一性
  • 高效查询:O(1)时间复杂度的成员检测
  • 集合运算:支持并集、交集等数学操作
  • 内存效率:比列表更节省空间(对大型唯一数据集)

最佳实践建议

  1. 需要去重或快速查找时优先使用集合
  2. 大型数据集初始化时直接传入可迭代对象
  3. 注意元素必须可哈希的限制
  4. 需要顺序保留时考虑OrderedDict替代方案

相关推荐

阿里云国际站ECS:阿里云ECS如何提高网站的访问速度?

TG:@yunlaoda360引言:速度即体验,速度即业务在当今数字化的世界中,网站的访问速度已成为决定用户体验、用户留存乃至业务转化率的关键因素。页面加载每延迟一秒,都可能导致用户流失和收入损失。对...

高流量大并发Linux TCP性能调优_linux 高并发网络编程

其实主要是手里面的跑openvpn服务器。因为并没有明文禁p2p(哎……想想那么多流量好像不跑点p2p也跑不完),所以造成有的时候如果有比较多人跑BT的话,会造成VPN速度急剧下降。本文所面对的情况为...

性能测试100集(12)性能指标资源使用率

在性能测试中,资源使用率是评估系统硬件效率的关键指标,主要包括以下四类:#性能测试##性能压测策略##软件测试#1.CPU使用率定义:CPU处理任务的时间占比,计算公式为1-空闲时间/总...

Linux 服务器常见的性能调优_linux高性能服务端编程

一、Linux服务器性能调优第一步——先搞懂“看什么”很多人刚接触Linux性能调优时,总想着直接改配置,其实第一步该是“看清楚问题”。就像医生看病要先听诊,调优前得先知道服务器“哪里...

Nginx性能优化实战:手把手教你提升10倍性能!

关注△mikechen△,十余年BAT架构经验倾囊相授!Nginx是大型架构而核心,下面我重点详解Nginx性能@mikechen文章来源:mikechen.cc1.worker_processe...

高并发场景下,Spring Cloud Gateway如何抗住百万QPS?

关注△mikechen△,十余年BAT架构经验倾囊相授!大家好,我是mikechen。高并发场景下网关作为流量的入口非常重要,下面我重点详解SpringCloudGateway如何抗住百万性能@m...

Kubernetes 高并发处理实战(可落地案例 + 源码)

目标场景:对外提供HTTPAPI的微服务在短时间内收到大量请求(例如每秒数千至数万RPS),要求系统可弹性扩容、限流降级、缓存减压、稳定运行并能自动恢复。总体思路(多层防护):边缘层:云LB...

高并发场景下,Nginx如何扛住千万级请求?

Nginx是大型架构的必备中间件,下面我重点详解Nginx如何实现高并发@mikechen文章来源:mikechen.cc事件驱动模型Nginx采用事件驱动模型,这是Nginx高并发性能的基石。传统...

Spring Boot+Vue全栈开发实战,中文版高清PDF资源

SpringBoot+Vue全栈开发实战,中文高清PDF资源,需要的可以私我:)SpringBoot致力于简化开发配置并为企业级开发提供一系列非业务性功能,而Vue则采用数据驱动视图的方式将程序...

Docker-基础操作_docker基础实战教程二

一、镜像1、从仓库获取镜像搜索镜像:dockersearchimage_name搜索结果过滤:是否官方:dockersearch--filter="is-offical=true...

你有空吗?跟我一起搭个服务器好不好?

来人人都是产品经理【起点学院】,BAT实战派产品总监手把手系统带你学产品、学运营。昨天闲的没事的时候,随手翻了翻写过的文章,发现一个很严重的问题。就是大多数时间我都在滔滔不绝的讲理论,却很少有涉及动手...

部署你自己的 SaaS_saas如何部署

部署你自己的VPNOpenVPN——功能齐全的开源VPN解决方案。(DigitalOcean教程)dockovpn.io—无状态OpenVPNdockerized服务器,不需要持久存储。...

Docker Compose_dockercompose安装

DockerCompose概述DockerCompose是一个用来定义和管理多容器应用的工具,通过一个docker-compose.yml文件,用YAML格式描述服务、网络、卷等内容,...

京东T7架构师推出的电子版SpringBoot,从构建小系统到架构大系统

前言:Java的各种开发框架发展了很多年,影响了一代又一代的程序员,现在无论是程序员,还是架构师,使用这些开发框架都面临着两方面的挑战。一方面是要快速开发出系统,这就要求使用的开发框架尽量简单,无论...

Kubernetes (k8s) 入门学习指南_k8s kubeproxy

Kubernetes(k8s)入门学习指南一、什么是Kubernetes?为什么需要它?Kubernetes(k8s)是一个开源的容器编排系统,用于自动化部署、扩展和管理容器化应用程序。它...

取消回复欢迎 发表评论: