百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python学不会来打我(12)集合set详解:用法、场景与类型转换

off999 2025-08-05 20:27 18 浏览 0 评论

在Python编程中,集合(set) 是一种非常有用的数据结构。它是一个无序、不重复元素的集合,非常适合用于去重、成员判断、数学集合运算等操作。

本文将从基础语法开始,详细讲解集合的使用方法、常见操作、典型应用场景以及与其他数据类型的转换方式,并通过大量示例帮助初学者掌握这一核心内容。


一、集合的基本概念

集合是由一组无序且不重复的元素组成的数据结构。集合使用花括号 {} 或 set() 函数创建。

示例:

empty_set = set()             # 空集合(不能使用{},那是空字典)
int_set = {1, 2, 3}           # 整数集合
str_set = {"apple", "banana"} # 字符串集合
mixed_set = {1, "hello", True} # 混合类型集合

注意:{} 创建的是空字典,不是集合;必须使用 set() 来创建空集合。

二、集合的常用操作

1. 添加元素

使用 add() 方法向集合中添加一个元素(如果已存在则不会重复添加):

fruits = {"apple", "banana"}
fruits.add("cherry")
print(fruits)  # 输出 {'banana', 'apple', 'cherry'}

2. 删除元素

常用的删除方法包括:

  • remove():按值删除元素,若不存在会报错
  • discard():按值删除元素,若不存在不会报错
  • pop():随机删除并返回一个元素(因为集合是无序的)
fruits.remove("banana")   # 若不存在"banana"会报错
fruits.discard("orange")  # 不会报错
popped = fruits.pop()

3. 遍历集合

可以通过 for 循环遍历集合中的每个元素:

for fruit in fruits:
    print(fruit)

4. 判断元素是否存在

使用 in 关键字可以快速判断某个元素是否存在于集合中:

print("apple" in fruits)  # 输出 True 或 False

5. 获取集合长度

使用 len() 可以获取集合中元素的数量:

print(len(fruits))  # 输出当前集合元素个数

6. 清空集合

使用 clear() 方法可以清空集合:

fruits.clear()
print(fruits)  # 输出 set()

三、集合的数学运算

集合支持常见的集合运算,如交集、并集、差集、对称差集等,这些操作在处理数据时非常高效。

1. 并集(Union)

合并两个集合的所有元素(去除重复项):

a = {1, 2, 3}
b = {3, 4, 5}
c = a.union(b)
print(c)  # 输出 {1, 2, 3, 4, 5}

也可以使用 | 运算符:

c = a | b

2. 交集(Intersection)

找出两个集合中共有的元素:

c = a.intersection(b)
print(c)  # 输出 {3}

也可以使用 & 运算符:

c = a & b

3. 差集(Difference)

找出在一个集合中存在但不在另一个集合中的元素:

c = a.difference(b)
print(c)  # 输出 {1, 2}

也可以使用 - 运算符:

c = a - b

4. 对称差集(Symmetric Difference)

找出两个集合中非共有的元素:

c = a.symmetric_difference(b)
print(c)  # 输出 {1, 2, 4, 5}

也可以使用 ^ 运算符:

c = a ^ b

四、集合的典型使用场景

场景1:去重操作

集合最常用于去除列表或字符串中的重复元素,这是其最大优势之一。

numbers = [1, 2, 2, 3, 4, 4, 5]
unique_numbers = list(set(numbers))
print(unique_numbers)  # 输出 [1, 2, 3, 4, 5](顺序可能变化)

注意:集合是无序的,因此去重后元素顺序可能会改变。

场景2:成员检测

集合查找速度比列表快得多,特别适合用于判断某个元素是否存在于一组数据中。

allowed_users = {"admin", "editor", "viewer"}
username = input("请输入用户名:")

if username in allowed_users:
    print("欢迎访问!")
else:
    print("权限不足,无法访问。")

场景3:数据对比分析

集合的数学运算非常适合用于比较两组数据之间的差异。

students_a = {"Tom", "Jerry", "Lucy"}
students_b = {"Lucy", "Mike", "Alice"}

# 同时在两个班级的学生
common = students_a & students_b
print("同时在两个班级的学生:", common)

# 在A班但不在B班的学生
only_in_a = students_a - students_b
print("只在A班的学生:", only_in_a)

场景4:关键词过滤

在文本处理中,集合可以用来快速判断某段文字是否包含特定关键词。

keywords = {"spam", "viagra", "lottery", "winner"}
message = input("请输入你的消息:")

words = set(message.split())
if words & keywords:
    print("检测到敏感词,消息被拦截。")
else:
    print("消息发送成功。")

五、集合与其他数据类型的转换

1. 集合与列表之间的转换

  • 使用 set() 将列表转为集合(自动去重):
lst = [1, 2, 2, 3]
s = set(lst)
print(s)  # 输出 {1, 2, 3}
  • 使用 list() 将集合转为列表:
s = {1, 2, 3}
lst = list(s)
print(lst)  # 输出 [1, 2, 3](顺序可能不同)

2. 集合与元组之间的转换

  • 使用 set() 将元组转为集合:
tpl = (1, 2, 2, 3)
s = set(tpl)
print(s)  # 输出 {1, 2, 3}
  • 使用 tuple() 将集合转为元组:
s = {1, 2, 3}
tpl = tuple(s)
print(tpl)  # 输出 (1, 2, 3)(顺序可能不同)

3. 集合与字符串之间的转换

  • 使用 set() 可以将字符串拆分为字符组成的集合(自动去重):
s = "hello"
char_set = set(s)
print(char_set)  # 输出 {'h', 'e', 'l', 'o'}('l'只出现一次)
  • 使用 ''.join() 可以将集合拼接成字符串:
chars = {'h', 'e', 'l', 'o'}
s = ''.join(chars)
print(s)  # 输出 'heol'(顺序不确定)

4. 集合与字典之间的转换

  • 可以将字典的键转换为集合:
d = {"name": "Tom", "age": 20}
keys = set(d.keys())
print(keys)  # 输出 {'name', 'age'}
  • 可以将字典的值转换为集合:
values = set(d.values())
print(values)  # 输出 {'Tom', 20}

六、集合 vs 列表 vs 元组:何时选择?

建议:

  • 如果你需要存储一组不重复的数据,并进行快速查找或集合运算,优先使用集合。
  • 如果你需要保持顺序或需要频繁修改,使用列表。
  • 如果数据不需要修改,使用元组。

七、集合的最佳实践与注意事项

  1. 避免使用 {} 创建空集合,应使用 set()。
  2. 集合是无序的,不要依赖元素的插入顺序。
  3. 集合元素必须是不可变类型,如整数、字符串、元组等,不能是列表或字典。
  4. 集合适合大规模数据的成员判断和去重,性能优于列表。
  5. 注意集合运算的结果也是集合,如果需要排序或保持顺序,需额外处理。

八、总结

集合是Python中一种非常实用的数据结构,具有无序、不重复、查找高效的特点,适用于去重、成员检测、集合运算等多种场景。

对于Python初学者来说,理解集合的基本操作、适用场景以及与其他数据类型的转换方式,不仅能提升代码编写能力,还能帮助你更高效地处理实际问题。

掌握集合,是你学习Python数据结构的重要一步!

相关推荐

正版office和盗版区别(office正版和盗版可以共存吗)

区别主要有三方面:1.office正版是付费的,而且价格相对而言较高,盗版呢价格相对低或者干脆免费。2.office正版因为是官方发行,文件肯定完整,功能齐全,稳定。盗版呢一般都是破译的或者是拷贝的,...

ヽ这个符号怎么打出来(这个符号怎么打出来是在中间的)

下载酷狗拼音,软键盘就有了。ˋ☆╲ヽ

120g固态硬盘够用吗(10几年的老电脑换个固态硬盘)

一般办公家用还是够用了,分两个区,系统盘分50G,剩余的分一个区做资料盘。特殊要求,资料文件比较多的话,128g是不够用,只能分一个区。这个主要取决于您电脑主要的用途,如果您的电脑只是用来日常办公和娱...

谷歌浏览器google(谷歌浏览器googleplay)

GoogleChrome,又称Google浏览器,是一个美国Google(谷歌)公司开发的网页浏览器。该浏览器是基于其他开源软件所撰写,包括WebKit,目标是提升稳定性、速度和安全性,并创造出简单且...

android13正式版下载(安卓版本13)

出现该问题的原因是,用户在设置里开启了新下载的APP,仅添加到APP资源库选项。大家只要进入“设置-主屏幕”,把新下载的APP,改为“添加到主屏幕”即可解决问题。修改完成后,你再进入AppStore下...

firefox浏览器安卓版(firefox浏览器安卓版 打开本地网页)

要进入火狐浏览器手机版的主页,你可以通过以下几种方式进行:首先,打开火狐浏览器App,然后点击右上角的三条横线菜单按钮,接着选择“主页”选项。另外,你也可以直接在浏览器地址栏中输入“about:hom...

电脑cpu性能排行榜天梯图(“电脑cpu性能天梯图”)

一、英特尔酷睿i7670。这款英特尔CPU采用的是超频新芯,最大程度的提升处理器的超频能力。二、英特尔酷睿i74790kCPU:这款CPU采用22纳米制程工艺的框架,它的默认频率是4.0到4.4Ghz...

硬盘怎么分区合理(硬盘怎么分区合理一点)
  • 硬盘怎么分区合理(硬盘怎么分区合理一点)
  • 硬盘怎么分区合理(硬盘怎么分区合理一点)
  • 硬盘怎么分区合理(硬盘怎么分区合理一点)
  • 硬盘怎么分区合理(硬盘怎么分区合理一点)
路由器怎么设置密码不被别人蹭网
  • 路由器怎么设置密码不被别人蹭网
  • 路由器怎么设置密码不被别人蹭网
  • 路由器怎么设置密码不被别人蹭网
  • 路由器怎么设置密码不被别人蹭网
电脑自由截屏的快捷键是什么

快捷键是ctrl+alt+a,我们可将聊天窗口缩小,放在旁边。然后找到想要截屏的位置,这时我们在截屏旁边,就更加的方便了。在键盘中按下PrintScreenSysRq(简写为PrtSc)键,此快捷...

windows10精简版官网下载(win10官方精简版下载)

精简版的意思的它比原版的功能和软件少了,其实精简版的更适合大众,没有多余的其他必要功能,更快Win10版本主要为四个分别是专业版、家庭版、企业版、教育版,其实除了这四个之外,还有工作站版、LTSB/L...

cad2008安装失败(Win11安装cad2008安装失败)

解决方法:1、右键点击“开始”按钮,选择“程序和功能”;2、然后点击“启用或关闭windows功能”;3、勾选“Microsoft.NETFramework3.5(包括.Net2.0)”后点击确定按钮...

u盘在电脑上怎么找出来(u盘在电脑上怎么找到)

在电脑中找不到u盘,是因为系统没有自动识别出来,手动打开即可,具体的解决步骤如下:1、在桌面上点击我的电脑,右键,管理。2、打开管理界面,点击储存。3、进到储存页面。4、到这一步,也就可以看到了,有这...

联想一体机怎么进入bios(联想一体机怎么进入u盘启动)

所需工具:联想Lenovo品牌一体机、启动U盘。具体步骤如下:1、联想一体机从U盘启动设置步骤如下重启联想一体机,启动过程中按F1进入BIOS,部分机型则是开机按Enter键,进入之后再按F12选择进...

如何装ghost系统盘(ghost装机教程)

ghost是不能做系统c盘,它是一种对硬盘和分区制作成映像文件进行备份和恢复的工具软件,是不能进行操作系统安装。这个软件的使用目的是,当我们安装配置好操作系统以后,用ghost软件对c盘进行备份,或者...

取消回复欢迎 发表评论: