Python入门到脱坑经典案例—列表去重
off999 2025-06-15 18:36 71 浏览 0 评论
列表去重是Python编程中常见的操作,下面我将介绍多种实现列表去重的方法,从基础到进阶,帮助初学者全面掌握这一技能。
方法一:使用集合(set)去重(最简单)
python
def remove_duplicates_set(lst):
"""使用集合去重(不保持原始顺序)"""
return list(set(lst))
# 示例
original_list = [3, 5, 2, 3, 8, 5, 9, 2]
result = remove_duplicates_set(original_list)
print(f"原始列表: {original_list}")
print(f"去重后: {result}")方法二:保持顺序的去重方法
def remove_duplicates_ordered(lst):
"""保持原始顺序的去重方法"""
seen = set()
return [x for x in lst if not (x in seen or seen.add(x))]
# 示例
original_list = [3, 5, 2, 3, 8, 5, 9, 2]
result = remove_duplicates_ordered(original_list)
print(f"原始列表: {original_list}")
print(f"保持顺序去重后: {result}")方法三:使用字典键去重(Python 3.7+保持插入顺序)
def remove_duplicates_dict(lst):
"""使用字典键去重(Python 3.7+保持顺序)"""
return list(dict.fromkeys(lst))
# 示例
original_list = ['apple', 'banana', 'apple', 'orange', 'banana']
result = remove_duplicates_dict(original_list)
print(f"原始列表: {original_list}")
print(f"字典键去重后: {result}")方法四:使用enumerate和列表推导式
def remove_duplicates_enumerate(lst):
"""使用enumerate去重(保持顺序)"""
return [x for i, x in enumerate(lst) if x not in lst[:i]]
# 示例
original_list = [1, 2, 3, 2, 4, 3, 5]
result = remove_duplicates_enumerate(original_list)
print(f"原始列表: {original_list}")
print(f"枚举去重后: {result}")方法五:使用pandas库(适合大数据量)
import pandas as pd
def remove_duplicates_pandas(lst):
"""使用pandas去重(保持顺序)"""
return pd.unique(lst).tolist()
# 示例
original_list = [10, 20, 30, 20, 40, 10, 50]
result = remove_duplicates_pandas(original_list)
print(f"原始列表: {original_list}")
print(f"pandas去重后: {result}")方法六:使用numpy库
import numpy as np
def remove_duplicates_numpy(lst):
"""使用numpy去重(不保持顺序)"""
return np.unique(lst).tolist()
# 示例
original_list = [7, 5, 7, 3, 5, 9, 3]
result = remove_duplicates_numpy(original_list)
print(f"原始列表: {original_list}")
print(f"numpy去重后: {result}")方法七:处理复杂对象的去重(基于某个属性)
ef remove_duplicates_objects(lst, key=None):
"""复杂对象去重(基于某个属性)"""
seen = set()
return [x for x in lst if not (key(x) in seen or seen.add(key(x)))]
# 示例
class Product:
def __init__(self, id, name):
self.id = id
self.name = name
def __repr__(self):
return f"Product({self.id}, '{self.name}')"
products = [
Product(1, "Apple"),
Product(2, "Banana"),
Product(1, "Apple"),
Product(3, "Orange")
]
result = remove_duplicates_objects(products, key=lambda x: x.id)
print("原始产品列表:")
for p in products:
print(p)
print("\n基于ID去重后:")
for p in result:
print(p)方法八:使用itertools.groupby(需要先排序)
from itertools import groupby
def remove_duplicates_groupby(lst):
"""使用groupby去重(需要先排序)"""
lst.sort()
return [key for key, _ in groupby(lst)]
# 示例
original_list = [5, 3, 5, 2, 3, 8, 5]
result = remove_duplicates_groupby(original_list)
print(f"原始列表: {original_list}")
print(f"groupby去重后: {result}")性能比较
import timeit
original_list = list(range(1000)) * 3 # 创建包含重复项的大列表
def test_set():
return list(set(original_list))
def test_ordered():
seen = set()
return [x for x in original_list if not (x in seen or seen.add(x))]
print("集合去重耗时:", timeit.timeit(test_set, number=1000))
print("保持顺序去重耗时:", timeit.timeit(test_ordered, number=1000))总结
通过这个列表去重案例,我们学习了:
- 使用集合(set)快速去重(不保持顺序)
- 多种保持原始顺序的去重方法
- 处理复杂对象的去重技巧
- 使用第三方库(pandas/numpy)处理大数据量
- 不同方法的性能比较
选择哪种方法取决于具体需求:
- 如果不需要保持顺序:set()最快
- 需要保持顺序:dict.fromkeys()或列表推导式+集合
- 处理复杂对象:基于属性的去重方法
- 大数据量:考虑使用pandas或numpy
相关推荐
-
- 免费自动连接wifi(最新万能钥匙安全免费自动连接)
-
大多数安卓手机都是支持自动连接免费wifi的。同时,为了安全起见,也有对应的选项:检查wifi安全性。这个可以开启的。当然如果只是经常使用常用地点的wifi,这个可以关闭。关闭方法以三星手机为例:进入“设置”,“连接”,“wlan”,“右上...
-
2026-02-01 02:43 off999
-
- 画图工具(画图工具在电脑哪里)
-
常用的绘图软件有以下这些:1、Coreldraw。Coreldraw是一个绘图和排版软件,主要处理矢量文件。主要用于商标设计、标志制作、模型绘制、插图绘制、排版、分色输出。它在艺术设计和商业设计领域非常流行。2、Photoshop。最强大...
-
2026-02-01 02:15 off999
- qq加速器(Bill bill加速器)
-
可能原因如下:1、官方服务器正在更新升级,为了给用户更好的体验,系统的维护是必不可少的。2、可以检查是否是网络出现了问题,可以更换网络是否正常。3、很多软件都在维护,包括QQ,微信,微博等,只能是等维...
- 进入qq安全中心的官网(qq安全中心入口)
-
1、以电脑版QQ为例,成功登录QQ后,点击界面左下角的“主菜单”图标;2、在弹出框里点击“安全”,再在右边的弹出框里点击“安全中心首页”;3、就会跳转到QQ安全中心的网页了,在里面进行修改密码、我的密...
- pp助手软件苹果版下载(pp助手苹果版免费下载)
-
工具:ipadmini41、打开ipad的桌面,点击safari浏览器进入。2、然后进入以后,在上面的搜索框里面,搜索z.25pp.com-pp助手,然后点击进入。3、然后进入以后就是安装pp助手的...
- 免费声卡软件下载(手机免费声卡软件下载)
-
应用商店上方下载。。第一步:打开浏览器,在网页中搜索“酷狗音乐播放器”,然后可以看到下面的页面。;第二步:选择第一个搜索结果(官网)中根据你要下载的类型切换电脑版、安卓版、苹果版,之后直接下载。;第三...
-
- qq游戏网页版在线登录(qq游戏网页版在线登录官网)
-
这个产品已经下线了啊扩展:WebQQ腾讯公司推出的使用网页方式上QQ的服务,特点是无需下载和安装QQ软件,只要能打开WebQQ的网站就可以登录QQ与好友保持联系。具有Web产品固有的便利性,同时在Web上最大限度的保持了客户端软件的操作习惯...
-
2026-02-01 01:03 off999
- 云电脑在线使用(云电脑怎样使用)
-
使用云电脑的步骤如下:1.注册:首先要有一个账号,然后登录云电脑的官网,进行注册,注册完成后,就可以正式使用云电脑了。2.安装:根据操作系统的不同,下载对应的云电脑客户端,安装完成后,登录账号,即可使...
- pp手机助手安卓版官网(pp手机助手官网首页)
-
你好,PP助手无法连接安卓手机可能出现以下情况:1.请确保手机与电脑连接的USB线正常,并选择正确的传输模式(如文件传输模式)。2.确保你的手机已经开启了USB调试模式。可以在手机设置中的开发者选...
- windows7安装版系统下载(win7安装版安装步骤)
-
1、win7系统装完后需要占用C盘空间10-15GB,如果把常用软件也安装到C盘,大小超过20+。 2、在分区的时候根据硬盘大小,如果硬盘相对较小,一般建议设置50G,最低不能低于30G。因...
- 韩剧网(韩剧网韩剧tv最新韩剧免费观看)
-
不收费,终身不收费~连续剧、综艺、歌曲,通通不要钱。之前好像是技术问题,现在恢复了。其它诸如人人视频、圈粉TV也都可以看韩剧哦。韩剧网有搜索页面的呀,搜索一下就可以了,不过好像《制作人》和玄彬的...
- 跳一跳游戏(跳一跳游戏是什么时候出来的)
-
GiveItUP《GiveItUP》是一款由Invictus推出的益智跑酷游戏。游戏与传统的跑酷类游戏最大的区别在于,游戏融入了高难度的节奏性挑战。红色火焰躲避技巧:红色火焰在游戏中是最常见的一个障碍...
- 什么是oa办公系统(办公oa系统的好处)
-
OA是OfficeAutomation的简写,就是办公自动化。所谓OA系统就是用网络和OA软件构建的一个单位内部的办公通信平台,用于辅助办公。OA系统完成单位内部的邮件通信、信息发布、文档管理、工作...
- 手机万能mp4转换器(手机万能mp4转换器下载)
-
1你需要先下载并安装一个叫格式工厂的软件。2然后打开->mp4。3点击添加文件的选项。4然后选择需要转换的视频,点击确定。5点击确定之后,再添加到转换列表中就可以。6再点...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
win7系统还原步骤图解(win7还原电脑系统的步骤)
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
16949认证费用是多少(16949审核员太难考了)
-
linux软件(linux软件图标)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
