百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python入门到脱坑经典案例—列表去重

off999 2025-06-15 18:36 62 浏览 0 评论

列表去重是Python编程中常见的操作,下面我将介绍多种实现列表去重的方法,从基础到进阶,帮助初学者全面掌握这一技能。

方法一:使用集合(set)去重(最简单)

python

def remove_duplicates_set(lst):
    """使用集合去重(不保持原始顺序)"""
    return list(set(lst))

# 示例
original_list = [3, 5, 2, 3, 8, 5, 9, 2]
result = remove_duplicates_set(original_list)
print(f"原始列表: {original_list}")
print(f"去重后: {result}")

方法二:保持顺序的去重方法

def remove_duplicates_ordered(lst):
    """保持原始顺序的去重方法"""
    seen = set()
    return [x for x in lst if not (x in seen or seen.add(x))]

# 示例
original_list = [3, 5, 2, 3, 8, 5, 9, 2]
result = remove_duplicates_ordered(original_list)
print(f"原始列表: {original_list}")
print(f"保持顺序去重后: {result}")

方法三:使用字典键去重(Python 3.7+保持插入顺序)

def remove_duplicates_dict(lst):
    """使用字典键去重(Python 3.7+保持顺序)"""
    return list(dict.fromkeys(lst))

# 示例
original_list = ['apple', 'banana', 'apple', 'orange', 'banana']
result = remove_duplicates_dict(original_list)
print(f"原始列表: {original_list}")
print(f"字典键去重后: {result}")

方法四:使用enumerate和列表推导式

def remove_duplicates_enumerate(lst):
    """使用enumerate去重(保持顺序)"""
    return [x for i, x in enumerate(lst) if x not in lst[:i]]

# 示例
original_list = [1, 2, 3, 2, 4, 3, 5]
result = remove_duplicates_enumerate(original_list)
print(f"原始列表: {original_list}")
print(f"枚举去重后: {result}")

方法五:使用pandas库(适合大数据量)

import pandas as pd

def remove_duplicates_pandas(lst):
    """使用pandas去重(保持顺序)"""
    return pd.unique(lst).tolist()

# 示例
original_list = [10, 20, 30, 20, 40, 10, 50]
result = remove_duplicates_pandas(original_list)
print(f"原始列表: {original_list}")
print(f"pandas去重后: {result}")

方法六:使用numpy库

import numpy as np

def remove_duplicates_numpy(lst):
    """使用numpy去重(不保持顺序)"""
    return np.unique(lst).tolist()

# 示例
original_list = [7, 5, 7, 3, 5, 9, 3]
result = remove_duplicates_numpy(original_list)
print(f"原始列表: {original_list}")
print(f"numpy去重后: {result}")

方法七:处理复杂对象的去重(基于某个属性)

ef remove_duplicates_objects(lst, key=None):
    """复杂对象去重(基于某个属性)"""
    seen = set()
    return [x for x in lst if not (key(x) in seen or seen.add(key(x)))]

# 示例
class Product:
    def __init__(self, id, name):
        self.id = id
        self.name = name
        
    def __repr__(self):
        return f"Product({self.id}, '{self.name}')"

products = [
    Product(1, "Apple"),
    Product(2, "Banana"),
    Product(1, "Apple"),
    Product(3, "Orange")
]

result = remove_duplicates_objects(products, key=lambda x: x.id)
print("原始产品列表:")
for p in products:
    print(p)
print("\n基于ID去重后:")
for p in result:
    print(p)

方法八:使用itertools.groupby(需要先排序)

from itertools import groupby

def remove_duplicates_groupby(lst):
    """使用groupby去重(需要先排序)"""
    lst.sort()
    return [key for key, _ in groupby(lst)]

# 示例
original_list = [5, 3, 5, 2, 3, 8, 5]
result = remove_duplicates_groupby(original_list)
print(f"原始列表: {original_list}")
print(f"groupby去重后: {result}")

性能比较

import timeit

original_list = list(range(1000)) * 3  # 创建包含重复项的大列表

def test_set():
    return list(set(original_list))

def test_ordered():
    seen = set()
    return [x for x in original_list if not (x in seen or seen.add(x))]

print("集合去重耗时:", timeit.timeit(test_set, number=1000))
print("保持顺序去重耗时:", timeit.timeit(test_ordered, number=1000))

总结

通过这个列表去重案例,我们学习了:

  1. 使用集合(set)快速去重(不保持顺序)
  2. 多种保持原始顺序的去重方法
  3. 处理复杂对象的去重技巧
  4. 使用第三方库(pandas/numpy)处理大数据量
  5. 不同方法的性能比较

选择哪种方法取决于具体需求:

  • 如果不需要保持顺序:set()最快
  • 需要保持顺序:dict.fromkeys()或列表推导式+集合
  • 处理复杂对象:基于属性的去重方法
  • 大数据量:考虑使用pandas或numpy

相关推荐

win10自动更新后桌面文件全没了

打开控制面板,找到用户账户,看看有几个账户。如果有多个账户,则重新启动计算机,登录另一个账户,看看桌面文件是否回来了。以上方法未成功,则在整个电脑里搜索以前的那个文件夹。搜索也找不到,就下载并安装一个...

三星固态硬盘(三星固态硬盘序列号查询官网)

您可以通过访问三星官方网站的支持页面来查询三星固态硬盘的序列号。在支持页面中,您可以找到一个名为"产品注册"或"产品查询"的选项。点击该选项后,您将被要求输入您的固态硬...

手机恢复出厂设置后数据能恢复吗

1、首先来说如果点击了“恢复出厂设置”朋友们完全不用惊慌,因为手机上的数据还是能够找回来的。2、在网上找一款免费的手机恢复数据软件,例如安卓上的应用手机数据恢复精灵,根据手机恢复数据软件向导式提醒进行...

万能浏览器手机版下载安装(万能浏览器手机版下载安装最新版)

用起来还是挺靠谱的,但是可能会有捆绑的恶意软件,各种弹窗很烦人OPPO手机浏览器搜索网站的方法:在页面顶部的搜索栏输入URL或搜索关键字。搜索栏下会出现搜索建议,可直接点击符合你搜索目标的建议。点击搜...

windows彻底关闭自动更新(关闭windows 自动更新)

方法一:Windows设置  要想关闭Win10自动更新,比较简单的一种方法就是进入到Windows设置中,将Windows更新直接关闭。步骤如下:  1、按“Windows+I”键,打开Wind...

potplayer安卓版官网(potplayer apk下载)

教程如下:Potplayer是一款非常强大的媒体播放器,是由原KMPlayer的制作者自己开发的,软件体积小,功能强大,占用内存非常小,其软件内置解码器几乎能播放任何格式的媒体文件,而且软件本身没有任...

十大公认最耐用的台式电脑(哪个品牌的台式机电脑最耐用)
十大公认最耐用的台式电脑(哪个品牌的台式机电脑最耐用)

一般来说,品牌机没有单卖的,都是成套的主机显示器一起销售的,如果价格不是问题,单说耐用,个人感觉还是IBM的耐用,再其次什么戴尔,联想,华硕,宏碁什么的也都可以。惠普台式电脑和戴尔台式电脑相比较,肯定是戴尔台式电脑的质量比较好,因为戴尔台...

2025-12-13 13:03 off999

360下载的软件不在桌面上(电脑下载360为什么不在桌面)

方法如下。打开360浏览器的设置按钮,在设置中选择将下载的文件浏览到桌面,点击应用保存,这是即可将360文件下载的内容直接储存到桌面上。可以选择F3进行搜索,搜到360浏览器之后打开他的这个文件夹,找...

电脑读不了u盘怎么回事(电脑读不出u盘了)

方法1:取消勾选“隐藏的驱动器”  1、首先要排除是不是U盘损坏的问题,当U盘插入到其他电脑,如果可以读出来,那么肯定不是U盘的问题了。  2、很有可能是U盘在你的电脑上被隐藏了,将U盘插入电脑后,打...

ps2游戏iso镜像下载(ps2游戏镜像格式)

什么格式都有,网上下的有CDI或者NRG,我自己转的MDF也可以玩,当然转成ISO也可以玩.不用看到光盘的实际文件后再制作镜像文件,你只要通过专门的镜像制作软件将整个光盘完整的克隆出来就行了,制作PS...

虚拟机安装教程win7镜像文件下载

要下载虚拟机的镜像系统,首先你需要确定你想要安装的虚拟机系统类型(比如VMware、VirtualBox、Hyper-V等),然后前往官方网站或认可的第三方网站,找到所需的镜像系统下载链接。在下载镜像...

360游戏中心官网手游(360游戏专区)

360游戏大厅的登录方法:首先,需要在应用程序中搜索并安装360手机卫士应用程序,然后打开应用程序并点击“账号与安全”选项,在页面中选择“360账号登录”并输入账号密码即可成功登录360帐号,然后点击...

搜狗输入法最新版下载(搜狗输入法最新版下载官网是多少)

2、点击页面上很大的字体“立即下载”3、如果没有下载工具的话就点击“保存”,选择保存路径,“保存”在桌面上(这样方便安装)如果你直接点击运行的话他会保存在“临时文件夹”里面;4、你双击桌面上你下载完成...

联想进入bios设置(联想进入bios设置中文)

联想Bios设置详解如下1、首先打开电脑电源。当电脑屏幕上出现画面“Lenovo”的时候,并且在左下角还会看见如下字样“PressF2toSetup”。这时迅速按下键盘上的“F2”键,就可以进入...

windows player支持什么格式
windows player支持什么格式

Windows系统自带的播放器是WindowsMediaPlaye,通常简称“WMP”。WMP可以播放MP3,WMA,WAV等音频格式文件(RM文件由于竞争关系微软默认并不支持,不过在V8以后的版本,如果安装了解码器,RM文件可以播放)...

2025-12-13 09:03 off999

取消回复欢迎 发表评论: