Python 不用库,取数据差集、并集
off999 2024-10-30 03:04 43 浏览 0 评论
还记得第一篇文章是求二个数据的交集,那是一次工作中的实际需求,后面就想到了直接把差集及并集一并做了,说不定某个时候就能用到。如何取交集请查看以前的文章:用python轻松求百万数据交集,秒杀EXCEL
还是二个文件,一个A.TXT,一个B.TXT,取差集或并集后输出C.TXT(取差集输出的C.TXT有二种情况,一种是取完差集的A,一种是取完差集的B,需要注意一下),主要思路还是利用set()集合的特性来做。详细情况,代码注释里都有,需要的朋友可以自行查看。
取差集代码如下:
# -*- coding:UTF-8
# 作者:aovs 2018-03-07
# Python 版本:3.6.4
# 本代码实现将a.txt、b.txt二个文本文件取差集后输出c.txt文档,c.txt为a/b去除重复后的b值(若x-y则c.txt为a/b去重后的a值),输出的文档数据无序无重复。
# 将a.txt创建为列表
print ('本程序实现将a.txt、b.txt二个文本文件取并集后输出c.txt文档,c.txt为a/b去除重复后的b值,输出的文档数据无序无重复。')
print ('请确定你的Python版本不低于3.6.4,a.txt和b.txt文件已经准备就绪。')
lista = [] # 创建空列表lista
fa = open('A.txt',encoding='utf-8') # 打开a.txt,最后一行必须换行
# 'a.txt'每行数据赋给列表lista
for line in fa.readlines():
lista.append(line.replace('\n','\n')) #将'\n'替换成换行
# 将b.txt创建为列表
listb = [] # 创建空列表listb
fb = open('B.txt',encoding='utf-8') # 打开a.txt,最后一行必须换行
# 'b.txt'每行数据赋给列表listb
for line in fb.readlines():
listb.append(line.replace('\n','\n')) #将'\n'替换成换行
x = set(lista) # 将lista去重后赋给x
y = set(listb) # 将listb去重后赋给y
c = y - x # y、x取差集(若x-y则c.txt为a/b去重后的a值)
fc = open('c.txt', 'w',encoding='utf-8') # 创建或打开'C.TXT'
fc.writelines(c) # 将交集数据写入'c.TXT'
fc.close() # 搞定,收工。
print ('正在处理数据……请稍候')
print ('搞定,打开a.txt同文件夹下的c.txt查看结果。')
取并集代码如下:
# -*- coding:UTF-8
# 作者:aovs 2018-03-07
# Python 版本:3.6.4
# 本代码实现将a.txt、b.txt二个文本文件取并集后输出c.txt文档,输出的文档数据无序无重复。
# 将a.txt创建为列表
print ('本程序实现将a.txt、b.txt二个文本文件取并集后输出c.txt文档,输出的文档数据无序无重复。')
print ('请确定你的Python版本不低于3.6.4,a.txt和b.txt文件已经准备就绪。')
lista = [] # 创建空列表lista
fa = open('A.txt',encoding='utf-8') # 打开a.txt,最后一行必须换行
# 'a.txt'每行数据赋给列表lista
for line in fa.readlines():
lista.append(line.replace('\n','\n')) #将'\n'替换成换行
# 将b.txt创建为列表
listb = [] # 创建空列表listb
fb = open('B.txt',encoding='utf-8') # 打开a.txt,最后一行必须换行
# 'b.txt'每行数据赋给列表listb
for line in fb.readlines():
listb.append(line.replace('\n','\n')) #将'\n'替换成换行
x = set(lista) # 将lista去重后赋给x
y = set(listb) # 将listb去重后赋给y
c = x | y # x、y取并集
fc = open('c.txt', 'w',encoding='utf-8') # 创建或打开'C.TXT'
fc.writelines(c) # 将交集数据写入'c.TXT'
fc.close() # 搞定,收工。
print ('正在处理数据……请稍候')
print ('搞定,打开a.txt同文件夹下的c.txt查看结果。')
所有的代码都经过验证,大家可放心使用。
在取差集的时候会自动把重复的数据也剔除了,在取并集的时候也同样会去除重复数据,如果需要这些重复的数据,只想要差集或者并集呢?其实也不难,不重复的数据都有了,也找不到重复的吗?你能做到吗?
周末了,祝大家周末愉快。
相关推荐
- 快吧游戏官网(快吧游戏中心)
-
1.快吧游戏可以通过官方网站或应用商店进行下载。2.官方网站提供了游戏的下载链接,也可以通过扫描二维码进行下载。快吧游戏是一款手机游戏,可以在应用商店中下载安装。以下是在iOS和Android系统...
- 最开放的浏览器下载(最开放的浏览器下载软件)
-
可以直接在浏览器设置内打开下载目录进行查看,步骤如下:所需材料:华为6X、华为浏览器示例。一、因为所有浏览器的设置基本一至,这里以华为浏览器为例,首先点击打开华为浏览器。二、打开浏览器后,点击右下角的...
- 万年历2025最新版(万年历2025最新版属相)
-
2024年正月初十对应的阳历出生日期是2024年2月1日。如果按照周岁来计算,他们属龙。辰龙(甲辰年):在中国传统文化中,龙象征着权力、尊贵和神圣。
- 163邮箱登录网页版(163邮箱登录网页版官网)
-
http://mail.163.com步骤一:输入邮箱官网网址http://mail.163.com/打开163邮箱登录入口界面。步骤二:输入已有的邮箱账号、密码,点击登录即可。步骤三:如果没有邮箱账...
- 青骄第二课堂学生登录入口(青骄第二课堂,登录入口)
-
青骄第二课堂学生账号注册是不需要学生注册的,是经过每个学校的老师就是班主任注册之后,学生才能登录首先我们要打开自己的微信,点击打开微信右上方的加号点击添加好友,点击公众号,搜索青椒第二课堂点...
- 视频剪辑器(视频剪辑器在线使用)
-
推荐4款常用的视频剪辑软件吧:大众级别的:剪大师、会声会影专业级别的:AdobePremiere、EDIUS先介绍大众级别的吧:一:剪大师?自动关键帧动画技术,多轨逐帧精确剪辑,制作精彩动画影片?...
- y2002电音(y2002电音app下载)
-
http://music.163.com/?t=1434936352062#/search/m/?s=Bear%20Grillz&type=1
- 刷机大师官网(如何自己刷机)
-
刷机工具除了爱思助手,还有一件刷机大师等第三方刷机工具。助手作为国内的一个第三方刷机工具,除了这个刷机工具之外,还有其他的辅助工具也能进行刷机,例如线刷大师或者线刷宝。以及一键刷机大师等第其他第三方...
- 4399以前的老游戏全部(4399以前的老游戏全部双人游戏)
-
现在都是玩另外的游戏的OL这款游戏的玩法多样,技能连招华丽,并且很实用,让我们的每一刀都那么使用,CAPCOM的游戏打击感总是那么爽落,OL也支持手柄模式,CAPCOM的手柄独特的打击震动,让...
- 斗地主游戏玩法(斗地主玩法百度经验)
-
该游戏由三人个玩一副牌,地主是一方,其余两家为另一方,双方对战,先出完的一方胜。出牌规则类似“争上游”。三人斗地主使用一副54张的扑克牌,包括两张怪(王),即大怪和小怪。牌面从大到小依次是:大怪、小怪...
欢迎 你 发表评论:
- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
