百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

懂Excel就能轻松入门Python数据分析包pandas(七):分列

off999 2024-10-13 04:13 31 浏览 0 评论

转发本文并私信我"python",即可获得Python资料以及各种心得(持续更新的)

经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas

前言

今天从两个需求来看看数据分列功能,由于 Excel 自带功能比较弱,在处理稍微复杂的需求时会显得力不从心,因此,本系列文章将引入 Excel 中一个非常高效的数据处理插件—— Power Query,并且看看 pandas 是怎样灵活解决。

本文结构:

  • 先看看简单的分列
  • 接着尝试分割扩展成行
  • 最后是多列分割扩展成行

Excel 分列

Excel 中对数据进行分列是非常简单的。如下:

  • 选中需要处理的列
  • 功能卡"数据","分列"按钮,即出现设置弹窗
  • 选"分隔符号",点击下一步
  • 左上部分,勾选"逗号",点击下一步
  • 最后看到结果预览,没问题,直接点击完成

pandas 分列

pandas 对文本列进行分列,非常简单:

  • DataFrame.str.split() ,对文本列分列,第一参数指定分隔符
  • 此外,参数 expand ,表示是否扩展成列,若设置为 True ,则分割后的每个元素都成为单独一列。这符合当前需求

复杂点的需求

有时候,我们希望分割的内容,转化成行,需求如下:

  • 比如,第一行 张三 的科目中有3个元素,则分割结果 张三就有3行

使用 Excel 自带功能处理这需求就比较困难,我们使用 Power Query 来处理:

  • 功能区"Power Query",点"从表/范围"
  • 此时会启动 Power query 编辑窗口

  • 点选 科目 整列
  • 上方功能区"开始","转换"区中,点选"拆分列",选"按分隔符"

  • 这里大部分设置与 Excel 自带功能基本一致
  • 点开"高级选项",点选"拆分为"中的"行"

  • 功能区"开始",最左边点按钮"关闭并上载",即可把结果输出会 Excel

请自行到官方网站下载此插件安装


那么 pandas 中怎么实现这需求:

  • 先用 str.split 分割,但这次不需要 expand
  • 调用 DataFrame.explode(),对某一序列类型的列进行展开

注意,explode 方法是 pandas 0.25 版本的新增方法


提升难度

假如现在有多列需要进行分割展开呢?如下:

  • 同时把科目和成绩分割扩展到行

直接看 pandas 怎么解决:

  • 先对 科目 与 成绩 列分别进行 split 后,再进行 explode
  • 然后通过 concat,与原来的 性名 列合并

虽然实现了,但代码的语义不够清晰。编程语言的灵活性在此可以充分体现,我们把逻辑封装成一个函数 hp_explode ,以后需要使用时,简单调用即可:

  • hp_explode() ,可自动识别内容是 list 的列进行扩展

hp_explode 方法的定义不是本文的核心,需要源码的小伙伴看文末


不想调用 .str.split ?当然也支持:

  • 一句搞定

总结

  • Series.str.split() ,对文本列分割
  • expand 参数指定是否扩展为列
  • DataFrame.explode() ,对序列的列扩展成行,通常与 Series.str.split() 配合使用

下一节,将看看 Excel 举世闻名的 vlookup 函数与 pandas 中的实现

需要源码的小伙伴请私信我,转发本文并私信我"python"

如果希望从零开始学习 pandas ,那么可以看看我的 pandas 专栏。

相关推荐

windows7x86是32位吗(windows7 x86)

X86不是代表操作系统,是代表的CPU的类型,如果你知道CPU的发展史就知道,个人用计算机的CPU很早的版本是从286、386、486、586、奔腾等等类型发展起来的,所以X86的代表PC的CPU的类...

固态硬盘删除后又自动恢复了

进入BIOS查看,第一启动项是不是UEFI引导,改掉它可以下载个pe,下载安装在本地磁盘里,重启进入pe工具,先给固态格式化分区,在ghost机械盘上的系统,还原到固态上。遇到这种情况一定不要在此...

win10版本回退(win10回退到以前版本)

如果你想在Windows10系统中回退到上一个版本,可以按照以下步骤进行操作:1.打开设置:点击Windows开始按钮,然后点击屏幕左侧的“设置”图标,或者使用键盘快捷键Win+I打开设置。2...

营业厅一个路由器多少钱(上门更换路由器收费吗)

移动免费装宽带活动全国都在搞,不过免费是有“门槛”的。以我所在的地区为例,只有月费在78元及以上的大流量套餐用户,才可以享受免费安装移动的宽带。月费越高,宽带的速率也越高,148元档可以安装200M的...

win10从u盘启动怎么设置(win10怎么从u盘启动电脑)

1.回到桌面。点击开始徽标,点击开始菜单左侧的设置。2.设置界面点击更新和安全。3.进入更新和安全界面,点击左侧的恢复选项。4.进入恢复界面,点击高级启动下面的立即重新启动。5.插入自己的U盘,等待...

系统大全网站(系统大全网站推荐)

下载时发生错误可能是以下原因:1.你的网速过慢,网页代码没有完全下载就运行了,导致不完整,当然就错误了。请刷新。2.网页设计错误,导致部分代码不能执行。请下载最新的遨游浏览器。3.你的浏览器不兼容导致...

win10官方启动盘(win10官方启动盘怎么用)

1、在开始菜单搜索“设置”,打开“设置”;2、点击“更新与安全”,在左侧菜单栏点击“恢复”;3、点击“启动项”,在弹出的窗口中会显示当前可以启动的项目,点击“编辑”;4、在打开的“编辑启动项”窗口中,...

win10系统安装不了(win10 安装不了)

电脑装不上win10系统可能是因为以下几个原因导致的原因一:win10安装文件不对我们在安装win10之前,要确保下载到安装包真实可用的,否则安装肯定会有问题,建议下载安全可靠的安装包!原因二:系统文...

国内dns哪个最快(dns开启好还是关闭好)

移动dns设置首选114.114.114.114,它又好又快。首选DNS和备用DNS都是一种域名系统,这两种域名系统有着先后之分,如果在首选DNS正常的情况下,就用首选DNS地址。当首选DNS服务器出...

winxp安装盘(winxp系统安装)

xp系统安装步骤如下1、将下载的xp系统iso压缩包文件下载到C盘之外的分区,比如下载到D盘,右键使用WinRAR等工具解压到当前文件夹或指定文件夹,不能解压到C盘和桌面,否则无法安装;?2、解压之后...

现在的win11稳定了吗(win11稳定嘛)

windows10更稳定,由于win11刚刚推出没多久,稳定差不够好,兼容性也有待提升,无论是应用还是游戏都会遇到不明程度的问题,因此,在日常的使用过程中,我们还是应当以稳定性为优先,选择win10是...

xp安装包下载到手机(xp系统安装包)

手机是基于ARM架构的处理器,而WindowsXP是基于x86架构的操作系统,因此无法直接在手机上安装WindowsXP。除非您的手机是使用Intel处理器,但这种情况非常罕见。如果您需要在手机上...

如何查看硬盘序列号(windows如何查看硬盘序列号)

1.打开开始菜单栏,输入【cmd】点击【确定】;2.在命令窗口依次输入【diskpart】-【listdisk】-【selectdisk0】;3.选好要查看的硬盘后,接着输入【detaildi...

虚拟机安装win7教程(虚拟机安装win7教程图解)

1.首先,下载并安装虚拟机软件,如VMwareWorkstation、VirtualBox等。2.打开虚拟机软件,创建一个新的虚拟机。3.在创建虚拟机的过程中,选择安装Windows7专业版的IS...

系统脱敏法的操作程序如何

系统脱敏疗法(systematicdesensitization)又称交互抑制法,是由美国学者沃尔普创立和发展的。这种方法主要是诱导求治者缓慢地暴露出导致神经症焦虑、恐惧的情境,并通过心理的放松状态...

取消回复欢迎 发表评论: