百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

读一读我——无废话Python(六)使用切片

off999 2024-09-21 21:03 23 浏览 0 评论


切片可以说是 Python 中最重要的特性之一。比如内建的 list,tuple,str 类型全都支持切片操作。而且,切片也是一些著名第三方库的基础,比如 NumPy,Pandas,TensorFlow 和 scikit-learn。因此,要想成为一名合格的 Python 程序员,切片是必会项目。

切片的使用公式如下:

a[start:stop:step]

基础不讲了。这里只总结规律:

  1. 如果 start >= stop 并且 step 是正数,那么将返回值为空。
  2. 如果 stop 大于要截取的序列的长度,返回值为从 start 开始一直到最后一个元素(包含最后一个元素)。
  3. 如果 step 是正数,start 为第一个元素,stop 为最后一个元素,返回值肯定包含第一个元素和最后一个元素。
  4. 如果 step < 0,start 和 stop 都为默认值,返回值肯定包含第一个元素和最后一个元素;如果 stop 不为默认值,返回值肯定不包含 stop 对应的索引。

下面我们来看看如何用切片解决问题。假设有一段文本,给你一个字符串,让你返回一段文本,该文本包含该字符串以及该字符串的前 20 个字符和后 20 个字符。

d = '''
Life is a chess-board The chess-board is the world: the pieces are the phenomena of the universe; the rules of the game are what we call the laws of nature. The player on the other side is hidden from us. We know that his play is always fair, just and patient. But also we know, to our cost, that he c overlooks a mistake, or makes the smallest allowance for ignorance.
'''

find_str = lambda txt, str: txt[txt.find(str)-20:txt.find(str)+20] if str in txt else -1
print(find_str(d, 'smallest')) # stake, or makes the smallest allowance f

查找字符串我们使用的是 in 操作符,查找索引我们用的是 Python 内建的 find 函数,它会返回该字符串首字母索引。根据问题描述,切片的 start 和 stop分别为减 20 和加 20。

当然这段程序有个明显的缺点,就是调用了两次 find 函数,但如果使用临时变量就无法让程序如此简洁了。有没有既简洁又高效的办法?有。你可以先思考一下,我们以后再说。

下面我们来看个列表解析和切片组合使用的例子。

假设我们有一个 4 行 6 列的二维数组,用作机器学习的训练数据。但我们的机器太菜,6 个特征已经不堪重负,需要缩减特征数到 3 个。解决方案如下:

data = [
  [1.1, 1.2, 1.3, 1.4, 1.5, 1.6],
  [2.1, 2.2, 2.3, 2.4, 2.5, 2.6],
  [3.1, 3.2, 3.3, 3.4, 3.5, 3.6],
  [4.1, 4.2, 4.3, 4.4, 4.5, 4.6]
]

result = [line[::2] for line in data]

print(result) # [[1.1, 1.3, 1.5], [2.1, 2.3, 2.5], [3.1, 3.3, 3.5], [4.1, 4.3, 4.5]]

我们的解决方案分两步走。首先利用列表解析从数据中取出每一行数据作为新 list 的元素(还是一个 list,包含 6 个元素);其次,我们利用切片,对这个取出来的含有 6 个元素的 list 做操作,以步长为 2 的方式把 6 个数据缩减到了 3 个数据。

最后,让我们来看看切片的另一个强大特性,slice assignment,中文就叫切片赋值好了。

什么是切片赋值?简单的说就是切片操作放在了等号的左边。

s1[::] = s2[::]

它表达的含义是什么?更简单,就是用 s2 的返回值覆盖 s1 的返回值。来看代码:

# 怪异的数据
data = [
  "a", "1", "b", "2",
  "c", "3", "d", "4",
  "e", "5", "f", "6"
]

# 需求是:把数字替换成它前面的字母
data[1::2] = data[::2]

print(data) # ['a', 'a', 'b', 'b', 'c', 'c', 'd', 'd', 'e', 'e', 'f', 'f']

说实话,在不知道切片赋值之前,我是用循环做的,真的是一名不合格的 Python 程序员。我们来稍稍解释一下。等号左边切片的返回值为:["1", "2", …],等号右边切片的返回值为:["a", "b", …]。

请关注公众号“读一读我”。

相关推荐

python入门到脱坑经典案例—清空列表

在Python中,清空列表是一个基础但重要的操作。clear()方法是最直接的方式,但还有其他方法也可以实现相同效果。以下是详细说明:1.使用clear()方法(Python3.3+推荐)...

python中元组,列表,字典,集合删除项目方式的归纳

九三,君子终日乾乾,夕惕若,厉无咎。在使用python过程中会经常遇到这四种集合数据类型,今天就对这四种集合数据类型中删除项目的操作做个总结性的归纳。列表(List)是一种有序和可更改的集合。允许重复...

Linux 下海量文件删除方法效率对比,最慢的竟然是 rm

Linux下海量文件删除方法效率对比,本次参赛选手一共6位,分别是:rm、find、findwithdelete、rsync、Python、Perl.首先建立50万个文件$testfor...

数据结构与算法——链式存储(链表)的插入及删除,

持续分享嵌入式技术,操作系统,算法,c语言/python等,欢迎小友关注支持上篇文章我们讲述了链表的基本概念及一些查找遍历的方法,本篇我们主要将一下链表的插入删除操作,以及采用堆栈方式如何创建链表。链...

Python自动化:openpyxl写入数据,插入删除行列等基础操作

importopenpyxlwb=openpyxl.load_workbook("example1.xlsx")sh=wb['Sheet1']写入数据#...

在Linux下软件的安装与卸载(linux里的程序的安装与卸载命令)

通过apt安装/协助软件apt是AdvancedPackagingTool,是Linux下的一款安装包管理工具可以在终端中方便的安装/卸载/更新软件包命令使用格式:安装软件:sudoapt...

Python 批量卸载关联包 pip-autoremove

pip工具在安装扩展包的时候会自动安装依赖的关联包,但是卸载时只删除单个包,无法卸载关联的包。pip-autoremove就是为了解决卸载关联包的问题。安装方法通过下面的命令安装:pipinsta...

用Python在Word文档中插入和删除文本框

在当今自动化办公需求日益增长的背景下,通过编程手段动态管理Word文档中的文本框元素已成为提升工作效率的关键技术路径。文本框作为文档排版中灵活的内容容器,既能承载多模态信息(如文字、图像),又可实现独...

Python 从列表中删除值的多种实用方法详解

#Python从列表中删除值的多种实用方法详解在Python编程中,列表(List)是一种常用的数据结构,具有动态可变的特性。当我们需要从列表中删除元素时,根据不同的场景(如按值删除、按索引删除、...

Python 中的前缀删除操作全指南(python删除前导0)

1.字符串前缀删除1.1使用内置方法Python提供了几种内置方法来处理字符串前缀的删除:#1.使用removeprefix()方法(Python3.9+)text="...

每天学点Python知识:如何删除空白

在Python中,删除空白可以分为几种不同的情况,常见的是针对字符串或列表中空白字符的处理。一、删除字符串中的空白1.删除字符串两端的空白(空格、\t、\n等)使用.strip()方法:s...

Linux系统自带Python2&amp;yum的卸载及重装

写在前面事情的起因是我昨天在测试Linux安装Python3的shell脚本时,需要卸载Python3重新安装一遍。但是通过如下命令卸载python3时,少写了个3,不小心将系统自带的python2也...

如何使用Python将多个excel文件数据快速汇总?

在数据分析和处理的过程中,Excel文件是我们经常会遇到的数据格式之一。本文将通过一个具体的示例,展示如何使用Python和Pandas库来读取、合并和处理多个Excel文件的数据,并最终生成一个包含...

【第三弹】用Python实现Excel的vlookup功能

今天继续用pandas实现Excel的vlookup功能,假设我们的2个表长成这样:我们希望把Sheet2的部门匹在Sheet1的最后一列。话不多说,先上代码:importpandasaspd...

python中pandas读取excel单列及连续多列数据

案例:想获取test.xls中C列、H列以后(当H列后列数未知时)的所有数据。importpandasaspdfile_name=r'D:\test.xls'#表格绝对...

取消回复欢迎 发表评论: