Numpy第6练:如何操控数组的维度与形状?干货满满!
off999 2024-11-14 16:53 17 浏览 0 评论
NumPy数组的维度是什么?形状又是什么?如何优雅地操作?好戏开始!
NumPy数组形状(Shape)与维度(Dimension)
形状(Shape):
在NumPy中,数组的形状是指在每个维度上数组的大小。形状是一个由整数构成的元组,这些整数表示了数组在每个维度上的元素数量。例如:
- 一个一维数组(或称为向量)的形状可能是(n,),其中n是数组中元素的数量。
- 一个二维数组(或称为矩阵)的形状可能是(m, n),其中m是行数,n是列数。
- 对于更高维度的数组,形状将包含更多的整数,每个整数代表该维度上的元素数量。
维度(Dimension):
数组的维度(也称为轴)是数组的深度,即数组嵌套的层数。一个标量(单个数字)是0维,一个向量(数字列表)是1维,一个矩阵(列表的列表)是2维,以此类推。
二者的关系:
形状的长度(即元组中元素的数量)直接表示了数组的维度数。例如,形状为(5,)的数组是一维的,形状为(3, 2)的数组是二维的,形状为(2, 2, 3)的数组是三维的。
每个维度的大小告诉我们在该维度上有多少个元素。在形状为(3, 2)的二维数组中,我们可以看到第一个维度(行)有3个元素,第二个维度(列)有2个元素。
上限:
理论上,NumPy数组的维度和形状的大小没有硬性的上限,但实际上它们受到以下因素的限制:
- 系统内存:每增加一个维度或增大数组的形状,所需的内存量也会增加。对于非常大或非常高维的数组,可能会消耗大量的内存,甚至超过计算机的物理内存限制。
- 处理器能力:即使内存足够,处理高维数据或大规模数组的计算也可能非常耗时,这会对处理器性能提出较高的要求。
- 地址空间限制:在某些系统和NumPy版本中,数组的总大小(即所有元素的数量)受到64位地址空间的限制,这意味着理论上数组的最大元素数量受到264264的限制。然而,实际使用中很少接近这个限制,因为在达到这个点之前,其他因素(如内存大小)就已经成为限制了。
- 实用性:从实际应用的角度看,处理极高维度的数组在逻辑上可能会变得非常复杂,难以管理和理解。大多数实际应用场景中使用的是一维到四维数组,因为它们已经足够表示大多数数据结构,如向量、矩阵、图像(包括彩色图像和视频序列)等。
因此,尽管NumPy在理论上支持非常高维的数组,但在实践中,由于内存、性能和可管理性的限制,使用的维度通常远低于理论上的限制。有效地管理数据结构通常涉及到在维持数据的组织和可访问性与保持计算和存储效率之间找到平衡。
维度的增加与降低
增加维度:
np.newaxis和np.expand_dims都是NumPy中用于增加数组维度的工具,但它们在使用方式上有所不同。尽管它们都可以达到相似的结果,即在指定位置增加一个新的轴(维度),但是它们的语法和某些用法细节有区别。
方法一:np.newaxis
- 使用方法:np.newaxis是通过索引操作来使用的。它是一个特殊的索引器,用于增加数组的维度。你可以通过将其插入到数组索引中的适当位置来增加一个新的轴。
- 场景:当你需要快速地在数组的特定轴上增加一个新的维度时,使用np.newaxis非常方便。它特别适用于数组切片操作中。
方法二:np.expand_dims
- 使用方法:np.expand_dims是一个函数,它通过接受两个参数——原数组和新轴的位置——来工作。你需要明确指定你想在哪个位置增加新的维度。
- 场景:当代码的可读性更重要时,使用np.expand_dims可能更合适。它使得增加维度的操作更明确,更易于理解。
二者区别:
- 语法:np.newaxis通过索引操作使用,而np.expand_dims通过函数调用使用。
- 可读性:np.expand_dims可能在代码可读性方面更胜一筹,因为它明确指出了维度增加的位置。
- 功能:尽管它们在实现上有所不同,但np.newaxis和np.expand_dims都可以用于在数组的指定位置增加新的维度。
降低维度:
NumPy提供了多种方式来降低数组的维度。降维操作对于简化数据结构、提高数据处理效率,以及适配特定算法或库的要求非常重要。以下是一些常用的降维方法:
方法一:使用np.squeeze()
np.squeeze()函数用于从数组的形状中删除单维条目,即它会移除形状中所有为1的维度。这对于去除由于先前操作(如np.newaxis或np.expand_dims)引入的额外维度非常有用。
方法二:使用索引和切片
通过索引和切片操作,你可以选择性地访问数组的一部分,从而实现降维。例如,选择多维数组的一个特定行或列,会返回一个低维的数组。
方法三:扁平化方法
ravel与flatten这两种方法都用于将多维数组转换成一维数组。ravel返回的是视图(如果不需要复制),而flatten总是返回一个副本。
在NumPy中,视图(view)和副本(copy)是两种不同的数组对象类型,它们与原数组的数据共享方式存在根本差异。理解视图与副本的区别对于有效地处理数组和避免数据处理中的错误非常重要。
视图(View)
- 定义:视图是原始数组的一个浅层复制(shallow copy)。它是对原始数据的另一个视角或窗口。视图与原始数组共享相同的数据,意味着如果你修改视图中的数据,原始数组中的对应数据也会被修改,反之亦然。
- 创建:视图可以通过各种操作创建,如索引、切片操作、使用np.reshape、np.ravel等函数时(在不需要复制的情况下)。
- 优点:使用视图可以节省内存和提高计算效率,因为不需要复制数据。
副本(Copy)
- 定义:副本是原始数组的一个深层复制(deep copy)。它创建了原始数据的一个完全独立的副本。副本与原始数组不共享数据,因此修改副本不会影响原始数组,反之亦然。
- 创建:副本可以通过np.copy函数、np.flatten方法等方式创建。
- 优点:使用副本可以避免在处理数据时不小心修改到原始数据,从而保证数据的安全性。
形状的变换
在NumPy中,reshape和resize都是用于改变数组形状的方法,但它们在功能、使用方式以及影响原数组的方式上存在着明显的区别。理解这些区别对于有效地使用NumPy进行数据处理非常重要。
reshape方法
reshape方法用于给数组一个新的形状,而不改变其数据。reshape返回的是数组的视图(如果可能),意味着返回的新数组与原数组共享数据。因此,修改新数组的元素也会影响原数组,反之亦然,除非reshape操作需要复制数据来保证连续性,在这种情况下,它将返回一个数据的副本。
优点
- 不改变原数据:在大多数情况下,reshape不会复制原始数据,因此它是一种非常高效的操作。
- 灵活性:可以很容易地将数组从一个形状转换为另一个形状,只要新旧形状的总元素数量相同。
缺点
- 共享数据:因为reshape返回的新数组通常与原数组共享数据,所以在某些情况下可能会不小心修改原数组。
适用场景
- 当你需要改变数组的形状以用于不同的数学运算或数据分析任务,同时不想复制数据以节省内存时。
resize方法
resize方法改变数组本身的形状。如果新形状的总大小大于原始大小,则会根据需要重复原始数组中的元素来填充新数组。与reshape不同,resize会直接修改原数组(如果调用的是ndarray.resize方法),或者返回一个新的调整大小后的数组(如果使用的是np.resize函数)。
优点
- 直接修改:对于ndarray.resize方法,可以直接在原地修改数组的形状,无需创建新的数组。
- 扩展数据:可以扩展数组大小,并自动填充额外的空间。
缺点
- 数据复制或丢失:扩大数组时,额外的元素是原数组元素的重复;缩小数组时,超出新形状部分的数据会被丢弃。
- 可能不保留原始数据:特别是在扩展数组时,填充的数据可能会导致原始数据模式的重复,这可能不是你想要的结果。
适用场景
- 当需要调整数组大小并且愿意接受数据的重复或丢弃时。例如,当你需要将数据适配到固定大小的结构中,而不在乎数据是否被裁剪或重复。
其它方法:
其实如果我们理解了数组维度的变更也就会明白,维度的变更势必会导致形状的变更,而形状的变更则不一定会导致维度的变更,所以上面提及的增加与降低维度的方法,也是一种形状变化的方式,择机而用即可。
题外话:数组的切片
上面有提及Numpy中数组ndarray的切片操作,切片是一项十分常用的操作手段,需要完全熟悉之,这里咱们再用实际地详细地解释一下。
当你执行切片操作 arr[0, :],你正在对arr这个二维数组进行操作,具体的执行逻辑如下:
- 定位维度:arr[0, :]中的0代表二维数组的第一个维度(通常指的是行)中的第一个元素(在Python中,索引是从0开始的)。这里的第一个维度0指定了二维数组中的第一行。
- 冒号:的含义:冒号:用于指定维度的范围。在这个例子中,它被用在第二个位置(列的位置),没有指定开始和结束的索引,这意味着选择所有的列。简单来说,:代表这个维度(列)的所有元素。
- 执行切片操作:根据上述索引和范围,NumPy会选取第一行的所有列。这个操作会返回一个新的数组视图(如果不需要复制数据),该视图是原始arr2d数组的一部分。具体来说,它返回的是原数组第一行的一个一维数组。
- 结果:row = arr[0, :]这行代码执行后,row变量将包含一个新的一维数组,这个数组是arr2d中第一行的所有元素。如果arr2d是一个形状为(m, n)的二维数组,则row的形状将是(n,),即包含n个元素的一维数组。
如果要从二维数组中切出第一行的前两列,你可以使用切片操作,指定行索引为0(表示第一行)和列索引范围从0到2(不包括2),来选取前两列。在Python和NumPy中,切片的语法是start:stop,其中start是包含在内的起始索引,而stop是不包含在内的结束索引。
# 假设arr2d是你的二维数组
row_first_two_columns = arr2d[0, 0:2]这里的意思是:
- 0:选取第一行(行索引为0)。
- 0:2:在列的维度上,选取从第一列(列索引为0)开始到第三列(列索引为2)之前的所有列,也就是第一列和第二列。
执行这个操作后,row_first_two_columns将包含arr2d第一行的前两列元素。如果arr2d的形状是(m, n),则row_first_two_columns的形状将是(2,),因为它包含了两个元素。
本期内容有点长,但却是十分重要的技术,干货满满!希望能帮助到大家!
相关推荐
- 联想怎么看电脑配置和型号(联想怎么看电脑配置和型号笔记本)
-
笔记本看型号有推荐三种方法:第一种,点击你笔记本上的(开始),然后找到(运行)打开,在里面的输入框里输入(dxdiag)点击确定,你就可以看见笔记本型号,系统型号等笔记本信息。第二种,就是在你的电脑上...
- 怎么ghost电脑系统(怎样ghost)
-
使用GHOST软件备份系统即可。1、网上下载一键GOST安装好,重启电脑运行一键gost-选择手动进入GOST。2、进入GHOST的操作界面,点OK。3、选择菜单到Local(本机)--Partiti...
- u盘读取软件下载(u盘读取器下载)
-
手机播放U盘里的视频不用刻意的去安装什么播放器,一般手机里自带的播放器就能够直接播放U盘里的一般常见的视频。只要你要播放的视频,都是平时在电脑上或者电视上能够正常播放的视频,一般在手机里面它的系统自带...
- office2020安装包百度云下载
-
Office2020和Office2019是微软的办公套件产品,两个版本之间有以下区别:1.发布时间:Office2020于2021年10月发布,而Office2019于2018年9月发布。...
- 硬盘恢复分区(硬盘恢复分区怎么删除)
-
1、在电脑上下载DiskGenius软件。2、双击运行该软件,软件会自动识别硬盘。当软件自动识别硬盘之后,右键单击硬盘的盘符,出现下拉菜单栏,选择搜索已丢失分区(重建分区表)选项。3、右键单击硬盘盘符...
-
- edge 浏览器(edge浏览器官网下载)
-
目前没有,如果是平板安装了WIN10是会内置MicrosoftEdge浏览器的。edge是由微软开发的基于Chromium开源项目及其他开源软件的网页浏览器。Edge浏览器主要特点是能够支持目前主流的Web技术,作为Windows10自带...
-
2025-11-18 06:51 off999
-
- 网易163邮箱免费注册(163网易免费邮件注册)
-
163邮箱登录入口页面官方地址:https://mail.163.com/163邮箱登录注册方法1、进入邮箱登入首页,我们点击右下角“去注册”按钮,进入注册界面;2、这里直接填写账号和密码内容,点一下同意那里呈蓝色圆点;再点下一步。3、再填...
-
2025-11-18 06:03 off999
- 苹果商城app下载安装(苹果商店app免费下载)
-
一、苹果手机下载软件显示APP内购买的意思是APP可以免费下载使用,但是该APP内有付费内容,也就是通常所说的收费道具。二、不是所有应用都会提供App内购买项目。如果某个应用提供App内购买...
- 惠普电脑中国官网(惠普手提电脑官网)
-
https://support.hp.com/cn是惠普笔记本售后服务官网。惠普维修服务中心通过整合线上线下相关资源,向国内用户提供方便快捷、安全可靠的优质电子产品维修服务。目前拥有北京6家、全国30...
- windows2003密钥序列号(win2003 密钥)
-
没有密钥就无法完成程序安装。使用或者购买密钥才能安装
- 电脑产品密钥在哪里找win10(电脑产品密钥在哪里找新机)
-
要查看电脑上Windows10的产品密钥,你可以按照以下步骤进行操作:打开“开始”菜单,然后点击“设置”图标(齿轮状图标)。在“设置”窗口中,点击“更新和安全”选项。在左侧导航栏中,选择“激活”选项...
- 电脑有网络但上不到网(电脑有网但是上不了网)
-
如果电脑显示有网但无法上网,可能是网络连接出现问题。这种情况可能是由于以下几个原因导致的:1.路由器或者调制解调器出现故障;2.电脑的网络设置有误;3.网络供应商的服务中断或者限制了你的网络访问...
- 笔记本突然开不了机了是什么情况
-
1.检查笔记本是否有电,当内置电池用完而又没有充电的情况下,会导致笔记本无法开机,插上电源充电即可。2.内置电池损坏维修更换即可。3.开机时按F8,在高级选项中选择最后一次正确的配置即可。4.中病毒可...
- windows11办公软件(windows11的office)
-
1、首先点击电脑底部的Windows图标2、进入开始页面点击office套件中的任意应用,如Word3、页面弹出登录按钮,和创建按钮,如已有账号,点击登录4、接着进入激活office页面,输入offi...
-
- 7z文件怎么打开(7z文件改什么后缀才能打开)
-
7z是一种压缩格式,和我们在Windows平台上看到的rar类似;7z原本是7-zip开源的压缩文件所支持的压缩格式,目前大多数压缩软件也支持打开,如若安装了第三方压缩软件双击即可打开7z。7z文件的打开方式介绍如下: 1、扩展名为...
-
2025-11-18 02:03 off999
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
