百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

【Python入门】Python字典的这些黑科技,你用过几个?

off999 2024-10-05 19:36 18 浏览 0 评论

第1章 字典初识

1.1 字典定义与特点

在Python编程语言的宇宙里,字典(dictionary)是一种非常强大的数据结构,它以键-值对(key-value pairs)的形式存储信息,类似于现实生活中的一本详尽的索引目录。每个键都是独一无二的 ,用于标识与其相关联的特定值。字典的魅力在于它提供了近乎瞬时的查找速度 ,这得益于其内部实现的哈希表机制。与列表或元组不同 ,字典是无序集合,这意味着它们不保证元素的插入顺序。

1.2 字典创建方法

创建字典的方式多样,如同调色盘上的色彩 ,每一种都有其独特的应用场景。

直接赋值法

最直观的方法是直接通过花括号 {} 来初始化一个字典,键值对之间用逗号分隔。

my_dict = {'apple': 4, 'banana': 2, 'orange': 1}

使用dict()构造函数

另外 ,也可以利用 dict() 函数来构造字典,这对于动态生成字典或者从其他序列类型转换尤为有用。

another_dict = dict(apple=4, banana=2, orange=1)

通过zip函数配对键值序列

如果键和值分别存储在两个列表中,可以巧妙地利用 zip() 函数和 dict() 结合创建字典。

keys = ['apple', 'banana', 'orange']
values = [4, 2, 1]
paired_dict = dict(zip(keys, values))

空字典初始化

有时,你可能需要一个空白的字典作为起点,逐步填充。

empty_dict = {}

每种方法都有其适用场景,灵活运用这些技巧,能够让你在编写Python程序时更加游刃有余。掌握字典的创建只是探索之旅的开始,接下来深入挖掘其丰富的操作和应用,将使你的代码更加高效、优雅。

第2章 字典基本操作

2.1 添加与修改元素

在字典的日常管理中,添加新键值对或更新已有键对应的值是一项基本技能。让我们一起揭开这神秘面纱。

添加元素

给字典新增一个键值对,只需将其直接赋值给相应键即可。若该键尚不存在,字典会自动为其创建新的键值对;若已存在,则会覆盖原有值。

inventory = {'apples': 9, 'oranges': ?}
inventory['pears'] = ?  # 新增键值对 'pears': ?

修改元素

修改字典中某个键对应的值,同样采用赋值操作。由于字典的键唯一性 ,直接给已有键赋予新值即可完成更新。

inventory['apples'] = 10  # 更新键 'apples' 的值为 10

2.2 查询与访问元素

字典的核心价值在于快速查找和访问键对应的值。这里提供两种主要方式:

索引访问

使用中括号 [] 操作符 ,将键名作为索引 ,直接获取对应值。若键不存在,将引发 KeyError

quantity = inventory['apples']  # 获取 'apples' 的数量

get()方法

更安全的做法是使用 get() 方法 ,它接受键名作为第一个参数 ,并可选地设置一个默认值作为第二个参数。当键不存在时 ,返回默认值而非抛出异常。

quantity = inventory.get('kiwis', 0)  # 若 'kiwis' 不存在 ,返回 0

2.3 删除元素

清理字典时,可能需要移除不再需要的键值对。有两种删除方法可供选择:

del语句

使用 del 语句配合字典名及待删除键 ,可直接从字典中移除指定键值对。若键不存在,将引发 KeyError

del inventory['oranges']  # 删除键 'oranges' 及其值

pop()方法

pop() 方法与 del 类似,但更显灵活。它既删除键值对,又返回被删除的值。若键不存在 ,可选择抛出异常或通过指定默认值避免异常。

value = inventory.pop('grapes')  # 删除并返回 'grapes' 的值,若不存在则引发 KeyError
value = inventory.pop('strawberries', None)  # 删除并返回 'strawberries' 的值,若不存在则返回 None

2.4 遍历字典

遍历字典以访问其中的所有键值对,是进行数据处理、分析或展示的关键步骤。有多种遍历方式可供选择:

遍历键

直接迭代字典 ,将依次获得其所有键。

for fruit in inventory:
    print(fruit)  # 输出:'apples', 'pears'

遍历键值对

利用 items() 方法,可同时获取键及其对应的值。

for fruit, count in inventory.items():
    print(f"{fruit}: {count}")  # 输出:'apples: 10', 'pears: ?'

遍历值或仅键/值

使用 values()keys() 方法,可单独遍历字典的值或键。

for count in inventory.values():
    print(count)  # 输出:10, ?

for fruit in inventory.keys():
    print(fruit)  # 输出:'apples', 'pears'

熟练掌握这些基本操作 ,就如同掌握了字典这本神奇宝典的使用指南 ,无论面对何种数据管理需求,都能得心应手、游刃有余。

第3章 字典内置函数与方法 ?

3.1 len()、del()与clear()

掌握字典的维护艺术,离不开几个关键的操作:了解字典的长度、精确移除项或清空整个字典。

  • len() :这个函数像一位忠实的图书管理员,快速清点字典的键值对总数。
my_dict = {'apple': 3, 'banana': 5, 'cherry': 7}
size = len(my_dict)  # size 为 3
  • del :当你需要从字典中永久删除特定的键值对时 ,del 就像是精确的外科手术刀。
del my_dict['banana']  # 删除键 'banana' 及其对应的值
  • clear() :想让字典回归初始的空白页状态?一个简单的 clear() 足矣。
my_dict.clear()  # 清空字典,使其变为 {}

3.2 keys(),values(),items()详解

这三位好比字典的三大法宝 ,让你分别访问字典的键、值和键值对。

  • keys() :它提供了一把钥匙 ,打开字典的门,只显示所有的键。
keys_list = list(my_dict.keys())  # 获取所有键组成的列表
  • values() :它如同一个宝盒,里面装满了字典中所有的值。
values_list = list(my_dict.values())  # 获取所有值组成的列表
  • items() :最全面的视角,它将字典的每一项打包成元组,逐一呈现。
items_list = list(my_dict.items())  # 获取所有键值对组成的列表

3.3 get()与setdefault()

这两个方法是处理键不存在情况的高手,优雅而高效。

  • get() :它如同一名外交官,请求键对应的值,若键不存在,可优雅地返回一个默认值。
quantity = my_dict.get('pear', 0)  # 如果 'pear' 不存在,返回 0
  • setdefault() :它不仅具备 get() 的功能,还能在键不存在时自动添加默认值到字典。
my_dict.setdefault('pear', 2)  # 如果 'pear' 不存在,添加键值对 'pear': 2

3.4 update()与合并字典

在字典的世界里,合并信息就像是一场友好的聚会,update() 是这场聚会的组织者。

  • update() :它能将另一个字典的键值对合并到当前字典中,如果有重叠的键,则后者覆盖前者。
new_items = {'pear': 4, 'orange': 6}
my_dict.update(new_items)  # 合并 new_items 到 my_dict

通过这些内置函数与方法的精妙运用,你便能更加自如地驾驭字典,无论是日常的数据处理还是复杂的逻辑构建,都能游刃有余。

第4章 字典进阶技巧

4.1 字典推导式与生成器表达式

在Python中,字典推导式与生成器表达式是构建字典的高效工具,它们能简化代码,提升可读性。

  • 字典推导式:它宛如魔法般将列表或其他可迭代对象转化为字典。形式上与列表推导式相似,只是将方括号 [ ] 替换为花括号 { },且内部包含键值对表达式。
words = ['apple', 'banana', 'cherry']
lengths_dict = {word: len(word) for word in words}  # 生成 {'apple': 5, 'banana': 6, 'cherry': 6}
  • 生成器表达式:对于大型数据集,字典生成器表达式提供了内存友好的替代方案。它与字典推导式语法相似,只是用圆括号 ( ) 包裹。生成器表达式返回一个可迭代对象 ,每次迭代返回一个键值对。
words = ('apple', 'banana', 'cherry')
lengths_gen = ({word: len(word)} for word in words)  # 返回一个生成器对象
for pair in lengths_gen:
  print(pair)  # 分别输出 {'apple': 5}, {'banana': 6}, {'cherry': 6}

4.2 字典视图与键值对排序

字典视图和排序功能,让你能以不同的视角审视和组织字典内容。

  • 字典视图keys(), values(), items() 方法返回的对象并非列表,而是视图对象。它们反映字典当前状态 ,且在字典更改时自动更新。视图支持大部分序列操作,如切片、成员测试等。
my_dict = {'a': 1, 'b': 2, 'c': 3}
key_view = my_dict.keys()
print(list(key_view))  # 输出:['a', 'b', 'c']
my_dict['d'] = 4  # 添加新键值对
print(list(key_view))  # 输出:['a', 'b', 'c', 'd']
  • 键值对排序:虽然字典本身是无序的 ,但可以通过 sorted() 函数对键、值或键值对进行排序。结合 items() 方法,可以轻松得到有序的键值对列表。
my_dict = {'banana': ?, 'apple': ?, 'orange': ?}
sorted_pairs = sorted(my_dict.items(), key=lambda x: x[1])  # 按值排序
print(sorted_pairs)  # 输出:[('apple', ?), ('orange', ?), ('banana', ?)]

4.3 使用defaultdict与Counter提升效率

Python标准库提供了两个字典子类,defaultdictCounter,它们专为特定场景设计,极大地提高了编码效率。

  • defaultdict :当你期望字典在访问不存在的键时自动添加默认值 ,defaultdict 就派上了用场。只需在创建时指定默认工厂函数。
from collections import defaultdict

counts = defaultdict(int)  # 使用 int() 作为默认值工厂,返回 0
for fruit in ['apple', 'banana', 'apple']:
  counts[fruit] += 1  # 自动添加新键 ,无需检查是否存在
print(counts)  # 输出:{'apple': 2, 'banana': 1}
  • CounterCounter 类专用于计数任务,它是一个子类化自 dict 的容器 ,实现了计数统计功能。它可以轻松处理大量数据的频次统计。
from collections import Counter

fruits = ['apple', 'banana', 'apple', 'cherry', 'banana', 'banana']
fruit_counts = Counter(fruits)
print(fruit_counts)  # 输出:Counter({'banana': 3, 'apple': 2, 'cherry': 1})

4.4 字典与JSON数据互转

在数据交换或存储场景中 ,JSON格式广泛应用。Python提供了便捷的模块 json 用于字典与JSON字符串之间的转换。

  • 字典转JSON:使用 json.dumps() 方法将字典编码为JSON字符串。
import json

data = {'name': 'Alice', 'age': 30, 'city': 'New York'}
json_str = json.dumps(data)
print(json_str)  # 输出:'{"name": "Alice", "age": 30, "city": "New York"}'
  • JSON转字典:对应地,json.loads() 方法负责将JSON字符串解码回字典。
json_str = '{"name": "Bob", "age": 35, "city": "San Francisco"}'
loaded_data = json.loads(json_str)
print(loaded_data)  # 输出:{'name': 'Bob', 'age': 35, 'city': 'San Francisco'}

掌握这些进阶技巧,你的字典操作技能将如虎添翼,无论面对何种复杂场景,都能游刃有余地处理字典相关的数据问题。

第5章 实战应用案例

5.1 字典在数据分析中的应用

在数据分析的浩瀚星海中,字典是组织和解析数据的璀璨明星。例如 ,在处理调查问卷数据时,可以用字典来汇总各选项的投票次数。

survey_results = {
    'Yes': 42,
    'No': 17,
    'Maybe': 11
}

# 计算总投票数
total_votes = sum(survey_results.values())
percentage_yes = (survey_results['Yes'] / total_votes) * 100
print(f"Yes占比: {percentage_yes:.2f}%")

5.2 字典在网页爬虫中的应用

网络爬虫探索互联网的每一个角落 ,字典常被用来存储抓取的数据 ,便于后续分析。设想爬取一个博客网站的文章标题和链接。

import requests
from bs4 import BeautifulSoup

blog_posts = {}

response = requests.get("http://example.com/blog")
soup = BeautifulSoup(response.text, 'html.parser')

for post in soup.find_all('div', class_='post'):
    title = post.find('h2').text
    link = post.find('a')['href']
    blog_posts[title] = link

# 打印第一条文章的信息
first_post_title = next(iter(blog_posts))
print(f"文章标题: {first_post_title}, 链接: {blog_posts[first_post_title]}")

5.3 字典在数据库查询结果处理中的应用

数据库查询结果通常以行和列的形式呈现 ,将这些结果转化为字典,便于进一步处理或展示。以SQLite数据库为例,查询用户信息并以字典形式存储。

import sqlite3

conn = sqlite3.connect('users.db')
cursor = conn.cursor()

cursor.execute("SELECT id, username, email FROM users")
rows = cursor.fetchall()

# 将查询结果转换为字典列表
users_dict = [{column: row[i] for i, column in enumerate(cursor.description)} for row in rows]

# 查看第一位用户的用户名
first_user = users_dict[0]
print(f"第一位用户用户名: {first_user['username']}")

这些实战案例展示了字典如何成为解决实际问题的利器,无论是在数据的海洋中航行,还是在信息的丛林里探索 ,字典都是不可或缺的导航图。

第6章 总结与思考

Python字典,作为一种键值对数据结构 ,以其独特的哈希表实现提供高效查找与操作。从创建、基本操作到内置函数与方法,再到进阶技巧与实战应用,全方位展现了其在数据分析、网页爬虫及数据库查询等领域的重要作用。与列表、元组等结构对比,字典以键唯一性实现精准访问,而defaultdictCounter等扩展类进一步提升效率。在项目开发中 ,遵循最佳实践,如合理使用推导式、视图与排序,以及适时转换为JSON数据 ,可显著提升代码质量与可维护性。展望未来,Python字典将持续优化,引入新特性以适应不断变化的编程需求。


关注不灵兔,Python学习不迷路

相关推荐

python爬取电子课本,送给居家上课的孩子们

在这个全民抗疫的日子,中小学生们也开启了居家上网课的生活。很多没借到书的孩子,不得不在网上看电子课本,有的电子课本是老师发的网络链接,每次打开网页去看,既费流量,也不方便。今天我们就利用python的...

高效办公!Python 批量生成PDF文档是如何做到的?

前言:日常办公中,经常会使用PDF文档,难免需要对PDF文档进行编辑,有时候PDF文档中的大部分内容都是一样的,只是发送对象不同。这种模板套用的场景下,使用Python进行自动化就尤为方便,用最短的时...

如何用Python将PDF完整的转成Word?

PDF文件完整的转为Word,转换后格式排版不会乱,图片等信息完整显示不丢失。这个很简单,有很多方法都可以实现。方法一:Python利用Python将PDF文件转换为Word,有许多库可以帮你实现这一...

使用Python拆分、合并PDF(python合并多个pdf)

知识点使用Python操作PDF!主要内容有:1、PDF拆分;2、PDF合并。在工作中,难免会和PDF打交道,所以掌握一点处理PDF的技能非常有必要,本文将介绍几个常用的功能。PDF拆分很多时候,获取...

10分钟实现PDF转Word神器!看DeepSeek如何用Python解放打工人

开篇痛点每个被PDF折磨过的职场人都懂——领导发来的扫描件要修改,手动抄到Word需要2小时;网上下载的报告想复制数据,却变成乱码…今天我们用Python+DeepSeek,10分钟打造一个智能转换工...

《Python知识手册》,高清全彩pdf版开放下载

Python编程还不懂?今天我要把我参与编写的这套《Python知识手册》免费分享出来,看完文末有惊喜哦。...

利用python进行数据分析,PDF文档给你答案

本书详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。虽然本书的标题是“数据分析”,重点却是Python编程、库,以及用于数据分析的工具。兄弟,毫无套路!PDF版无偿获...

OCRmypdf:一款可以让扫描PDF文件变得可搜索、可复制!

简介在日常工作中,我们经常会接触到各种PDF文件,其中不少是扫描版文档。处理这些扫描PDF时,尽管内容看似完整,但往往无法直接复制或搜索其中的文本。尤其是在需要对大量文档进行文本分析、存档或后期编辑时...

高效的OCR处理工具!让扫描PDF文件变得可搜索、可复制!

在工作中,我们常常遇到各种各样的PDF文件,其中不乏一些扫描版的文档。而在处理扫描的PDF文件时,虽然文件内容看似完整,但你却无法复制、搜索其中的文本。特别是对大量文档需要进行文本分析、存档、或者...

三步教你用Elasticsearch+PyMuPDF实现PDF大文件秒搜!

面对100页以上的大型PDF文件时,阅读和搜索往往效率低下。传统关系型数据库在处理此类数据时容易遇到性能瓶颈,而Elasticsearch凭借其强大的全文检索和分布式架构,成为理想解决方案。通过...

用 Python 去除 PDF 水印,你学会吗?

今天介绍下用Python去除PDF(图片)的水印。思路很简单,代码也很简洁。首先来考虑Python如何去除图片的水印,然后再将思路复用到PDF上面。这张图片是前几天整理《数据结构和算法...

扫描PDF档案效率提升300%!OCRmyPDF:告别无法搜索的PDF噩梦,这款26K Star的开源神器让文本识别轻松上手!

要在PDF中搜索某个关键词,结果发现啥也找不到?这种情况大多数人都遇到过吧,特别是处理扫描文档或图片PDF时。就在前几天,我还在为这事抓狂呢!后来无意中发现了OCRmyPDF这个宝藏项目...简直就...

Python自动化办公之PDF版本发票识别并提取关键信息教程(上篇)

大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Python自动化办公发票数据处理的问题,一起来看看吧。二、实现过程这个问题在实际工作中还是非常常见的,实用性和通用性都比...

PDF解锁神器:用PyMuPDF与pdfplumber告别手动提取

前言大家好,今天咱们来聊聊如何用Python中的PyMuPDF和pdfplumber库,轻松提取PDF文件里的文本和元数据。你是否曾经在处理一个复杂的PDF文件时,感到信息难以触及,提取过程让人抓狂?...

《Python知识手册》,高清pdf免费获取

今天我要把我参与编写的这套《Python知识手册》免费分享出来,真正弘扬Python开源精神!手册的部分页面如下:获取方式:...

取消回复欢迎 发表评论: