百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

哈希结构的python实现(哈希函数python)

off999 2024-10-04 19:00 18 浏览 0 评论

哈希函数是哈希结构的重要组成部分,一个好的哈希函数可以提高查询的效率。在python中有两个数据结构是哈希结构实现的,分别是set集合和dict字典。那么这篇文章主要想带大家实现一个简单的字典的结构,也就是hashmap,这个数据结构是由一个个的键值对(k,v)组成。

假定k,v都是int的整数类型,哈希函数我们使用最经典的取模运算

对于哈希函数会存在key取模后值相同的这种情况,处理办法就是我们采用python自带的数据结构list来线性存储值相同的value

注:由于我们要实现字典的功能,所以存储key,value的数据结构需要我们自己来实现

实现hashmap的组件

对于hashmap这个数据结构,常用方法就是增删改查,具体的实现方法就是对应get(),put(),delete()这个三个函数,我们假定哈希函数为key%1000,存储kv键值对的数据结构如下:

[ [] for i in range(1000) ]

初始化一个包含有1000个空list的二维list,其中空的list中存放的就是含有键值对的对象

键值对的对象代码如图


这个对象需要具备获取key的值(getKey()这个方法),更新key的值(setKey()这个方法),获取value的值(getValue()这个方法),更新value的值(setValue()这个方法),在线性的list中存放的就是Dic这个对象,通过Dic这个对象来实现键值对的增删改查

在基础的元数据结构准备好之后,我们可以开始hashmap的接口(get,put,delete)的实现

  • put()方法


如图,hashmap就是初始化好的二维list,通过k的哈希运算(self.mod)得出这个键值对存放的位置,如果bucket为空,说明这个list之前还没有放入元素,那么就可以就直接将生成的dic对象append到bucket中。如果bucket不为空,那么我们就开始遍历整个的bucket列表,如果k之前已经存在bucket中那么就直接更新value的值,当bucket中存在-1的key值,那么说明之前这个位置的dic已经被删除,可以将新的dic覆盖更新到已经删除的这个位置上。如果bucket中没有-1的key并且也没有与dic的相等的key,这个时候就将dic直接append到bucket中就可以了

  • get()方法


对于get方法,同理先将获取到的k进行哈希运算得到存放dic的位置,然后遍历bucket,如果存在与k相等的key,通过getValue()返回获取的值,如果遍历完成也没有与k相等的key,说明之前没有存放这个k,返回-1

  • delete()方法


delete删除方法的实现,本质上没有将dic对象从list中移除,而是将dic的key值置为-1,这样新的元素遇到删除的位置可以直接覆盖使用,没有必要在遍历到bucket的最后端去开辟一个新的内存空间存放dic元素


由于篇幅的原因,想看完整代码的读者可以咨询作者,欢迎大家关注桓艺恒,一块学习讨论互联网的技术

相关推荐

python爬取电子课本,送给居家上课的孩子们

在这个全民抗疫的日子,中小学生们也开启了居家上网课的生活。很多没借到书的孩子,不得不在网上看电子课本,有的电子课本是老师发的网络链接,每次打开网页去看,既费流量,也不方便。今天我们就利用python的...

高效办公!Python 批量生成PDF文档是如何做到的?

前言:日常办公中,经常会使用PDF文档,难免需要对PDF文档进行编辑,有时候PDF文档中的大部分内容都是一样的,只是发送对象不同。这种模板套用的场景下,使用Python进行自动化就尤为方便,用最短的时...

如何用Python将PDF完整的转成Word?

PDF文件完整的转为Word,转换后格式排版不会乱,图片等信息完整显示不丢失。这个很简单,有很多方法都可以实现。方法一:Python利用Python将PDF文件转换为Word,有许多库可以帮你实现这一...

使用Python拆分、合并PDF(python合并多个pdf)

知识点使用Python操作PDF!主要内容有:1、PDF拆分;2、PDF合并。在工作中,难免会和PDF打交道,所以掌握一点处理PDF的技能非常有必要,本文将介绍几个常用的功能。PDF拆分很多时候,获取...

10分钟实现PDF转Word神器!看DeepSeek如何用Python解放打工人

开篇痛点每个被PDF折磨过的职场人都懂——领导发来的扫描件要修改,手动抄到Word需要2小时;网上下载的报告想复制数据,却变成乱码…今天我们用Python+DeepSeek,10分钟打造一个智能转换工...

《Python知识手册》,高清全彩pdf版开放下载

Python编程还不懂?今天我要把我参与编写的这套《Python知识手册》免费分享出来,看完文末有惊喜哦。...

利用python进行数据分析,PDF文档给你答案

本书详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。虽然本书的标题是“数据分析”,重点却是Python编程、库,以及用于数据分析的工具。兄弟,毫无套路!PDF版无偿获...

OCRmypdf:一款可以让扫描PDF文件变得可搜索、可复制!

简介在日常工作中,我们经常会接触到各种PDF文件,其中不少是扫描版文档。处理这些扫描PDF时,尽管内容看似完整,但往往无法直接复制或搜索其中的文本。尤其是在需要对大量文档进行文本分析、存档或后期编辑时...

高效的OCR处理工具!让扫描PDF文件变得可搜索、可复制!

在工作中,我们常常遇到各种各样的PDF文件,其中不乏一些扫描版的文档。而在处理扫描的PDF文件时,虽然文件内容看似完整,但你却无法复制、搜索其中的文本。特别是对大量文档需要进行文本分析、存档、或者...

三步教你用Elasticsearch+PyMuPDF实现PDF大文件秒搜!

面对100页以上的大型PDF文件时,阅读和搜索往往效率低下。传统关系型数据库在处理此类数据时容易遇到性能瓶颈,而Elasticsearch凭借其强大的全文检索和分布式架构,成为理想解决方案。通过...

用 Python 去除 PDF 水印,你学会吗?

今天介绍下用Python去除PDF(图片)的水印。思路很简单,代码也很简洁。首先来考虑Python如何去除图片的水印,然后再将思路复用到PDF上面。这张图片是前几天整理《数据结构和算法...

扫描PDF档案效率提升300%!OCRmyPDF:告别无法搜索的PDF噩梦,这款26K Star的开源神器让文本识别轻松上手!

要在PDF中搜索某个关键词,结果发现啥也找不到?这种情况大多数人都遇到过吧,特别是处理扫描文档或图片PDF时。就在前几天,我还在为这事抓狂呢!后来无意中发现了OCRmyPDF这个宝藏项目...简直就...

Python自动化办公之PDF版本发票识别并提取关键信息教程(上篇)

大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Python自动化办公发票数据处理的问题,一起来看看吧。二、实现过程这个问题在实际工作中还是非常常见的,实用性和通用性都比...

PDF解锁神器:用PyMuPDF与pdfplumber告别手动提取

前言大家好,今天咱们来聊聊如何用Python中的PyMuPDF和pdfplumber库,轻松提取PDF文件里的文本和元数据。你是否曾经在处理一个复杂的PDF文件时,感到信息难以触及,提取过程让人抓狂?...

《Python知识手册》,高清pdf免费获取

今天我要把我参与编写的这套《Python知识手册》免费分享出来,真正弘扬Python开源精神!手册的部分页面如下:获取方式:...

取消回复欢迎 发表评论: