百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

python实现文件的分割与合并(python分割文件名)

off999 2024-10-13 04:12 24 浏览 0 评论

#编程# ?#python#?

有时我们会遇到需要将文件进行分割的情况,例如网盘对单个文件大小的限制。有些软件可以实现这一点,如7-Zip的分卷压缩,但对硬盘空间有一定要求,因为软件会将所有分块都输出出来,这就要求硬盘可用空间要大于文件大小,如文件大小为100G,则要求硬盘至少有100G可用空间。有没有一种方法只输出其中一个分块呢?利用python可以很容易地实现这一点。

特点:

  • 可以指定输出位置、分块大小和读取缓冲区大小;
  • 可以通过输入编号的方式来指定输出分块;
  • 文件大小用合适的单位显示;
  • 无第三方库的依赖。

文件分割的代码:

import os
import sys

# 指定文件名、输出位置、分块大小和读取缓冲区大小
filename = sys.argv[1]
despath = 'D:\\'
block_size = 1024 * 1024 * 1024 * 6
buffersize = 1024 * 1024 * 100

# 文件大小的单位处理
def unit(a):
    if a < 1024:
        return str(a) + "B"
    elif 1024 <= a < 1048576:
        b = a / 1024
        b = "%.2f" % b
        return str(b) + "KB"
    elif 1048576 <= a < 1073741824:
        b = a / 1048576
        b = "%.2f" % b
        return str(b) + "MB"
    elif a >= 1073741824:
        b = a / 1073741824
        b = "%.2f" % b
        return str(b) + "GB"


# 获取文件大小
file_size = os.path.getsize(filename)

# 无需分块的情况
if file_size < block_size:
    print("文件大小小于分块大小,无需分块!")
    exit()

# 计算分块数量
num_blocks = file_size // block_size
if file_size % block_size != 0:
    num_blocks += 1

# 输出相关信息
print("要分割的文件:%s" % filename)
print("输出位置:%s" % despath)
print("文件大小:%s" % unit(file_size))
print("分块大小:%s" % unit(block_size))

# 由用户指定提取哪一个分块
block_num = int(input("请输入要提取的分块编号(1 - %d):" % num_blocks))

# 检查输入是否合法
if block_num < 1 or block_num > num_blocks:
    print("分块编号输入错误!")
    exit()

# 提取分块
with open(filename, 'rb') as f:
    # 计算起始位置和读取长度
    start = (block_num - 1) * block_size
    end = min(file_size, start + block_size)
    length = end - start

    # 移动文件指针到起始位置
    f.seek(start)
    # 目标文件的文件名格式
    desname = despath + os.path.split(filename)[1] + '.%03d' % block_num
    # 若分片大小小于缓冲区则直接读取
    if length < buffersize:
        block = f.read(length)
        # 若目标文件存在则删除重建,不存在则直接建立
        if os.path.exists(desname):
            os.remove(desname)
        with open(desname, 'ab+') as g:
            g.write(block)
    # 若分片大小大于缓冲区则用buffersize多次取length
    else:
        # a为取的次数
        a = length // buffersize
        # tail为剩余部分,为0时不存在,否则存在
        tail = length % buffersize
        if os.path.exists(desname):
            os.remove(desname)
        g = open(desname, 'ab+')
        for i in range(a):
            q = f.read(buffersize)
            g.write(q)
        if tail != 0:
            q = f.read(tail)
            g.write(q)
        g.close()

print("分块提取完成!")

用法:

  • 根据需要修改输出位置、分块大小和读取缓冲区大小,将代码保存为.py文件,如file_split.py;
  • 运行
python file_split.py <file>
  • 若文件大小小于分块大小则提示无需分块;
  • 反之则输出要分割的文件、输出位置、文件大小和分块大小,输入要提取的分块编号回车即可,输出文件名格式为
file_name.ext.###

其中file_name为文件名,ext为扩展名,###为分块编号,如输入5后为005。


再说文件合并的代码:

import os
import sys

file1 = sys.argv[1]
file2 = sys.argv[2]
buffersize = 1024 * 1024 * 100

with open(file1, 'ab') as f1:
    file_size2 = os.path.getsize(file2)
    if file_size2 < buffersize:
        with open(file2, 'rb') as f2:
            f1.write(f2.read())
        # 若第二个文件的大小大于缓冲区则用buffersize多次取file_size2
    else:
        # a为取的次数
        a = file_size2 // buffersize
        # tail为剩余部分,为0时不存在,否则存在
        tail = file_size2 % buffersize
        with open(file2, 'rb') as f2:
            for i in range(a):
                f1.write(f2.read(buffersize))
            if tail != 0:
                f1.write(f2.read(tail))

用法:

  • 将代码保存为.py文件,如file_join.py;
  • 运行
python file_join.py <file1> <file2>

原理:将file2的内容追加到file1后面。

若有多个分块要合并,则依次运行

python file_join.py file.001 file.002
python file_join.py file.001 file.003
python file_join.py file.001 file.004
...

最后再将“.001”去掉即可将文件还原。

--End--

相关推荐

第九章:Python文件操作与输入输出

9.1文件的基本操作9.1.1打开文件理论知识:在Python中,使用open()函数来打开文件。open()函数接受两个主要参数:文件名和打开模式。打开模式决定了文件如何被使用,常见的模式有:&...

Python的文件处理

一、文件处理的流程1.打开文件,得到文件句柄并赋值给一个变量2.通过句柄对文件进行操作3.关闭文件示例:d=open('abc')data1=d.read()pri...

Python处理文本的25个经典操作

Python处理文本的优势主要体现在其简洁性、功能强大和灵活性。具体来说,Python提供了丰富的库和工具,使得对文件的读写、处理变得轻而易举。简洁的文件操作接口Python通过内置的open()函数...

Python学不会来打我(84)python复制文件操作总结

上一篇文章我们分享了python读写文件的操作,主要用到了open()、read()、write()等方法。这一次是在文件读写的基础之上,我们分享文件的复制。#python##python自学##...

python 文件操作

1.检查目录/文件使用exists()方法来检查是否存在特定路径。如果存在,返回True;如果不存在,则返回False。此功能在os和pathlib模块中均可用,各自的用法如下。#os模块中e...

《文件操作(读写文件)》

一、文件操作基础1.open()函数核心语法file=open("filename.txt",mode="r",encoding="utf-8"...

栋察宇宙(二十一):Python 文件操作全解析

分享乐趣,传播快乐,增长见识,留下美好。亲爱的您,这里是LearingYard学苑!今天小编为大家带来“Python文件操作全解析”欢迎您的访问!Sharethefun,spreadthe...

值得学习练手的70个Python项目(附代码),太实用了

Python丰富的开发生态是它的一大优势,各种第三方库、框架和代码,都是前人造好的“轮子”,能够完成很多操作,让你的开发事半功倍。下面就给大家介绍70个通过Python构建的项目,以此来学习Pytho...

python图形化编程:猜数字的游戏

importrandomnum=random.randint(1,500)running=Truetimes=0##总的次数fromtkinterimport*##导入所有tki...

一文讲清Python Flask的Web编程知识

刚入坑Python做Web开发的新手,还在被配置臃肿、启动繁琐折磨?Flask这轻量级框架最近又火出圈,凭5行代码启动Web服务的极致简洁,让90后程序员小张直呼真香——毕竟他刚用这招把部署时间从半小...

用python 编写一个hello,world

第一种:交互式运行一个hello,world程序:这是写python的第一步,也是学习各类语言的第一步,就是用这种语言写一个hello,world程序.第一步,打开命令行窗口,输入python,第二步...

python编程:如何使用python代码绘制出哪些常见的机器学习图像?

专栏推荐绘图的变量单变量查看单变量最方便的无疑是displot()函数,默认绘制一个直方图,并你核密度估计(KDE)sns.set(color_codes=True)np.random.seed(su...

如何编写快速且更惯用的 Python 代码

Python因其可读性而受到称赞。这使它成为一种很好的第一语言,也是脚本和原型设计的流行选择。在这篇文章中,我们将研究一些可以使您的Python代码更具可读性和惯用性的技术。我不仅仅是pyt...

Python函数式编程的详细分析(代码示例)

本篇文章给大家带来的内容是关于Python函数式编程的详细分析(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。FunctionalProgramming,函数式编程。Py...

编程小白学做题:Python 的经典编程题及详解,附代码和注释(七)

适合Python3+的6道编程练习题(附详解)1.检查字符串是否以指定子串开头题目描述:判断字符串是否以给定子串开头(如"helloworld"以"hello&...

取消回复欢迎 发表评论: