百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python——如何实现零拷贝(python里面如何拷贝一个对象?)

off999 2024-10-29 15:00 27 浏览 0 评论

传统拷贝跟零拷贝技术流程

传统的拷贝过程可以总结如下:

  • 应用调用read函数,向操作系统发起IO调用,上下文从用户态切换到内核态
  • DMA 控制器将数据从磁盘读取到内核缓冲区
  • CPU读取内核缓冲区并将数据复制到用户应用程序缓冲区,上下文从内核态切换到用户态,read函数返回
  • 用户应用进程通过write函数发起IO调用,上下文从用户态切换到内核态
    ,将数据拷贝到socket缓冲区
  • DMA控制器将数据从socket缓冲区复制到网卡设备,上下文从内核态切换到用户态,此时write函数返回

传统的拷贝机制通常有 4 个上下文切换,4 个拷贝数据(两个 CPU 拷贝和两个 DMA 拷贝)。


零拷贝技术的流程如下:

  • 用户进程发起sendfile系统调用,上下文从用户态切换到内核态
  • DMA 控制器将数据从硬盘复制到内核缓冲区
  • CPU 将读缓冲区中的数据复制到套接字缓冲区
  • DMA 控制器将数据从套接字缓冲区异步复制到网卡
  • 上下文从内核模式切换到用户模式,并且 sendfile 函数返回

sendfile 实现的零拷贝只有 2 个上下文切换和 3 个拷贝(2 个 DMA 拷贝 + 1 个 CPU 拷贝)。

Python 实现文件零拷贝

我们先实现一个简单的文件接收服务器(zerocopy_server.py):

import socket
import hashlib
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) 
server_port = 8082 
server_addr = ("0.0.0.0", server_port) 
print(f"Start server on port {server_port}") 
sock.bind(server_addr) 
sock.listen(1)
while True:
    print("Waiting for connection") 
    connection, client_addr = sock.accept() 
    size = 0 
    try: 
        i = 0 
        while True: 
            data = connection.recv(65536) 
            i += 1 
            if data: 
                size += len(data)
            else: 
                print("完成接收数据") 
                break 
        print(f"总大小: {size}") 
    finally: 
        connection.close()
  • 传统拷贝客户端
import socket
import time

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
server_port = 8082
server_address = ('127.0.0.1', server_port)
sock.connect(server_address)

start = time.time()
try:
    with open(r'test.tar.gz', 'rb') as f:
        message = f.read()
        sock.sendall(message)
finally:
    sock.close()

end = time.time()
print('总时间: ', end-start)

运行一下传统拷贝客户端的代码看看。

  • 零拷贝客户端
import os
import socket
import time
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
server_port = 8082
server_address = ("127.0.0.1", server_port)
sock.connect(server_address)
start = time.time()
try:
    with open(r"test.tar.gz", "rb") as f:
        ret = 0
        offset = 0
        while True:
            ret = os.sendfile(sock.fileno(), f.fileno(), offset,65535)
            offset += ret
            if ret == 0:
                break
finally:
    sock.close()
end = time.time()
print("Total time: ", end - start)

运行一下零拷贝客户端的代码看看。

结论

对比结果可以看到,本地传输一个1.2GB 的文件,零拷贝只需要 0.16 秒,而传统拷贝需要 0.51 秒。

客户端使用零拷贝技术所消耗的传输时间比传统拷贝方式要快。由于是本地测试,所以没有物理网卡。如果是通过网卡,总的传输时间会受到网卡传输速度的限制。

相关推荐

pip的使用及配置_pip怎么配置

要使用python必须要学会使用pip,pip的全称:packageinstallerforpython,也就是Python包管理工具,主要是对python的第三方库进行安装、更新、卸载等操作,...

Anaconda下安装pytorch_anaconda下安装tensorflow

之前的文章介绍了tensorflow-gpu的安装方法,也介绍了许多基本的工具与使用方法,具体可以看Ubuntu快速安装tensorflow2.4的gpu版本。pytorch也是一个十分流行的机器学...

Centos 7 64位安装 python3的教程

wgethttps://www.python.org/ftp/python/3.10.13/Python-3.10.13.tgz#下载指定版本软件安装包tar-xzfPython-3.10.1...

如何安装 pip 管理工具_pip安装详细步骤

如何安装pip管理工具方法一:yum方式安装Centos安装python3和python3-devel开发包>#yuminstallgcclibffi-develpy...

Python入门——从开发环境搭建到hello world

一、Python解释器安装1、在windows下步骤1、下载安装包https://www.python.org/downloads/打开后选择【Downloads】->【Windows】小编是一...

生产环境中使用的十大 Python 设计模式

在软件开发的浩瀚世界中,设计模式如同指引方向的灯塔,为我们构建稳定、高效且易于维护的系统提供了经过验证的解决方案。对于Python开发者而言,理解和掌握这些模式,更是提升代码质量、加速开发进程的关...

如何创建和管理Python虚拟环境_python怎么创建虚拟环境

在Python开发中,虚拟环境是隔离项目依赖的关键工具。下面介绍创建和管理Python虚拟环境的主流方法。一、内置工具:venv(Python3.3+推荐)venv是Python标准...

初学者入门Python的第一步——环境搭建

Python如今成为零基础编程爱好者的首选学习语言,这和Python语言自身的强大功能和简单易学是分不开的。今天千锋武汉Python培训小编将带领Python零基础的初学者完成入门的第一步——环境搭建...

全网最简我的世界Minecraft搭建Python编程环境

这篇文章将给大家介绍一种在我的世界minecraft里搭建Python编程开发环境的操作方法。目前看起来应该是全网最简单的方法。搭建完成后,马上就可以利用python代码在我的世界自动创建很多有意思的...

Python开发中的虚拟环境管理_python3虚拟环境

Python开发中,虚拟环境管理帮助隔离项目依赖,避免不同项目之间的依赖冲突。虚拟环境的作用隔离依赖:不同项目可能需要不同版本的库,虚拟环境可以为每个项目创建独立的环境。避免全局污染:全局安装的库可...

Python内置zipfile模块:操作 ZIP 归档文件详解

一、知识导图二、知识讲解(一)zipfile模块概述zipfile模块是Python内置的用于操作ZIP归档文件的模块。它提供了创建、读取、写入、添加及列出ZIP文件的功能。(二)ZipFile类1....

Python内置模块pydoc :文档生成器和在线帮助系统详解

一、引言在Python开发中,良好的文档是提高代码可读性和可维护性的关键。pydoc是Python自带的一个强大的文档生成器和在线帮助系统,它可以根据Python模块自动生成文档,并支持多种输出格式...

Python sys模块使用教程_python system模块

1.知识导图2.sys模块概述2.1模块定义与作用sys模块是Python标准库中的一个内置模块,提供了与Python解释器及其环境交互的接口。它包含了许多与系统相关的变量和函数,可以用来控制P...

Python Logging 模块完全解读_python logging详解

私信我,回复:学习,获取免费学习资源包。Python中的logging模块可以让你跟踪代码运行时的事件,当程序崩溃时可以查看日志并且发现是什么引发了错误。Log信息有内置的层级——调试(deb...

软件测试|Python logging模块怎么使用,你会了吗?

Pythonlogging模块使用在开发和维护Python应用程序时,日志记录是一项非常重要的任务。Python提供了内置的logging模块,它可以帮助我们方便地记录应用程序的运行时信息、错误和调...

取消回复欢迎 发表评论: