Python exe 文件反编译为 Python 脚本
off999 2024-10-07 12:06 20 浏览 0 评论
前言
- 将 Python 可执行文件(.exe)反编译为 Python 脚本是一项有趣的技术挑战,可以帮助我们理解程序的工作原理,以及可能包含的逻辑和算法。虽然反编译不是一项简单的任务,并且对于使用各种保护措施的程序可能无效,但对于一般情况下的 Python 可执行文件,我们可以尝试使用一些工具来进行反编译。
- 下面我们就来学习如何将 Python 可执行文件(.exe)反编译为 Python 脚本。
版本
- Python 3.9
反编译
- 反编译是将已编译的程序代码还原为其原始源代码的过程。在 Python 中,由于其解释性质,通常没有像编译语言那样生成的二进制文件,但是我们可以将 Python 脚本转换为字节码文件(.pyc),而 .exe 文件通常是由 pyinstaller、cx_Freeze 等工具编译生成的。
Python 可执行文件(.exe)反编译
- Python 可执行文件(.exe)反编译为 Python 脚本主要分为两个步骤,(1)从 .exe 文件中提取 pyc 文件 (2)将 pyc 文件转换为 Python 脚本。
打包一个简单的 .exe 可执行文件
# student.py
class Student:
def __init__(self, name, age, gender):
self.name = name
self.age = age
self.gender = gender
def get_name(self):
return self.name
def get_age(self):
return self.age
def get_gender(self):
return self.gender
def set_name(self, name):
self.name = name
def set_age(self, age):
self.age = age
def set_gender(self, gender):
self.gender = gender
def display_info(self):
print("Name:", self.name)
print("Age:", self.age)
print("Gender:", self.gender)
# main.py
import time
from student import Student
if __name__ == "__main__":
# Create a student object
student1 = Student("Alice", 20, "Female")
# Display student information
student1.display_info()
# Update student information
student1.set_age(21)
student1.display_info()
time.sleep(10)
# 使用 pyinstaller 构建可执行 .exe
pyinstaller --onefile -p venv/Lib/site-packages .\print-student\main.py
提取 pyc 文件
使用脚本提取
- pyi-archive_viewer 是 PyInstaller 自己提供的工具,它可以直接提取打包结果exe中的pyc文件。
- 详细介绍可参考官方文档:https://pyinstaller.readthedocs.io/en/stable/advanced-topics.html#using-pyi-archive-viewer
# 使用 pyi-archive_viewer 查看文件并提取
> pyi-archive_viewer .\main.exe
Options in 'main.exe' (PKG/CArchive):
pyi-contents-directory _internal
Contents of 'main.exe' (PKG/CArchive):
position, length, uncompressed_length, is_compressed, typecode, name
0, 199, 269, 1, 'm', 'struct'
199, 2008, 3700, 1, 'm', 'pyimod01_archive'
2207, 7671, 17413, 1, 'm', 'pyimod02_importers'
9878, 1760, 4029, 1, 'm', 'pyimod03_ctypes'
11638, 644, 1074, 1, 'm', 'pyimod04_pywin32'
12282, 603, 851, 1, 's', 'pyiboot01_bootstrap'
12885, 229, 295, 1, 's', 'main'
......
4721057, 408332, 1123832, 1, 'b', 'unicodedata.pyd'
5129389, 702999, 702999, 0, 'z', 'PYZ-00.pyz'
?
U: go up one level
O <name>: open embedded archive with given name // 打开包查看文件
X <name>: extract file with given name // 提取文件
S: list the contents of current archive again
Q: quit
? x main
Output filename? main.pyc
? o PYZ-00.pyz
Contents of 'PYZ-00.pyz' (PYZ):
is_package, position, length, name
0, 17, 2647, '_compat_pickle'
......
0, 543553, 531, 'student'
0, 544084, 19733, 'subprocess'
0, 563817, 27425, 'tarfile'
0, 591242, 5936, 'textwrap'
0, 597178, 15612, 'threading'
0, 612790, 1398, 'token'
0, 614188, 8969, 'tokenize'
0, 623157, 6659, 'tracemalloc'
0, 629816, 27711, 'typing'
1, 657527, 70, 'urllib'
0, 657597, 13861, 'urllib.parse'
0, 671458, 2188, 'uu'
0, 673646, 26812, 'zipfile'
? x student
Output filename? student.pyc
? ls
U: go up one level
O <name>: open embedded archive with given name
X <name>: extract file with given name
S: list the contents of current archive again
Q: quit
? q
- 在上面的操作中,我们使用 pyi-archive_viewer 提取了 main.pyc、和 student.pyc 文件,当时大家可以很清楚的看到弊端,即需要一个一个手动提取,对于大项目这是十分麻烦的,推荐使用下面的工具提取。
使用工具提取
- 我们可以使用开源项目 Python-exe-unpacker 中的脚本 pyinstxtractor.py 脚本进行提取,地址:https://github.com/countercept/Python-exe-unpacker
\print-student> Python pyinstxtractor.py .\main.exe
DeprecationWarning: the imp module is deprecated in favour of importlib; see the module's documentation for alternative uses
import imp
[*] Processing .\main.exe
[*] Pyinstaller version: 2.1+
[*] Python version: 309
[*] Length of package: 5835756 bytes
[*] Found 59 files in CArchive
[*] Beginning extraction...please standby
[*] Found 81 files in PYZ archive
[*] Successfully extracted pyinstaller archive: .\main.exe
You can now use a python decompiler on the pyc files within the extracted directory
将 .pyc 文件转换为 Python 脚本
入口运行类
- 对于从 pyinstaller 提取出来的 pyc 文件并不能直接反编译,入口运行类共16字节的 magic 和 时间戳被去掉了。如果直接进行反编译,例如执行 uncompyle6 main.pyc,则会报出如下错误:
ImportError: Unknown magic number 227 in main.pyc
- 我们可以使用支持16进制编辑的文本编辑器进行处理,比如:UltraEdit32
- 可以看到前16个字节都被去掉了,其中前四个字节是magic,这四个字节会随着系统和Python版本发生变化,需要保持一致。后四个字节包括时间戳和一些其他的信息,都可以随意填写。我们可以通过 UltraEdit32 向提取的文件添加回信息。
- 这里我写了一个 python 脚本实现这个过程:
// 读取从pyz目录抽取的pyc文件的前4个字节作基准
pyz_dir = "./main.exe_extracted/PYZ-00.pyz_extracted"
for pyc_file in os.listdir(pyz_dir):
if pyc_file.endswith(".pyc"):
file = f"{pyz_dir}/{pyc_file}"
break
with open(file, "rb") as f:
head = f.read(4)
// 补全入口类文件
if os.path.exists("pycfile_tmp"):
shutil.rmtree("pycfile_tmp")
os.mkdir("pycfile_tmp")
main_file_result = "pycfile_tmp/main.pyc"
with open("./main.exe_extracted/main.pyc", "rb") as read, open(main_file_result, "wb") as write:
write.write(head)
write.write(b"\0" * 12)
write.write(read.read())
非入口运行类
- 对于非入口运行的pyc文件从12字节开始缺4个字节。
# 补全非入口类文件
pyz_dir = "main.exe_extracted/PYZ-00.pyz_extracted"
for pyc_file in os.listdir(pyz_dir):
pyc_file_src = f"{pyz_dir}/{pyc_file}"
pyc_file_dest = f"pycfile_tmp/{pyc_file}"
print(pyc_file_src, pyc_file_dest)
with open(pyc_file_src, "rb") as read, open(pyc_file_dest, "wb") as write:
write.write(read.read(12))
write.write(b"\0"*4)
write.write(read.read())
转换补全后的 pyc 文件
uncompyle6 反编译
pip install uncompyle6
uncompyle6 xxx.pyc>xxx.py
如:uncompyle6 .\pycfile_tmp\main.pyc
# uncompyle6 version 3.9.0
# Python bytecode version base 3.9.0 (3425)
# Decompiled from: Python 3.9.13 (tags/v3.9.13:6de2ca5, May 17 2022, 16:36:42) [MSC v.1929 64 bit (AMD64)]
# Embedded file name: main.py
Unsupported Python version, 3.9.0, for decompilation
# Unsupported bytecode in file .\pycfile_tmp\main.pyc
# Unsupported Python version, 3.9.0, for decompilation
- 由于我使用的是 3.9.0 版本,uncompyle6 不再支持 decompilation,有兴趣的朋友可以去试试。
在线工具
- 我们也可以使用一些在线工具进行解密,比如:https://ctfever.uniiem.com/tools/pyc-decompiler
可能遇到的问题
PYZ-00.pyz_extracted 文件为空
- 构建 .exe 文件 Python 版本和解压包时使用的版本不一致,比如我使用 Python 2.7 进行解包:
>Python .\pyinstxtractor.py .\main.exe
[*] Processing .\main.exe
[*] Pyinstaller version: 2.1+
[*] Python version: 312
[*] Length of package: 7675728 bytes
[*] Found 60 files in CArchive
[*] Beginning extraction...please standby
[!] Warning: The script is running in a different python version than the one used to build the executable
Run this script in Python312 to prevent extraction errors(if any) during unmarshalling
[!] Unmarshalling FAILED. Cannot extract PYZ-00.pyz. Extracting remaining files.
[*] Successfully extracted pyinstaller archive: .\main.exe
You can now use a python decompiler on the pyc files within the extracted directory
# 查看解压后的文件
\print-student\main.exe_extracted\PYZ-00.pyz_extracted> ls
\print-student\main.exe_extracted\PYZ-00.pyz_extracted>
如何防止exe被反编译
- 我们可以在打包命令后面添加 --key 参数来进行加密,例如:
pyinstaller --onefile -p venv/Lib/site-packages .\print-student\main.py --key '1234'
- 再次解压,抽取的中间结果变为了 .pyc.encrypted,无法正常反编译。
思考
- Bytecode encryption was removed in PyInstaller v6.0. Please remove your --key=xxx argument. For the rationale and alternatives see https://github.com/pyinstaller/pyinstaller/pull/6999
- 可以看到在 PyInstaller v6.0 加密参数已经被废弃,大家可以思考一下原因。
总结
- 反编译 Python 可执行文件可以帮助我们理解程序的工作原理和逻辑,但在实践中可能会受到许多因素的限制。对于复杂的程序,反编译可能只是了解其工作原理的第一步,可能需要进一步的分析和研究。最后,我们需要明白技术没有好坏,需要谨守道德和法律的底线。
相关推荐
- python列表(List)必会的13个核心技巧(附实用方法)
-
列表(List)是Python入门的关键步骤,因为它是编程中最常用的数据结构之一。以下是高效掌握列表的核心技巧和实用方法:一、理解列表的本质可变有序集合:可随时修改内容,保持元素顺序混合类型:一个列表...
- Python列表(List)一文全掌握:核心知识点+20实战练习题
-
Python列表(List)知识点教程一、列表的定义与特性定义:列表是可变的有序集合,用方括号[]定义,元素用逗号分隔。list1=[1,"apple",3.14]lis...
- python编程中列表常见的9大问题,你知道吗?
-
Python列表常见错误及解决方案列表(list)是Python中最常用的数据结构之一,但在使用过程中经常会遇到各种问题。以下是Python列表使用中的常见错误及其解决方法:一、索引越界错误1.访问...
- python之列表操作(python列表操作函数大全)
-
常用函数函数名功能说明append将一个元素添加到列表中names=['tom']用法:names.append('tommy')注意事项:被添加的元素只会被添加到...
- 7 种在 Python 中反转列表的智能方法
-
1.使用reverse()方法(原地)my_list=[10,12,6,34,23]my_list.reverse()print(my_list)#output:[23,34,6,12,...
- Python教程-列表复制(python中列表copy的用法)
-
作为软件开发者,我们总是努力编写干净、简洁、高效的代码。Python列表是一种多功能的数据结构,它允许你存储一个项目的集合。在Python中,列表是可变的,这意味着你可以在创建一个列表后改变它的...
- 「Python程序设计」基本数据类型:列表(数组)
-
列表是python程序设计中的一个基本的,也是重要的数据结构。我们可以把列表数据结构,理解为其它编程语言中的数组。定义和创建列表列表中的数据元素的索引,和数组基本一致,第一个元素的索引,或者是下标为0...
- Python中获取列表最后一个元素的方法
-
技术背景在Python编程中,经常会遇到需要获取列表最后一个元素的场景。Python提供了多种方法来实现这一需求,不同的方法适用于不同的场景。实现步骤1.使用负索引-1这是最简单和最Pythoni...
- Python学不会来打我(11)列表list详解:用法、场景与类型转换
-
在Python编程中,列表(list)是最常用且功能最强大的数据结构之一。它是一个有序、可变、支持重复元素的集合,可以存储任意类型的对象,包括整数、字符串、布尔值、甚至其他列表。本文将从基础语法开始...
- 零起点Python机器学习快速入门-4-4-列表操作
-
Python列表的基本操作展开。首先,定义了两个列表zlst和vlst并将它们的内容打印出来。接着,使用切片操作从这两个列表中提取部分元素,分别得到s2、s3和s4三个新的列表,并打...
- python入门 到脱坑 基本数据类型—列表
-
以下是Python列表(List)的入门详解,包含基础操作、常用方法和实用技巧,适合初学者系统掌握:一、列表基础1.定义列表#空列表empty_list=[]#包含不同类型元素的列表...
- Python 列表(List)完全指南:数据操作的利器
-
在Python中,列表(list)是一种可变序列(mutablesequence),它允许我们存储和操作一组有序数据(ordereddata)。本教程将从基础定义(basicdefiniti...
- 如何快速掌握 Python中列表的使用
-
学习python知识,好掌握Python列表的使用。从概念上来讲,Python中的列表list是一种有序、可变的容器,可以存储任意类型的数据(包括其他列表)。以下是列表的常用的操作和知识:1....
- Python中的列表详解及示例(python中列表的用法)
-
艾瑞巴蒂干货来了,数据列表,骚话没有直接来吧列表(List)是Python中最基本、最常用的数据结构之一,它是一个有序的可变集合,可以包含任意类型的元素。列表的基本特性有序集合:元素按插入顺序存储可变...
- python数据类型之列表、字典、元组、集合及操作
-
Python数据类型进阶:列表、字典与集合在Python中,数据类型是编程的基础,熟练掌握常用数据结构是成为高级开发者的关键。上一篇文章我们学习到了Python的数据类型:字符串(string)、数...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python自定义函数 (53)
- python进度条 (67)
- python吧 (67)
- python字典遍历 (54)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python串口编程 (60)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python人脸识别 (54)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)