Python实现一键翻译英文论文,实现了pdf文档英译汉,pdf格式不变
off999 2024-11-14 16:55 19 浏览 0 评论
支持谷歌、必应、有道的免费翻译接口,基于Django、PyMuPDF实现了pdf文档英译汉的功能,翻译后的pdf格式基本保持不变,可以下载docx和pdf格式的翻译文档,基本解决复制caj中文论文时的格式问题,简单的满足看论文以及写总结的需求。
目的
- 省去看英文论文去各个翻译网站对比翻译结果的时间消耗。
- 解决复制中文的caj或者pdf中的文字段落时会出现格式的问题。
- 下载翻译后的pdf以及word不用花钱,收费如翻译狗,有道等。
- 使用必应的英译汉翻译文档。
实现
- 基于django、PyMuPdf、谷歌、有道翻译实现了pdf英译汉的功能,翻译后的pdf格式基本保持不变,可以下载docx和pdf格式的翻译文档。
- 格式矫正方面基本解决了复制caj或者pdf中文论文时出现的格式问题。
问题
- word不能实现pdf一样的排版,翻译后的pdf还是存在样式问题(需要考虑的很多,慢慢做优化)。
- 表格无法写入,公示混乱。
- 搜狗,百度翻译接口未实现。
- 有道翻译长句子有问题,建议使用谷歌、必应。
环境
开发环境的系统平台为 Windows 10 (64 位),Python 版本为 3.6 (64 位),Django版本为 2.2
atomicwrites==1.3.0 attrs==19.1.0 certifi==2019.3.9 chardet==3.0.4 colorama==0.4.1 Django==2.2.1 docx==0.2.4 idna==2.8 Js2Py==0.63 lxml==4.3.3 more-itertools==7.0.0 pdfminer3k==1.3.1 Pillow==6.0.0 pluggy==0.11.0 ply==3.11 py==1.8.0 PyExecJS==1.5.1 pyjsparser==2.7.1 PyMuPDF==1.14.13 PyPDF2==1.26.0 pytest==4.5.0 python-docx==0.8.10 pytz==2019.1 requests==2.21.0 six==1.12.0 sqlparse==0.3.0 tzlocal==1.5.1 urllib3==1.24.3 wcwidth==0.1.7
展示
参考文档
PyMuPDF参考文档
只使用pdf翻译
如果只是想要拿来翻译论文的同学看这里
- 下载该项目后记得将文件夹名由Easy-Trans-master改为EasyTrans。
- 将要翻译的文件放到input_file这个目录中,将56行的代码最后的pdf名字修改为要翻译的pdf名字。
- 运行trans_file.py等代码执行结束,翻译后的文档就在output_file这个目录下面。
- 这里采用的是必应翻译,也可以自己修改为其它自己想用的翻译方式,也可以修改目录,方便自己运行翻译就可以了。如果有好的改进pdf翻译效果的建议或者问题联系qcs@stu.ouc.edu.cn。
在本地运行项目
1.克隆项目到本地(不使用git工具的话,直接下载就ok)
打开命令行,进入到保存项目的文件夹,输入如下命令:
https://github.com/QPromise/Easy-Trans.git
2.创建并激活虚拟环境(不使用可以跳过这里)
强烈推荐在 Virtualenv 下进行 Django 的开发。Virtualenv 是一个 Python 工具,使用它可以创建一个独立的 Python 环境。
在命令行进入到保存虚拟环境的文件夹,输入如下命令创建并激活虚拟环境:
C:\WINDOWS\system32>pip install virtualenv
C:\WINDOWS\system32>virtualenv C:\Users\Envs\EasyTrans_env
C:\WINDOWS\system32>C:\Users\Envs\EasyTrans_env\Scripts\activate
(EasyTrans_env) C:\WINDOWS\system32>
3.安装项目依赖
如果使用了虚拟环境,确保激活并进入了虚拟环境,在命令行进入项目所在的 Easy-Trans 文件夹,运行如下命令:
pip install -r requirements.txt
4.数据库迁移
命令行输入
python manage.py makemigrations
python manage.py migrate
5.创建后台管理员用户
命令行输入
python manage.py createsuperuser
6.运行开发服务器
命令行输入
python manage.py runserver
在浏览器输入:127.0.0.1:8000 就可以看到主页了。
注意
fitz这个包是PyMuPDF的,只要安装PyMuPDF就可以正常导入了。
相关推荐
- 硬盘恢复分区(硬盘恢复分区怎么删除)
-
1、在电脑上下载DiskGenius软件。2、双击运行该软件,软件会自动识别硬盘。当软件自动识别硬盘之后,右键单击硬盘的盘符,出现下拉菜单栏,选择搜索已丢失分区(重建分区表)选项。3、右键单击硬盘盘符...
-
- edge 浏览器(edge浏览器官网下载)
-
目前没有,如果是平板安装了WIN10是会内置MicrosoftEdge浏览器的。edge是由微软开发的基于Chromium开源项目及其他开源软件的网页浏览器。Edge浏览器主要特点是能够支持目前主流的Web技术,作为Windows10自带...
-
2025-11-18 06:51 off999
-
- 网易163邮箱免费注册(163网易免费邮件注册)
-
163邮箱登录入口页面官方地址:https://mail.163.com/163邮箱登录注册方法1、进入邮箱登入首页,我们点击右下角“去注册”按钮,进入注册界面;2、这里直接填写账号和密码内容,点一下同意那里呈蓝色圆点;再点下一步。3、再填...
-
2025-11-18 06:03 off999
- 苹果商城app下载安装(苹果商店app免费下载)
-
一、苹果手机下载软件显示APP内购买的意思是APP可以免费下载使用,但是该APP内有付费内容,也就是通常所说的收费道具。二、不是所有应用都会提供App内购买项目。如果某个应用提供App内购买...
- 惠普电脑中国官网(惠普手提电脑官网)
-
https://support.hp.com/cn是惠普笔记本售后服务官网。惠普维修服务中心通过整合线上线下相关资源,向国内用户提供方便快捷、安全可靠的优质电子产品维修服务。目前拥有北京6家、全国30...
- windows2003密钥序列号(win2003 密钥)
-
没有密钥就无法完成程序安装。使用或者购买密钥才能安装
- 电脑产品密钥在哪里找win10(电脑产品密钥在哪里找新机)
-
要查看电脑上Windows10的产品密钥,你可以按照以下步骤进行操作:打开“开始”菜单,然后点击“设置”图标(齿轮状图标)。在“设置”窗口中,点击“更新和安全”选项。在左侧导航栏中,选择“激活”选项...
- 电脑有网络但上不到网(电脑有网但是上不了网)
-
如果电脑显示有网但无法上网,可能是网络连接出现问题。这种情况可能是由于以下几个原因导致的:1.路由器或者调制解调器出现故障;2.电脑的网络设置有误;3.网络供应商的服务中断或者限制了你的网络访问...
- 笔记本突然开不了机了是什么情况
-
1.检查笔记本是否有电,当内置电池用完而又没有充电的情况下,会导致笔记本无法开机,插上电源充电即可。2.内置电池损坏维修更换即可。3.开机时按F8,在高级选项中选择最后一次正确的配置即可。4.中病毒可...
- windows11办公软件(windows11的office)
-
1、首先点击电脑底部的Windows图标2、进入开始页面点击office套件中的任意应用,如Word3、页面弹出登录按钮,和创建按钮,如已有账号,点击登录4、接着进入激活office页面,输入offi...
-
- 7z文件怎么打开(7z文件改什么后缀才能打开)
-
7z是一种压缩格式,和我们在Windows平台上看到的rar类似;7z原本是7-zip开源的压缩文件所支持的压缩格式,目前大多数压缩软件也支持打开,如若安装了第三方压缩软件双击即可打开7z。7z文件的打开方式介绍如下: 1、扩展名为...
-
2025-11-18 02:03 off999
- 重装系统后连不上网(重装系统后无法连网)
-
1、首先,在安装系统完成之后,界面右下角网络连接显示不可用?我们需要通过,系统本身自带的诊断系统进行诊断,以避免是否是物理原因造成的网络不能正常链接。2、其次,检测结果如果是显示的未能安装网络适配器,...
- 破解wifi密码有什么办法(破解wifi密码有什么办法幻影)
-
破解路由器admin管理员密码方法:只能间接的破解。 方法一、1、打开浏览器---输入192.168.1.1(一般路由器地址是这个或者查看路由器背面的登录信息)进路由---输入用户名,密码...
- 电脑截屏如何截屏(电脑截屏截屏用哪个键)
-
1、直接点击键盘上的PrtScSysRq,即可截图,然后直接在聊天框或者图画中“Ctrl+V”粘贴就行了。2、登录QQ以后,点击快捷键“Ctrl+Alt+A”即可截图,框选过后,直接“...
- 迅捷路由器登录(yr1900g路由器登录入口)
-
入口如下:1.打开网页后输入192.168.1.1或tplogin.cn。2.第一次登录路由器或恢复出厂设置后再次设置,按提示设置好管理员密码、上网参数、wifi名称和密码。3.再次进入登录页面中,输...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
