Python算法工程师:心中无码便是高清,马赛克“脑补”算法 PULSE
off999 2025-04-26 20:27 18 浏览 0 评论
1
万恶马赛克
万恶的马赛克,是阻碍人类进步的绊脚石。
马赛克“脑补”算法 PULSE,助你图片模糊变高清。
这是杜克大学近期的一项研究,将模糊人脸秒变高清。
PULSE 算法目前只支持人脸的马赛克“去除”,因为训练数据都是人脸。
也就是说,“脑补”其它物体马赛克下的内容也是可以的,只要你有数据!
我知道,你一定又有了一些大胆的想法!
「 Just do it 」 !
今天,继续手把手教学。
算法原理、环境搭建、效果测试,一条龙服务,尽在下文!
干货主要有:
① 200 多本 Python 电子书(和经典的书籍)应该有
② Python标准库资料(最全中文版)
③ 项目源码(四五十个有趣且可靠的练手项目及源码)
④ Python基础入门、爬虫、网络开发、大数据分析方面的视频(适合小白学习)
⑤ Python学习路线图(告别不入流的学习)
私信小编01即可获取大量Python学习资源
2
算法原理
PULSE 算法可以在几秒内,将 16x16 像素的低分辨率(Low Resolution,以下简称 LR)小图,放大 64 倍,变成 1024 x 1024 像素的高分辨率(High Resolution,以下简称 HR)图像。
PULSE 算法会「脑补」出 LR 图像一些不存在的特征,补充细节,例如纹理、毛孔、毛发等:
左图为原始 LR 图片,右图为 PULSE 算法生成的 HR 图片。
PULSE 算法的思路是,拿到一张 LR 图片,使用 stylegan 生成 HR 图片,再将 HR 图片 downscale 得到的 LR 图片与原始 LR 图片对比,一直迭代收敛,找到最接近的那张。如下图所示:
原始 LR 图片和 PULSE 修复后再 donwscale 的 LR 图片对,使两者最接近的 HR 图片,就是修复得到的 HR 图片。
该算法在著名的高分辨率人脸数据集 CelebA HQ 上进行了效果评估,用 64×,32× 和 8× 的比例因子,采用不同的算法,进行了对比实验。
实验表明,PULSE 算法的效果最佳,得分几乎与真实的高质量照片一样高。
通过上图,可以清晰地看到,PULSE 算法在人脸不同位置的纹理细节。
不过 PULSE 算法也有一定的局限性,它无法将失焦、不能识别的人脸照片,变成照片真人的清晰图像,它仅会生成不存在但看上去很真实的新面孔。
说白了,PULSE 生成的高清图片,是「脑补」出来的,与真实的人脸照片可能存在差别。
3
环境搭建
PULSE 算法采用 Pytorch 实现,使用了 dlib 人脸库的一些 API。
项目地址:
https://github.com/adamian98/pulse
环境搭建不复杂,工程里的 pulse.yml 文件,已经写明了依赖环境。
name: pulse
channels:
- pytorch
- defaults
dependencies:
- blas=1.0=mkl
- ca-certificates=2020.1.1=0
- certifi=2020.4.5.1=py38_0
- cffi=1.14.0=py38hc512035_1
- chardet=3.0.4=py38_1003
- cryptography=2.9.2=py38ha12b0ac_0
- cycler=0.10.0=py38_0
- freetype=2.9.1=hb4e5f40_0
- idna=2.9=py_1
- intel-openmp=2019.4=233
- jpeg=9b=he5867d9_2
- kiwisolver=1.2.0=py38h04f5b5a_0
- libcxx=10.0.0=1
- libedit=3.1.20181209=hb402a30_0
- libffi=3.3=h0a44026_1
- libgfortran=3.0.1=h93005f0_2
- libpng=1.6.37=ha441bb4_0
- libtiff=4.1.0=hcb84e12_0
- matplotlib=3.1.3=py38_0
- matplotlib-base=3.1.3=py38h9aa3819_0
- mkl=2019.4=233
- mkl-service=2.3.0=py38hfbe908c_0
- mkl_fft=1.0.15=py38h5e564d8_0
- mkl_random=1.1.0=py38h6440ff4_0
- ncurses=6.2=h0a44026_1
- ninja=1.9.0=py38h04f5b5a_0
- numpy=1.18.1=py38h7241aed_0
- numpy-base=1.18.1=py38h6575580_1
- olefile=0.46=py_0
- openssl=1.1.1g=h1de35cc_0
- pandas=1.0.3=py38h6c726b0_0
- pillow=7.1.2=py38h4655f20_0
- pip=20.0.2=py38_3
- pycparser=2.20=py_0
- pyopenssl=19.1.0=py38_0
- pyparsing=2.4.7=py_0
- pysocks=1.7.1=py38_0
- python=3.8.2=hf48f09d_13
- python-dateutil=2.8.1=py_0
- pytorch=1.5.0=py3.8_0
- pytz=2020.1=py_0
- readline=8.0=h1de35cc_0
- requests=2.23.0=py38_0
- scipy=1.4.1=py38h44e99c9_0
- setuptools=46.2.0=py38_0
- six=1.14.0=py38_0
- sqlite=3.31.1=h5c1f38d_1
- tk=8.6.8=ha441bb4_0
- torchvision=0.6.0=py38_cpu
- tornado=6.0.4=py38h1de35cc_1
- urllib3=1.25.8=py38_0
- wheel=0.34.2=py38_0
- xz=5.2.5=h1de35cc_0
- zlib=1.2.11=h1de35cc_3
- zstd=1.3.7=h5bba6e5_0
- pip:
- dlib==19.19.0
prefix: /path/to/your/anaconda3/envs/pulse
直接使用 pulse.yml 文件,用 Anaconda 进行环境配置。
修改 pulse.yml 文件中 prefix 的路径为你的 Anaconda 路径,然后使用指令创建环境:
conda create -f pulse.yml
这是官方推荐的方法。亲测,依然遇到了一些依赖问题。
最后一个一个依赖包安装才解决,所以我建议是使用 Anaconda 通过第三方库的包名安装,不用管版本啥的,例如:
conda install ca-certificates requests
libcxx、libedit 等这类的 lib 库不用安装,Anaconda 在创建 Python 环境的时候已经安装好了。
这里面稍微难安装的就是 dlib,dlib 需要使用 cmake 进行编译,所以需要先安装好 cmake,这里使用 pip 安装即可:
python -m pip install cmake dlib
都搞定了,环境就算搭建完成了。
4
效果测试
PULSE 项目地址:
https://github.com/adamian98/pulse
下载项目到本地:
git clone https://github.com/adamian98/pulse
项目提供了 pretrained model ,模型放在了 Google Drive ,不能翻墙的无法下载。
所以我将模型下载好,上传到了我的百度网盘。
下载地址(提取码:3gpq):
https://pan.baidu.com/s/13NZ8RY8KSogY78xh3gpcJA
在工程目录,创建 cache、realpics 两个文件夹,将下载好的三个文件放到 cache 文件夹内。
然后将下图放到 realpics 文件夹内,我们以此图为例,进行测试。
图片下载地址:
https://cuijiahua.com/wp-content/uploads/2020/07/dl-21-6.jpg
首先,我们使用 align_face.py 对图片 downscale。
python align_face.py
程序使用 dlib 检测人脸框,并对检测到的人脸进行降低分辨率处理,默认降低为 32x32 分辨率的图片。
生成的图片会放到 input 文件夹内,如果将图片放大到 1024x1024,就是相当于一张布满马赛克的图片。
有了这张 LR 图片,也就是低分辨率图片,使用 PULSE 算法,看下「脑补」效果吧!
python run.py -steps=2000
运行 run.py ,迭代 2000 steps,在 runs 文件夹下就会生成“去除”马赛克后的「脑补」图。
「脑补」图跟原图还是有些神似的!
5
争议
我们都知道,今年 5 月 25 日美国的「跪杀黑人」事件。
由此引发了美国有史以来,最大规模的游行抗议。
6 月份,吃“美国瓜”的人应该不在少数,比如我就在 YouTube 上吃了一个月的瓜。
每个国家都有自己的敏感话题。
而美国,现在的敏感话题就是「种族歧视」。
PULSE 算法惹了大麻烦。
PULSE 采用 CelebA-HQ 训练的模型,数据集都是白人,因此算法「脑补」出的也都是白人脸。
这在如今高喊「黑命贵」的美国,无疑是一股扎眼的“逆流”。
有网友就拿奥巴马的低分辨率照片进行测试,结果生成的都是白人男性,更加坐实了 PULSE 算法的「种族歧视」罪名。
PULSE 算法,以及相关的研究人员,因此被打上了「种族偏见」的标签。
甚至深度学习领军人物 LeCun 因为替 PULSE 说话,也不幸躺枪。
我倒是在想,以后美国科研的数据集是不是也得像美国电影一样,一部剧必须得有黑人演员才行,否则就算「政治不正确」。
扛着「政治正确」大旗的人们“口诛笔伐”异己,欲加之罪,何患无辞。
技术,有罪吗?
6
最后
- PULSE 算法对于非数据集的数据,「脑补」效果一般。
- 想用 PULSE 算法,“去除”人脸以外的马赛克图,需要建立数据集,重新训练模型。
- 上一篇:Python开发中如何正确处理凭据
- 下一篇:GO和Python那个更适合运维工程师
相关推荐
- 还不会deepseek部署到本地?这篇教程手把手教会你
-
一、为什么要把DeepSeek部署到本地?新手必看的前置知识近期很多读者在后台询问AI工具本地部署的问题,今天以国产优质模型DeepSeek为例,手把手教你实现本地化部署。本地部署有三大优势:数据隐私...
- 推荐个超实用的Python标准库pathlib,玩转路径操作
-
pathlib学习Python时,尤其是在进行文件操作和数据处理时,经常会处理路径问题。最常用和常见的是os.path模块,它将路径当做字符串进行处理,如果使用不当可能导致难以察觉的错误,而且...
- python中文件读写操作最佳实践——使用 os.path 进行路径操作
-
在Python中处理文件路径时,使用os.path模块比直接使用字符串拼接更加安全、可靠且跨平台。下面我将详细解释为什么以及如何使用os.path进行路径操作。为什么不应该使用字符串拼接?#不推荐的...
- Python如何获取当前文件所在目录的完整路径
-
在编程的过程中,我们常常会遇到需要获取当前文件所在目录完整路径的需求。那具体该怎么做呢?这是在众多开发者群体中备受关注的一个问题,就像在问答平台上“/questions/3430372/how-d...
- python编程之神经网络篇(python的神经网络编程)
-
#头条创作挑战赛#神经网络发展到今天大致经历了2次兴起和2次衰落,1943年心理学家McCulloch(麦卡洛克)和数学家Pitts(皮茨)参考生物神经系统的工作原理,首次提出建立了MP神经元模型。其...
- 详解Python整数类型的按位运算(在python中整数)
-
在Python编程中,按位运算是直接对整数的二进制位进行操作的底层运算,虽然不如逻辑运算常见,但在处理位掩码、状态标志、底层算法优化等场景中至关重要。本文将从基础概念到高级应用,全面解析Python整...
- 强化学习的改进只是「噪音」?最新预警:冷静看待推理模型进展
-
机器之心报道编辑:蛋酱、+0「推理」已成为语言模型的下一个主要前沿领域,近期学术界和工业界都取得了突飞猛进的进展。在探索的过程中,一个核心的议题是:对于模型推理性能的提升来说,什么有效?什么无效?De...
- 了解python3新特性-3(python3介绍)
-
以下是Python3的其他一些特性:改进了asyncio.run():Python3.7中对asyncio.run()函数进行了改进,可以方便地处理异步任务异常。新增了typing....
- python GIL全局解释器锁原理、功能及应用示例
-
GIL(GlobalInterpreterLock)是Python解释器中的一个机制,它是一把全局锁,用于在同一时间内限制只有一个线程执行Python字节码。以下是GIL的原理、功能以及5个示例:...
- python3-运算符优先级(python语言运算符优先级)
-
#挑战30天在头条写日记#Python运算符优先级以下列出了从最高到最低优先级的所有运算符,相同单元格内的运算符具有相同优先级。运算符均指二元运算,除非特别指出。相同单元格内的运算符从左至右分组...
- 如何在 Python 中使用 Notion API?
-
如何在Python中使用NotionAPI并自动编辑数据库。设置NotionAPI和数据库首先,让我们在Notion板中创建一个完整的页面数据库。在本文中,我使用了一个来自我的一个数据库的真实示...
- 一文了解 Python 的临时文件模块(python tmpfile)
-
Python的Tempfile模块是用于创建临时文件和文件夹的标准库。当我们需要临时存储数据时,可以创建临时文件,这些文件位于单独的目录中,该目录因操作系统而异,并且这些文件的名称是唯一的。在...
- 一文带您精通Python 集合(Set):8个不可不知的技巧及示例
-
在Python中,集合(Set)与列表(List)、字典(Dict)、元组(Tuple)一起构成了基本的数据结构。集合以其独特的无序性和元素唯一性,在处理数据时具有独特的优势。然而,很多人对集合的...
- 数据类型的"变形记":解锁Python数据处理效率的关键钥匙
-
在日常编程中,数据就像流动的河水,而数据类型就是塑造河道的模具。当我们从用户输入、文件读取或网络请求中获取数据时,往往需要像侦探一样验证它们的真实身份,再像魔术师一样将它们转换成需要的形态。这就是数据...
- 大学 Python 程序设计实验报告:基于组合数据类型
-
一、实验目的编写Python程序,实现对简单文本的处理,掌握列表、元组、字典等组合类型的应用。二、实验要求掌握字符串的输入和输出。掌握使用切片的方式访问字符串中的值。掌握常见的字符串内建函数的应用。...
你 发表评论:
欢迎- 一周热门
-
-
python 3.8调用dll - Could not find module 错误的解决方法
-
加密Python源码方案 PyArmor(python项目源码加密)
-
Python3.8如何安装Numpy(python3.6安装numpy)
-
大学生机械制图搜题软件?7个受欢迎的搜题分享了
-
编写一个自动生成双色球号码的 Python 小脚本
-
免费男女身高在线计算器,身高计算公式
-
将python文件打包成exe程序,复制到每台电脑都可以运行
-
Python学习入门教程,字符串函数扩充详解
-
Python数据分析实战-使用replace方法模糊匹配替换某列的值
-
Python进度条显示方案(python2 进度条)
-
- 最近发表
- 标签列表
-
- python计时 (54)
- python安装路径 (54)
- python类型转换 (75)
- python进度条 (54)
- python的for循环 (56)
- python串口编程 (60)
- python写入txt (51)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python字典增加键值对 (53)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python qt (52)
- python人脸识别 (54)
- python斐波那契数列 (51)
- python多态 (60)
- python命令行参数 (53)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- centos7安装python (53)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)