18分钟学会Python人脸检测(python人脸检测代码)
off999 2024-10-20 08:09 19 浏览 0 评论
本教程将向您介绍使用 OpenCV 库在 Python 中进行对象检测的概念以及如何利用它执行面部检测等任务。
什么是计算机视觉?
我们正处于人工智能革命的时代,深度学习领域取得了令人瞩目的进步。在过去的几个月里,我们见证了人工智能的应用,这些应用通过生成逼真的艺术作品、通过律师资格考试以及编写 Python 代码来创建网站,震惊了世界。
计算机视觉是一种深度学习应用,是这场革命的核心。它允许计算机从图像和视频文件等视觉输入中获得洞察力。计算机视觉的示例包括人脸检测、面部识别、人体姿势估计和障碍物检测。在本教程中,我们将探索如何使用 OpenCV 执行人脸检测,查看静态图像和实时图像。
计算机视觉的应用
既然人类视觉对于大多数人来说是一项相对简单的任务,为什么我们还需要计算机视觉呢?
虽然人类确实可以轻松执行视觉任务,并且只需要少量数据样本,但人工智能具有高度可扩展性。计算机视觉模型在部署到监控和自动驾驶汽车中时可以处理数百万个数据点。这是人类视觉根本无法达到的规模。
此外,计算机视觉应用可以集成到传感器、摄像头和智能设备中,实现全天候实时图像处理。这对于人类来说同样是一项极具挑战性的壮举。
最后,人工智能不易受偏见、疲劳和注意力不集中的影响。虽然人类可能会感到疲劳并忽视安全漏洞,但计算机视觉应用程序永远不会出现故障,从而降低了错过事件的风险。
让我们看看计算机视觉在我们日常生活中的一些实际应用:
监视
计算机视觉应用(例如物体识别和姿势估计)通常部署在安全设备中,以实现人员监控自动化。例如,姿势估计模型可以跟踪一个人的肢体语言,以判断他们是否在煽动暴力、遇到医疗紧急情况或即将偷窃某物。然后,这些系统可以触发通知,提醒相关部门提供帮助,从而缩短响应时间并提高公共安全。
零售
计算机视觉模型可以部署在零售店,以跟踪顾客的眼睛位置、肢体语言和商店内的移动。
这些算法可以为零售商提供以下有关用户行为的洞察:
- 是否有任何特定的促销活动或产品可以吸引人们的注意力并吸引他们进入商店?
- 顾客在商店里通常走哪条路径?
- 哪种类型的产品植入最能引起人们的关注?
- 顾客多久会接触一次横幅和标牌等促销材料?
零售商可以利用这些见解来改进商店的营销策略,并定制产品展示以推动销售。
自动驾驶汽车
自动驾驶领域从计算机视觉技术中受益匪浅。
物体检测模型部署在车辆上,以识别道路上的行人、其他车辆和动物。
计算机视觉应用程序可以解释停车标志和交通信号灯,准确估计车辆与其他物体之间的距离,并避开坑洼等障碍物,以确保安全的驾驶体验。
OpenCV 简介
现在我们了解了计算机视觉应用程序有多么有用,让我们研究一下用于实现它们的流行工具。OpenCV是一个计算机视觉库,支持 Python、C++ 和 Java 等编程语言。
该软件包最初由英特尔于 1999 年创建,后来开源并向公众发布。
OpenCV 允许开发人员和非数学家轻松构建计算机视觉应用程序,而无需从头开始编写代码。该库拥有超过 2,500 种算法,允许用户执行面部识别和物体检测等任务。
谷歌、微软、IBM 和英特尔等知名组织的开发人员和数据从业者广泛使用 OpenCV 库,该库目前可免费用于商业用途。
在本文中,我们将使用 OpenCV 在 Python 中执行人脸检测。
在本教程结束时,您将了解如何:
- 使用 Python 中的 OpenCV 检测图像中的人脸
- 在网络摄像头的实时流中执行实时人脸检测
- 识别并标记图像中的名人面孔
什么是人脸检测?
人脸检测涉及识别图像或视频中的人脸。这是通过分析视觉输入来确定是否存在人的面部特征来完成的。
由于人类面孔种类繁多,人脸检测模型通常需要对大量输入数据进行训练才能准确无误。训练数据集必须包含来自不同背景、性别和文化的人的足够代表性。
这些算法还需要输入许多包含不同光照、角度和方向的训练样本,才能在现实场景中做出正确的预测。
这些细微差别使得人脸检测成为一项重要且耗时的任务,需要数小时的模型训练和数百万个数据样本。
值得庆幸的是,OpenCV 软件包附带了用于人脸检测的预训练模型,这意味着我们不必从头开始训练算法。更具体地说,该库采用一种称为 Haar 级联的机器学习方法来识别视觉数据中的对象。
OpenCV 人脸检测教程
在本节中,我们将学习使用 OpenCV 和 Python 应用一种名为 Haar Cascade 的流行人脸检测方法进行人脸检测。
Haar 级联分类器简介
该方法最早在Paul Viola 和 Michael Jones 撰写的论文《使用增强级联简单特征进行快速对象检测》中提出。
该技术背后的理念是使用级联分类器来检测图像中的不同特征。然后将这些分类器组合成一个强分类器,可以准确区分包含人脸的样本和不包含人脸的样本。
OpenCV 内置的 Haar Cascade 分类器已在大量人脸数据集上进行过训练,因此无需进一步训练。我们只需从库中加载分类器并使用它对输入图像执行人脸检测即可。
安装 Python 版 OpenCV
要安装 OpenCV 库,只需打开命令提示符或终端窗口并运行以下命令:
pip install opencv-python
仅当您的设备上已安装 pip 时,此命令才有效。
OpenCV 用于图像中人脸检测
我们将构建一个检测器来识别 Unsplash照片中的人脸。input_image在开始编码之前,请确保将图片保存到您的工作目录并将其重命名为。
步骤 1:导入 OpenCV 包
现在,让我们导入OpenCV并使用以下代码行输入输入图像路径:
import cv2
imagePath = 'input_image.jpg'
第 2 步:读取图像
然后,我们需要用OpenCV的imread()函数读取图像:
img = cv2.imread(imagePath)
步骤 3:将图像转换为灰度
为了提高计算效率,我们首先需要将此图像转换为灰度,然后再对其进行人脸检测:
gray_image = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
步骤 4:加载分类器
让我们加载OpenCV内置的预训练的Haar Cascade分类器:
face_classifier = cv2.CascadeClassifier(
cv2.data.haarcascades + "haarcascade_frontalface_default.xml"
)
请注意,我们正在使用一个名为的文件haarcascade_frontalface_default.xml。此分类器专门用于检测视觉输入中的正面。
OpenCV 还提供了其他预训练模型来检测图像中的不同物体 - 例如人的眼睛、微笑、上半身,甚至是车辆的牌照。您可以通过检查库的GitHub 存储库来了解有关 OpenCV 内置的不同分类器的更多信息。
步骤 5:执行人脸检测
我们现在可以使用刚刚加载的分类器对灰度图像执行人脸检测:
face = face_classifier.detectMultiScale(
gray_image, scaleFactor=1.1, minNeighbors=5, minSize=(40, 40)
)
让我们分解一下上述代码中指定的方法和参数:
- detectMultiScale():
detectMultiScale() 方法用于识别输入图像中不同大小的人脸。
- grey_image:
这个方法中第一个参数叫做grey_image,就是我们之前创建的灰度图像。
- scaleFactor:
此参数用于缩小输入图像的尺寸,以便算法更容易检测较大的人脸。在本例中,我们指定了比例因子 1.1,表示我们希望将图像尺寸缩小 10%。
- minNeighbors:
级联分类器在图像中应用滑动窗口来检测其中的人脸。您可以将这些窗口视为矩形。
最初,分类器会捕获大量误报。这些误报可通过参数消除minNeighbors,该参数指定了需要识别的相邻矩形的数量,才能将对象视为有效检测。
总而言之,将 0 或 1 这样的小值传递给此参数会导致大量的误报,而大量的误报可能会导致失去许多真正报。
这里的诀窍是找到一种权衡,让我们能够消除假阳性,同时还能准确识别真阳性。
- minSize:
最后,该minSize参数设置要检测的物体的最小尺寸。模型将忽略小于指定最小尺寸的人脸。
步骤6:绘制边界框
现在模型已经检测到图像中的人脸,让我们运行以下代码行来围绕这些人脸创建一个边界框:
for (x, y, w, h) in face:
cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 4)
该face变量是一个包含四个值的数组:检测到人脸的 x 轴和 y 轴,以及它们的宽度和高度。上述代码对已识别的人脸进行迭代,并创建一个跨越这些测量值的边界框。
该参数0,255,0表示边界框的颜色,为绿色,并4表示其厚度。
步骤7:显示图像
为了显示检测到的人脸图像,我们首先需要将图像从 BGR 格式转换为 RGB:
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
现在,让我们使用 Matplotlib 库来显示图像:
import matplotlib.pyplot as plt
plt.figure(figsize=(20,10))
plt.imshow(img_rgb)
plt.axis('off')
上述代码应生成以下输出:
伟大的!
该模型已成功检测出该图像中的人脸并在其周围创建了一个边界框。
使用 OpenCV 进行实时人脸检测
现在我们已经成功地使用 OpenCV 在静态图像上执行了人脸检测,让我们看看如何在实时视频流上执行相同的操作。
步骤 1:先决条件
首先,让我们继续导入 OpenCV 库并加载 Haar Cascade 模型,就像我们在上一节中所做的那样。如果您之前已经运行过此代码块,则可以跳过它:
import cv2
face_classifier = cv2.CascadeClassifier(
cv2.data.haarcascades + "haarcascade_frontalface_default.xml"
)
第 2 步:访问网络摄像头
现在,我们需要访问设备的摄像头来读取实时视频数据流。可以使用以下代码完成此操作:
video_capture = cv2.VideoCapture(0)
请注意,我们已将参数传递0给 VideoCapture() 函数。这告诉 OpenCV 使用我们设备上的默认摄像头。如果您的设备连接了多个摄像头,则可以相应地更改此参数值。
步骤 3:识别视频流中的人脸
现在,让我们创建一个函数来检测视频流中的人脸并在它们周围绘制一个边界框:
def detect_bounding_box(vid):
gray_image = cv2.cvtColor(vid, cv2.COLOR_BGR2GRAY)
faces = face_classifier.detectMultiScale(gray_image, 1.1, 5, minSize=(40, 40))
for (x, y, w, h) in faces:
cv2.rectangle(vid, (x, y), (x + w, y + h), (0, 255, 0), 4)
return faces
该detect_bounding_box函数以视频帧作为输入。
在这个函数中,我们使用与之前相同的代码,在执行人脸检测之前将帧转换为灰度。
然后,我们还使用与之前相同的scaleFactor、minNeighbors和的参数值来检测该图像中的人脸。minSize
4最后,我们在框架周围绘制一个厚度合适的绿色边界框。
步骤 4:创建实时人脸检测循环
现在,我们需要创建一个无限的 while 循环,它将从我们的网络摄像头捕获视频帧并将人脸检测功能应用于它:
while True:
result, video_frame = video_capture.read() # read frames from the video
if result is False:
break # terminate the loop if the frame is not read successfully
faces = detect_bounding_box(
video_frame
) # apply the function we created to the video frame
cv2.imshow(
"My Face Detection Project", video_frame
) # display the processed frame in a window named "My Face Detection Project"
if cv2.waitKey(1) & 0xFF == ord("q"):
break
video_capture.release()
cv2.destroyAllWindows()
运行上述代码后,您应该会看到My Face Detection Project屏幕上出现一个名为的窗口:
无论您在框架内移动到哪里,算法都会跟踪您的脸部并在其周围创建一个绿色边界框。
在上面的框架中,模型识别了我的脸和我手中的驾照上的照片。
您还可以通过举起多张照片或让不同的人站在相机后面的不同角度来测试此模型的有效性。该模型应该能够在不同的背景或照明设置下识别所有人的脸。
如果您想退出程序,可以按键盘上的“q”键退出循环。
使用 OpenCV 进行人脸检测 - 下一步
现在您已经学会了如何使用 OpenCV 库成功检测图像和实时视频中的人脸,下面是您可以采取的一些步骤,将您的知识提升到一个新的水平:
创建自己的项目
您可以使用本教程中提供的代码作为您自己的人脸检测项目的起点。
扩展该项目的一种方法是识别不同类型的输入数据(例如 PDF 文件或监控图像)中的人脸。您甚至可以设置自己的安全摄像头,并实时对其捕获的数据进行人脸检测。
此外,您还可以在大型数据集上创建人脸检测模型,或者更进一步执行诸如在图像数据集中检测一个人是否戴着口罩之类的任务。
Kaggle 上的图像中的人脸检测和人脸口罩检测数据集是该领域投资组合项目的良好起点。
建立面部识别模型
虽然人脸检测可用于在视觉输入中检测人脸,但人脸识别更进一步。该技术用于通过将人脸与现有数据库进行匹配来验证一个人的身份。
您可以尝试建立一个面部识别模型,在人群中识别特定的面部(甚至可能是您的面部)。
这项任务比人脸检测稍微具有挑战性,因为模型必须在许多数据样本上进行训练,然后才能区分人。
在建立人脸识别模型之前,您可能还需要执行预处理技术,例如降噪和图像变换。
如果这些概念对您来说很陌生,请不要担心!您可以通过参加我们的Python 图像处理课程了解有关图像处理的所有知识。
获得领域专业知识
图像和视频处理广泛应用于安全、零售、医疗保健和制造业等各个领域。
如果你想成为一名计算机视觉专家,你首先需要了解这些行业使用的数据类型。领域专业知识将使你更容易在现实场景中标记、转换和训练数据集。
首先,您可以参加我们的Python 生物医学图像分析课程。该课程将教您如何处理 CT 扫描图像、分割心脏 MRI 时间序列以及确定阿尔茨海默病是否会改变大脑结构。
这些概念将使您具备进入生物医学成像领域所需的技能。
相关推荐
- python gui编程框架推荐以及介绍(python gui开发)
-
Python的GUI编程框架有很多,这里为您推荐几个常用且功能强大的框架:Tkinter:Tkinter是Python的标准GUI库,它是Python内置的模块,无需额外安装。它使用简单,功能较为基础...
- python自动化框架学习-pyautogui(python接口自动化框架)
-
一、适用平台:PC(windows和mac均可用)二、下载安装:推荐使用命令行下载(因为会自动安装依赖库):pipinstallPyAutoGUI1该框架的依赖库还是蛮多的,第一次用的同学耐心等...
- Python 失宠!Hugging Face 用 Rust 新写了一个 ML框架,现已低调开源
-
大数据文摘受权转载自AI前线整理|褚杏娟近期,HuggingFace低调开源了一个重磅ML框架:Candle。Candle一改机器学习惯用Python的做法,而是Rust编写,重...
- Flask轻量级框架 web开发原来可以这么可爱呀~(建议收藏)
-
Flask轻量级框架web开发原来可以这么可爱呀大家好呀~今天让我们一起来学习一个超级可爱又实用的PythonWeb框架——Flask!作为一个轻量级的Web框架,Flask就像是一个小巧精致的工...
- Python3使用diagrams生成架构图(python架构设计)
-
目录技术背景diagrams的安装基础逻辑关系图组件簇的定义总结概要参考链接技术背景对于一个架构师或者任何一个软件工程师而言,绘制架构图都是一个比较值得学习的技能。这就像我们学习的时候整理的一些Xmi...
- 几个高性能Python网络框架,高效实现网络应用
-
Python作为一种广泛使用的编程语言,其简洁易读的语法和强大的生态系统,使得它在Web开发领域占据重要位置。高性能的网络框架是构建高效网络应用的关键因素之一。本文将介绍几个高性能的Python网络框...
- Web开发人员的十佳Python框架(python最好的web框架)
-
Python是一种面向对象、解释型计算机程序设计语言。除了语言本身的设计目的之外,Python的标准库也是值得大家称赞的,同时Python还自带服务器。其它方面,Python拥有足够多的免费数据函数库...
- Diagram as Code:用python代码生成架构图
-
工作中常需要画系统架构图,通常的方法是通过visio、processon、draw.io之类的软件,但是今天介绍的这个软件Diagrams,可以通过写Python代码完成架构图绘制,确实很co...
- 分享一个2022年火遍全网的Python框架
-
作者:俊欣来源:关于数据分析与可视化最近Python圈子当中出来一个非常火爆的框架PyScript,该框架可以在浏览器中运行Python程序,只需要在HTML程序中添加一些Python代码即可实现。该...
- 10个用于Web开发的最好 Python 框架
-
Python是一门动态、面向对象语言。其最初就是作为一门面向对象语言设计的,并且在后期又加入了一些更高级的特性。除了语言本身的设计目的之外,Python标准库也是值得大家称赞的,Python甚至还...
- 使用 Python 将 Google 表格变成您自己的数据库
-
图片来自Shutterstock,获得FrankAndrade的许可您知道Google表格可以用作轻量级数据库吗?GoogleSheets是一个基于云的电子表格应用程序,可以像大多数数据库管...
- 牛掰!用Python处理Excel的14个常用操作总结!
-
自从学了Python后就逼迫用Python来处理Excel,所有操作用Python实现。目的是巩固Python,与增强数据处理能力。这也是我写这篇文章的初衷。废话不说了,直接进入正题。数据是网上找到的...
- 将python打包成exe的方式(将python文件打包成exe可运行文件)
-
客户端应用程序往往需要运行Python脚本,这对于那些不熟悉Python语言的用户来说可能会带来一定的困扰。幸运的是,Python拥有一些第三方模块,可以将这些脚本转换成可执行的.exe...
- 对比Excel学Python第1练:既有Excel,何用Python?
-
背景之前发的文章开头都是“Python数据分析……”,使得很多伙伴以为我是专门分享Python的,但我的本意并非如此,我的重点还是会放到“数据分析”上,毕竟,Python只是一种工具而已。现在网上可以...
- 高效办公:Python处理excel文件,摆脱无效办公
-
一、Python处理excel文件1.两个头文件importxlrdimportxlwt其中xlrd模块实现对excel文件内容读取,xlwt模块实现对excel文件的写入。2.读取exce...
你 发表评论:
欢迎- 一周热门
-
-
python 3.8调用dll - Could not find module 错误的解决方法
-
加密Python源码方案 PyArmor(python项目源码加密)
-
Python3.8如何安装Numpy(python3.6安装numpy)
-
大学生机械制图搜题软件?7个受欢迎的搜题分享了
-
编写一个自动生成双色球号码的 Python 小脚本
-
免费男女身高在线计算器,身高计算公式
-
将python文件打包成exe程序,复制到每台电脑都可以运行
-
Python学习入门教程,字符串函数扩充详解
-
Python数据分析实战-使用replace方法模糊匹配替换某列的值
-
Python进度条显示方案(python2 进度条)
-
- 最近发表
-
- python gui编程框架推荐以及介绍(python gui开发)
- python自动化框架学习-pyautogui(python接口自动化框架)
- Python 失宠!Hugging Face 用 Rust 新写了一个 ML框架,现已低调开源
- Flask轻量级框架 web开发原来可以这么可爱呀~(建议收藏)
- Python3使用diagrams生成架构图(python架构设计)
- 几个高性能Python网络框架,高效实现网络应用
- Web开发人员的十佳Python框架(python最好的web框架)
- Diagram as Code:用python代码生成架构图
- 分享一个2022年火遍全网的Python框架
- 10个用于Web开发的最好 Python 框架
- 标签列表
-
- python计时 (54)
- python安装路径 (54)
- python类型转换 (75)
- python进度条 (54)
- python的for循环 (56)
- python串口编程 (60)
- python写入txt (51)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python字典增加键值对 (53)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python qt (52)
- python人脸识别 (54)
- python斐波那契数列 (51)
- python多态 (60)
- python命令行参数 (53)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- centos7安装python (53)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)