百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

18分钟学会Python人脸检测(python人脸检测代码)

off999 2024-10-20 08:09 27 浏览 0 评论

本教程将向您介绍使用 OpenCV 库在 Python 中进行对象检测的概念以及如何利用它执行面部检测等任务。

什么是计算机视觉?

我们正处于人工智能革命的时代,深度学习领域取得了令人瞩目的进步。在过去的几个月里,我们见证了人工智能的应用,这些应用通过生成逼真的艺术作品、通过律师资格考试以及编写 Python 代码来创建网站,震惊了世界。

计算机视觉是一种深度学习应用,是这场革命的核心。它允许计算机从图像和视频文件等视觉输入中获得洞察力。计算机视觉的示例包括人脸检测、面部识别、人体姿势估计和障碍物检测。在本教程中,我们将探索如何使用 OpenCV 执行人脸检测,查看静态图像和实时图像。

计算机视觉的应用

既然人类视觉对于大多数人来说是一项相对简单的任务,为什么我们还需要计算机视觉呢?

虽然人类确实可以轻松执行视觉任务,并且只需要少量数据样本,但人工智能具有高度可扩展性。计算机视觉模型在部署到监控和自动驾驶汽车中时可以处理数百万个数据点。这是人类视觉根本无法达到的规模。

此外,计算机视觉应用可以集成到传感器、摄像头和智能设备中,实现全天候实时图像处理。这对于人类来说同样是一项极具挑战性的壮举。

最后,人工智能不易受偏见、疲劳和注意力不集中的影响。虽然人类可能会感到疲劳并忽视安全漏洞,但计算机视觉应用程序永远不会出现故障,从而降低了错过事件的风险。

让我们看看计算机视觉在我们日常生活中的一些实际应用:

监视

计算机视觉应用(例如物体识别和姿势估计)通常部署在安全设备中,以实现人员监控自动化。例如,姿势估计模型可以跟踪一个人的肢体语言,以判断他们是否在煽动暴力、遇到医疗紧急情况或即将偷窃某物。然后,这些系统可以触发通知,提醒相关部门提供帮助,从而缩短响应时间并提高公共安全。

零售

计算机视觉模型可以部署在零售店,以跟踪顾客的眼睛位置、肢体语言和商店内的移动。

这些算法可以为零售商提供以下有关用户行为的洞察:

  • 是否有任何特定的促销活动或产品可以吸引人们的注意力并吸引他们进入商店?
  • 顾客在商店里通常走哪条路径?
  • 哪种类型的产品植入最能引起人们的关注?
  • 顾客多久会接触一次横幅和标牌等促销材料?

零售商可以利用这些见解来改进商店的营销策略,并定制产品展示以推动销售。

自动驾驶汽车

自动驾驶领域从计算机视觉技术中受益匪浅。

物体检测模型部署在车辆上,以识别道路上的行人、其他车辆和动物。

计算机视觉应用程序可以解释停车标志和交通信号灯,准确估计车辆与其他物体之间的距离,并避开坑洼等障碍物,以确保安全的驾驶体验。

OpenCV 简介

现在我们了解了计算机视觉应用程序有多么有用,让我们研究一下用于实现它们的流行工具。OpenCV是一个计算机视觉库,支持 Python、C++ 和 Java 等编程语言。

该软件包最初由英特尔于 1999 年创建,后来开源并向公众发布。

OpenCV 允许开发人员和非数学家轻松构建计算机视觉应用程序,而无需从头开始编写代码。该库拥有超过 2,500 种算法,允许用户执行面部识别和物体检测等任务。

谷歌、微软、IBM 和英特尔等知名组织的开发人员和数据从业者广泛使用 OpenCV 库,该库目前可免费用于商业用途。

在本文中,我们将使用 OpenCV 在 Python 中执行人脸检测。

在本教程结束时,您将了解如何:

  • 使用 Python 中的 OpenCV 检测图像中的人脸
  • 在网络摄像头的实时流中执行实时人脸检测
  • 识别并标记图像中的名人面孔

什么是人脸检测?

人脸检测涉及识别图像或视频中的人脸。这是通过分析视觉输入来确定是否存在人的面部特征来完成的。

由于人类面孔种类繁多,人脸检测模型通常需要对大量输入数据进行训练才能准确无误。训练数据集必须包含来自不同背景、性别和文化的人的足够代表性。

这些算法还需要输入许多包含不同光照、角度和方向的训练样本,才能在现实场景中做出正确的预测。

这些细微差别使得人脸检测成为一项重要且耗时的任务,需要数小时的模型训练和数百万个数据样本。

值得庆幸的是,OpenCV 软件包附带了用于人脸检测的预训练模型,这意味着我们不必从头开始训练算法。更具体地说,该库采用一种称为 Haar 级联的机器学习方法来识别视觉数据中的对象。

OpenCV 人脸检测教程

在本节中,我们将学习使用 OpenCV 和 Python 应用一种名为 Haar Cascade 的流行人脸检测方法进行人脸检测。


Haar 级联分类器简介

该方法最早在Paul Viola 和 Michael Jones 撰写的论文《使用增强级联简单特征进行快速对象检测》中提出。

该技术背后的理念是使用级联分类器来检测图像中的不同特征。然后将这些分类器组合成一个强分类器,可以准确区分包含人脸的样本和不包含人脸的样本。

OpenCV 内置的 Haar Cascade 分类器已在大量人脸数据集上进行过训练,因此无需进一步训练。我们只需从库中加载分类器并使用它对输入图像执行人脸检测即可。

安装 Python 版 OpenCV

要安装 OpenCV 库,只需打开命令提示符或终端窗口并运行以下命令:

pip install opencv-python

仅当您的设备上已安装 pip 时,此命令才有效。


OpenCV 用于图像中人脸检测

我们将构建一个检测器来识别 Unsplash照片中的人脸。input_image在开始编码之前,请确保将图片保存到您的工作目录并将其重命名为。

步骤 1:导入 OpenCV 包

现在,让我们导入OpenCV并使用以下代码行输入输入图像路径:

import cv2


imagePath = 'input_image.jpg'


第 2 步:读取图像

然后,我们需要用OpenCV的imread()函数读取图像:

img = cv2.imread(imagePath)



步骤 3:将图像转换为灰度

为了提高计算效率,我们首先需要将此图像转换为灰度,然后再对其进行人脸检测:

gray_image = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)


步骤 4:加载分类器

让我们加载OpenCV内置的预训练的Haar Cascade分类器:

face_classifier = cv2.CascadeClassifier(
    cv2.data.haarcascades + "haarcascade_frontalface_default.xml"
)


请注意,我们正在使用一个名为的文件haarcascade_frontalface_default.xml。此分类器专门用于检测视觉输入中的正面。


OpenCV 还提供了其他预训练模型来检测图像中的不同物体 - 例如人的眼睛、微笑、上半身,甚至是车辆的牌照。您可以通过检查库的GitHub 存储库来了解有关 OpenCV 内置的不同分类器的更多信息。

步骤 5:执行人脸检测

我们现在可以使用刚刚加载的分类器对灰度图像执行人脸检测:

face = face_classifier.detectMultiScale(
    gray_image, scaleFactor=1.1, minNeighbors=5, minSize=(40, 40)
)


让我们分解一下上述代码中指定的方法和参数:

  1. detectMultiScale():

detectMultiScale() 方法用于识别输入图像中不同大小的人脸。

  1. grey_image


这个方法中第一个参数叫做grey_image,就是我们之前创建的灰度图像。

  1. scaleFactor

此参数用于缩小输入图像的尺寸,以便算法更容易检测较大的人脸。在本例中,我们指定了比例因子 1.1,表示我们希望将图像尺寸缩小 10%。

  1. minNeighbors

级联分类器在图像中应用滑动窗口来检测其中的人脸。您可以将这些窗口视为矩形。

最初,分类器会捕获大量误报。这些误报可通过参数消除minNeighbors,该参数指定了需要识别的相邻矩形的数量,才能将对象视为有效检测。

总而言之,将 0 或 1 这样的小值传递给此参数会导致大量的误报,而大量的误报可能会导致失去许多真正报。

这里的诀窍是找到一种权衡,让我们能够消除假阳性,同时还能准确识别真阳性。

  1. minSize

最后,该minSize参数设置要检测的物体的最小尺寸。模型将忽略小于指定最小尺寸的人脸。

步骤6:绘制边界框

现在模型已经检测到图像中的人脸,让我们运行以下代码行来围绕这些人脸创建一个边界框:

for (x, y, w, h) in face:
    cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 4)


face变量是一个包含四个值的数组:检测到人脸的 x 轴和 y 轴,以及它们的宽度和高度。上述代码对已识别的人脸进行迭代,并创建一个跨越这些测量值的边界框。


该参数0,255,0表示边界框的颜色,为绿色,并4表示其厚度。

步骤7:显示图像

为了显示检测到的人脸图像,我们首先需要将图像从 BGR 格式转换为 RGB:

img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)


现在,让我们使用 Matplotlib 库来显示图像:

import matplotlib.pyplot as plt


plt.figure(figsize=(20,10))
plt.imshow(img_rgb)
plt.axis('off')


上述代码应生成以下输出:

伟大的!

该模型已成功检测出该图像中的人脸并在其周围创建了一个边界框。

使用 OpenCV 进行实时人脸检测

现在我们已经成功地使用 OpenCV 在静态图像上执行了人脸检测,让我们看看如何在实时视频流上执行相同的操作。

步骤 1:先决条件

首先,让我们继续导入 OpenCV 库并加载 Haar Cascade 模型,就像我们在上一节中所做的那样。如果您之前已经运行过此代码块,则可以跳过它:

import cv2


face_classifier = cv2.CascadeClassifier(
    cv2.data.haarcascades + "haarcascade_frontalface_default.xml"
)


第 2 步:访问网络摄像头

现在,我们需要访问设备的摄像头来读取实时视频数据流。可以使用以下代码完成此操作:

video_capture = cv2.VideoCapture(0)


请注意,我们已将参数传递0给 VideoCapture() 函数。这告诉 OpenCV 使用我们设备上的默认摄像头。如果您的设备连接了多个摄像头,则可以相应地更改此参数值。


步骤 3:识别视频流中的人脸

现在,让我们创建一个函数来检测视频流中的人脸并在它们周围绘制一个边界框:

def detect_bounding_box(vid):
    gray_image = cv2.cvtColor(vid, cv2.COLOR_BGR2GRAY)
    faces = face_classifier.detectMultiScale(gray_image, 1.1, 5, minSize=(40, 40))
    for (x, y, w, h) in faces:
        cv2.rectangle(vid, (x, y), (x + w, y + h), (0, 255, 0), 4)
    return faces


detect_bounding_box函数以视频帧作为输入。


在这个函数中,我们使用与之前相同的代码,在执行人脸检测之前将帧转换为灰度。

然后,我们还使用与之前相同的scaleFactorminNeighbors和的参数值来检测该图像中的人脸。minSize

4最后,我们在框架周围绘制一个厚度合适的绿色边界框。

步骤 4:创建实时人脸检测循环

现在,我们需要创建一个无限的 while 循环,它将从我们的网络摄像头捕获视频帧并将人脸检测功能应用于它:

while True:


    result, video_frame = video_capture.read()  # read frames from the video
    if result is False:
        break  # terminate the loop if the frame is not read successfully


    faces = detect_bounding_box(
        video_frame
    )  # apply the function we created to the video frame


    cv2.imshow(
        "My Face Detection Project", video_frame
    )  # display the processed frame in a window named "My Face Detection Project"


    if cv2.waitKey(1) & 0xFF == ord("q"):
        break


video_capture.release()
cv2.destroyAllWindows()


运行上述代码后,您应该会看到My Face Detection Project屏幕上出现一个名为的窗口:

无论您在框架内移动到哪里,算法都会跟踪您的脸部并在其周围创建一个绿色边界框。

在上面的框架中,模型识别了我的脸和我手中的驾照上的照片。

您还可以通过举起多张照片或让不同的人站在相机后面的不同角度来测试此模型的有效性。该模型应该能够在不同的背景或照明设置下识别所有人的脸。

如果您想退出程序,可以按键盘上的“q”键退出循环。

使用 OpenCV 进行人脸检测 - 下一步

现在您已经学会了如何使用 OpenCV 库成功检测图像和实时视频中的人脸,下面是您可以采取的一些步骤,将您的知识提升到一个新的水平:

创建自己的项目

您可以使用本教程中提供的代码作为您自己的人脸检测项目的起点。

扩展该项目的一种方法是识别不同类型的输入数据(例如 PDF 文件或监控图像)中的人脸。您甚至可以设置自己的安全摄像头,并实时对其捕获的数据进行人脸检测。

此外,您还可以在大型数据集上创建人脸检测模型,或者更进一步执行诸如在图像数据集中检测一个人是否戴着口罩之类的任务。

Kaggle 上的图像中的人脸检测和人脸口罩检测数据集是该领域投资组合项目的良好起点。

建立面部识别模型

虽然人脸检测可用于在视觉输入中检测人脸,但人脸识别更进一步。该技术用于通过将人脸与现有数据库进行匹配来验证一个人的身份。

您可以尝试建立一个面部识别模型,在人群中识别特定的面部(甚至可能是您的面部)。

这项任务比人脸检测稍微具有挑战性,因为模型必须在许多数据样本上进行训练,然后才能区分人。

在建立人脸识别模型之前,您可能还需要执行预处理技术,例如降噪和图像变换。

如果这些概念对您来说很陌生,请不要担心!您可以通过参加我们的Python 图像处理课程了解有关图像处理的所有知识。

获得领域专业知识

图像和视频处理广泛应用于安全、零售、医疗保健和制造业等各个领域。

如果你想成为一名计算机视觉专家,你首先需要了解这些行业使用的数据类型。领域专业知识将使你更容易在现实场景中标记、转换和训练数据集。

首先,您可以参加我们的Python 生物医学图像分析课程。该课程将教您如何处理 CT 扫描图像、分割心脏 MRI 时间序列以及确定阿尔茨海默病是否会改变大脑结构。

这些概念将使您具备进入生物医学成像领域所需的技能。

相关推荐

大文件传不动?WinRAR/7-Zip 入门到高手,这 5 个技巧让你效率翻倍

“这200张照片怎么传给女儿?微信发不了,邮箱附件又超限……”62岁的张阿姨对着电脑犯愁时,儿子只用了3分钟就把照片压缩成一个文件,还教她:“以后用压缩软件,比打包行李还方便!”职场人更懂这...

电脑解压缩软件推荐——7-Zip:免费、高效、简洁的文件管理神器

在日常工作中,我们经常需要处理压缩文件。无论是下载软件包、接收文件,还是存储大量数据,压缩和解压缩文件都成为了我们日常操作的一部分。而说到压缩解压软件,7-Zip绝对是一个不可忽视的名字。今天,我就来...

设置了加密密码zip文件要如何打开?这几个方法可以试试~

Zip是一种常见的压缩格式文件,文件还可以设置密码保护。那设置了密码的Zip文件要如何打开呢?不清楚的小伙伴一起来看看吧。当我们知道密码想要打开带密码的Zip文件,我们需要用到适用于Zip格式的解压缩...

大文件想要传输成功,怎么把ZIP文件分卷压缩

不知道各位小伙伴有没有这样的烦恼,发送很大很大的压缩包会受到限制,为此,想要在压缩过程中将文件拆分为几个压缩包并且同时为所有压缩包设置加密应该如何设置?方法一:使用7-Zip免费且强大的文件管理工具7...

高效处理 RAR 分卷压缩包:合并解压操作全攻略

在文件传输和存储过程中,当遇到大文件时,我们常常会使用分卷压缩的方式将其拆分成多个较小的压缩包,方便存储和传输。RAR作为一种常见的压缩格式,分卷压缩包的使用频率也很高。但很多人在拿到RAR分卷...

2个方法教你如何删除ZIP压缩包密码

zip压缩包设置了加密密码,每次解压文件都需要输入密码才能够顺利解压出文件,当压缩包文件不再需要加密的时候,大家肯定想删除压缩包密码,或是忘记了压缩包密码,想要通过删除操作将压缩包密码删除,就能够顺利...

速转!漏洞预警丨压缩软件Winrar目录穿越漏洞

WinRAR是一款功能强大的压缩包管理器,它是档案工具RAR在Windows环境下的图形界面。该软件可用于备份数据,缩减电子邮件附件的大小,解压缩从Internet上下载的RAR、ZIP及其它类...

文件解压方法和工具分享_文件解压工具下载

压缩文件减少文件大小,降低文件失效的概率,总得来说好处很多。所以很多文件我们下载下来都是压缩软件,很多小伙伴不知道怎么解压,或者不知道什么工具更好,所以今天做了文件解压方法和工具的分享给大家。一、解压...

[python]《Python编程快速上手:让繁琐工作自动化》学习笔记3

1.组织文件笔记(第9章)(代码下载)1.1文件与文件路径通过importshutil调用shutil模块操作目录,shutil模块能够在Python程序中实现文件复制、移动、改名和删除;同时...

Python内置tarfile模块:读写 tar 归档文件详解

一、学习目标1.1学习目标掌握Python内置模块tarfile的核心功能,包括:理解tar归档文件的原理与常见压缩格式(gzip/bz2/lzma)掌握tar文件的读写操作(创建、解压、查看、过滤...

使用python展开tar包_python拓展

类Unix的系统,打包文件经常使用的就是tar包,结合zip工具,可以方便的打包并解压。在python的标准库里面有tarfile库,可以方便实现生成了展开tar包。使用这个库最大的好处,可能就在于不...

银狐钓鱼再升级:白文件脚本化实现GO语言后门持久驻留

近期,火绒威胁情报中心监测到一批相对更为活跃的“银狐”系列变种木马。火绒安全工程师第一时间获取样本并进行分析。分析发现,该样本通过阿里云存储桶下发恶意文件,采用AppDomainManager进行白利...

ZIP文件怎么打开?2个简单方法教你轻松搞定!

在日常工作和生活中,我们经常会遇到各种压缩文件,其中最常见的格式之一就是ZIP。ZIP文件通过压缩数据来减少文件大小,方便我们进行存储和传输。然而,对于初学者来说,如何打开ZIP文件可能会成为一个小小...

Ubuntu—解压多个zip压缩文件.zip .z01 .z02

方法将所有zip文件放在同一目录中:zip_file.z01,zip_file.z02,zip_file.z03,...,zip_file.zip。在Zip3.0版本及以上,使用下列命令:将所有zi...

如何使用7-Zip对文件进行加密压缩

7-Zip是一款开源的文件归档工具,支持多种压缩格式,并提供了对压缩文件进行加密的功能。使用7-Zip可以轻松创建和解压.7z、.zip等格式的压缩文件,并且可以通过设置密码来保护压缩包中的...

取消回复欢迎 发表评论: