百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

18分钟学会Python人脸检测(python人脸检测代码)

off999 2024-10-20 08:09 24 浏览 0 评论

本教程将向您介绍使用 OpenCV 库在 Python 中进行对象检测的概念以及如何利用它执行面部检测等任务。

什么是计算机视觉?

我们正处于人工智能革命的时代,深度学习领域取得了令人瞩目的进步。在过去的几个月里,我们见证了人工智能的应用,这些应用通过生成逼真的艺术作品、通过律师资格考试以及编写 Python 代码来创建网站,震惊了世界。

计算机视觉是一种深度学习应用,是这场革命的核心。它允许计算机从图像和视频文件等视觉输入中获得洞察力。计算机视觉的示例包括人脸检测、面部识别、人体姿势估计和障碍物检测。在本教程中,我们将探索如何使用 OpenCV 执行人脸检测,查看静态图像和实时图像。

计算机视觉的应用

既然人类视觉对于大多数人来说是一项相对简单的任务,为什么我们还需要计算机视觉呢?

虽然人类确实可以轻松执行视觉任务,并且只需要少量数据样本,但人工智能具有高度可扩展性。计算机视觉模型在部署到监控和自动驾驶汽车中时可以处理数百万个数据点。这是人类视觉根本无法达到的规模。

此外,计算机视觉应用可以集成到传感器、摄像头和智能设备中,实现全天候实时图像处理。这对于人类来说同样是一项极具挑战性的壮举。

最后,人工智能不易受偏见、疲劳和注意力不集中的影响。虽然人类可能会感到疲劳并忽视安全漏洞,但计算机视觉应用程序永远不会出现故障,从而降低了错过事件的风险。

让我们看看计算机视觉在我们日常生活中的一些实际应用:

监视

计算机视觉应用(例如物体识别和姿势估计)通常部署在安全设备中,以实现人员监控自动化。例如,姿势估计模型可以跟踪一个人的肢体语言,以判断他们是否在煽动暴力、遇到医疗紧急情况或即将偷窃某物。然后,这些系统可以触发通知,提醒相关部门提供帮助,从而缩短响应时间并提高公共安全。

零售

计算机视觉模型可以部署在零售店,以跟踪顾客的眼睛位置、肢体语言和商店内的移动。

这些算法可以为零售商提供以下有关用户行为的洞察:

  • 是否有任何特定的促销活动或产品可以吸引人们的注意力并吸引他们进入商店?
  • 顾客在商店里通常走哪条路径?
  • 哪种类型的产品植入最能引起人们的关注?
  • 顾客多久会接触一次横幅和标牌等促销材料?

零售商可以利用这些见解来改进商店的营销策略,并定制产品展示以推动销售。

自动驾驶汽车

自动驾驶领域从计算机视觉技术中受益匪浅。

物体检测模型部署在车辆上,以识别道路上的行人、其他车辆和动物。

计算机视觉应用程序可以解释停车标志和交通信号灯,准确估计车辆与其他物体之间的距离,并避开坑洼等障碍物,以确保安全的驾驶体验。

OpenCV 简介

现在我们了解了计算机视觉应用程序有多么有用,让我们研究一下用于实现它们的流行工具。OpenCV是一个计算机视觉库,支持 Python、C++ 和 Java 等编程语言。

该软件包最初由英特尔于 1999 年创建,后来开源并向公众发布。

OpenCV 允许开发人员和非数学家轻松构建计算机视觉应用程序,而无需从头开始编写代码。该库拥有超过 2,500 种算法,允许用户执行面部识别和物体检测等任务。

谷歌、微软、IBM 和英特尔等知名组织的开发人员和数据从业者广泛使用 OpenCV 库,该库目前可免费用于商业用途。

在本文中,我们将使用 OpenCV 在 Python 中执行人脸检测。

在本教程结束时,您将了解如何:

  • 使用 Python 中的 OpenCV 检测图像中的人脸
  • 在网络摄像头的实时流中执行实时人脸检测
  • 识别并标记图像中的名人面孔

什么是人脸检测?

人脸检测涉及识别图像或视频中的人脸。这是通过分析视觉输入来确定是否存在人的面部特征来完成的。

由于人类面孔种类繁多,人脸检测模型通常需要对大量输入数据进行训练才能准确无误。训练数据集必须包含来自不同背景、性别和文化的人的足够代表性。

这些算法还需要输入许多包含不同光照、角度和方向的训练样本,才能在现实场景中做出正确的预测。

这些细微差别使得人脸检测成为一项重要且耗时的任务,需要数小时的模型训练和数百万个数据样本。

值得庆幸的是,OpenCV 软件包附带了用于人脸检测的预训练模型,这意味着我们不必从头开始训练算法。更具体地说,该库采用一种称为 Haar 级联的机器学习方法来识别视觉数据中的对象。

OpenCV 人脸检测教程

在本节中,我们将学习使用 OpenCV 和 Python 应用一种名为 Haar Cascade 的流行人脸检测方法进行人脸检测。


Haar 级联分类器简介

该方法最早在Paul Viola 和 Michael Jones 撰写的论文《使用增强级联简单特征进行快速对象检测》中提出。

该技术背后的理念是使用级联分类器来检测图像中的不同特征。然后将这些分类器组合成一个强分类器,可以准确区分包含人脸的样本和不包含人脸的样本。

OpenCV 内置的 Haar Cascade 分类器已在大量人脸数据集上进行过训练,因此无需进一步训练。我们只需从库中加载分类器并使用它对输入图像执行人脸检测即可。

安装 Python 版 OpenCV

要安装 OpenCV 库,只需打开命令提示符或终端窗口并运行以下命令:

pip install opencv-python

仅当您的设备上已安装 pip 时,此命令才有效。


OpenCV 用于图像中人脸检测

我们将构建一个检测器来识别 Unsplash照片中的人脸。input_image在开始编码之前,请确保将图片保存到您的工作目录并将其重命名为。

步骤 1:导入 OpenCV 包

现在,让我们导入OpenCV并使用以下代码行输入输入图像路径:

import cv2


imagePath = 'input_image.jpg'


第 2 步:读取图像

然后,我们需要用OpenCV的imread()函数读取图像:

img = cv2.imread(imagePath)



步骤 3:将图像转换为灰度

为了提高计算效率,我们首先需要将此图像转换为灰度,然后再对其进行人脸检测:

gray_image = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)


步骤 4:加载分类器

让我们加载OpenCV内置的预训练的Haar Cascade分类器:

face_classifier = cv2.CascadeClassifier(
    cv2.data.haarcascades + "haarcascade_frontalface_default.xml"
)


请注意,我们正在使用一个名为的文件haarcascade_frontalface_default.xml。此分类器专门用于检测视觉输入中的正面。


OpenCV 还提供了其他预训练模型来检测图像中的不同物体 - 例如人的眼睛、微笑、上半身,甚至是车辆的牌照。您可以通过检查库的GitHub 存储库来了解有关 OpenCV 内置的不同分类器的更多信息。

步骤 5:执行人脸检测

我们现在可以使用刚刚加载的分类器对灰度图像执行人脸检测:

face = face_classifier.detectMultiScale(
    gray_image, scaleFactor=1.1, minNeighbors=5, minSize=(40, 40)
)


让我们分解一下上述代码中指定的方法和参数:

  1. detectMultiScale():

detectMultiScale() 方法用于识别输入图像中不同大小的人脸。

  1. grey_image


这个方法中第一个参数叫做grey_image,就是我们之前创建的灰度图像。

  1. scaleFactor

此参数用于缩小输入图像的尺寸,以便算法更容易检测较大的人脸。在本例中,我们指定了比例因子 1.1,表示我们希望将图像尺寸缩小 10%。

  1. minNeighbors

级联分类器在图像中应用滑动窗口来检测其中的人脸。您可以将这些窗口视为矩形。

最初,分类器会捕获大量误报。这些误报可通过参数消除minNeighbors,该参数指定了需要识别的相邻矩形的数量,才能将对象视为有效检测。

总而言之,将 0 或 1 这样的小值传递给此参数会导致大量的误报,而大量的误报可能会导致失去许多真正报。

这里的诀窍是找到一种权衡,让我们能够消除假阳性,同时还能准确识别真阳性。

  1. minSize

最后,该minSize参数设置要检测的物体的最小尺寸。模型将忽略小于指定最小尺寸的人脸。

步骤6:绘制边界框

现在模型已经检测到图像中的人脸,让我们运行以下代码行来围绕这些人脸创建一个边界框:

for (x, y, w, h) in face:
    cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 4)


face变量是一个包含四个值的数组:检测到人脸的 x 轴和 y 轴,以及它们的宽度和高度。上述代码对已识别的人脸进行迭代,并创建一个跨越这些测量值的边界框。


该参数0,255,0表示边界框的颜色,为绿色,并4表示其厚度。

步骤7:显示图像

为了显示检测到的人脸图像,我们首先需要将图像从 BGR 格式转换为 RGB:

img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)


现在,让我们使用 Matplotlib 库来显示图像:

import matplotlib.pyplot as plt


plt.figure(figsize=(20,10))
plt.imshow(img_rgb)
plt.axis('off')


上述代码应生成以下输出:

伟大的!

该模型已成功检测出该图像中的人脸并在其周围创建了一个边界框。

使用 OpenCV 进行实时人脸检测

现在我们已经成功地使用 OpenCV 在静态图像上执行了人脸检测,让我们看看如何在实时视频流上执行相同的操作。

步骤 1:先决条件

首先,让我们继续导入 OpenCV 库并加载 Haar Cascade 模型,就像我们在上一节中所做的那样。如果您之前已经运行过此代码块,则可以跳过它:

import cv2


face_classifier = cv2.CascadeClassifier(
    cv2.data.haarcascades + "haarcascade_frontalface_default.xml"
)


第 2 步:访问网络摄像头

现在,我们需要访问设备的摄像头来读取实时视频数据流。可以使用以下代码完成此操作:

video_capture = cv2.VideoCapture(0)


请注意,我们已将参数传递0给 VideoCapture() 函数。这告诉 OpenCV 使用我们设备上的默认摄像头。如果您的设备连接了多个摄像头,则可以相应地更改此参数值。


步骤 3:识别视频流中的人脸

现在,让我们创建一个函数来检测视频流中的人脸并在它们周围绘制一个边界框:

def detect_bounding_box(vid):
    gray_image = cv2.cvtColor(vid, cv2.COLOR_BGR2GRAY)
    faces = face_classifier.detectMultiScale(gray_image, 1.1, 5, minSize=(40, 40))
    for (x, y, w, h) in faces:
        cv2.rectangle(vid, (x, y), (x + w, y + h), (0, 255, 0), 4)
    return faces


detect_bounding_box函数以视频帧作为输入。


在这个函数中,我们使用与之前相同的代码,在执行人脸检测之前将帧转换为灰度。

然后,我们还使用与之前相同的scaleFactorminNeighbors和的参数值来检测该图像中的人脸。minSize

4最后,我们在框架周围绘制一个厚度合适的绿色边界框。

步骤 4:创建实时人脸检测循环

现在,我们需要创建一个无限的 while 循环,它将从我们的网络摄像头捕获视频帧并将人脸检测功能应用于它:

while True:


    result, video_frame = video_capture.read()  # read frames from the video
    if result is False:
        break  # terminate the loop if the frame is not read successfully


    faces = detect_bounding_box(
        video_frame
    )  # apply the function we created to the video frame


    cv2.imshow(
        "My Face Detection Project", video_frame
    )  # display the processed frame in a window named "My Face Detection Project"


    if cv2.waitKey(1) & 0xFF == ord("q"):
        break


video_capture.release()
cv2.destroyAllWindows()


运行上述代码后,您应该会看到My Face Detection Project屏幕上出现一个名为的窗口:

无论您在框架内移动到哪里,算法都会跟踪您的脸部并在其周围创建一个绿色边界框。

在上面的框架中,模型识别了我的脸和我手中的驾照上的照片。

您还可以通过举起多张照片或让不同的人站在相机后面的不同角度来测试此模型的有效性。该模型应该能够在不同的背景或照明设置下识别所有人的脸。

如果您想退出程序,可以按键盘上的“q”键退出循环。

使用 OpenCV 进行人脸检测 - 下一步

现在您已经学会了如何使用 OpenCV 库成功检测图像和实时视频中的人脸,下面是您可以采取的一些步骤,将您的知识提升到一个新的水平:

创建自己的项目

您可以使用本教程中提供的代码作为您自己的人脸检测项目的起点。

扩展该项目的一种方法是识别不同类型的输入数据(例如 PDF 文件或监控图像)中的人脸。您甚至可以设置自己的安全摄像头,并实时对其捕获的数据进行人脸检测。

此外,您还可以在大型数据集上创建人脸检测模型,或者更进一步执行诸如在图像数据集中检测一个人是否戴着口罩之类的任务。

Kaggle 上的图像中的人脸检测和人脸口罩检测数据集是该领域投资组合项目的良好起点。

建立面部识别模型

虽然人脸检测可用于在视觉输入中检测人脸,但人脸识别更进一步。该技术用于通过将人脸与现有数据库进行匹配来验证一个人的身份。

您可以尝试建立一个面部识别模型,在人群中识别特定的面部(甚至可能是您的面部)。

这项任务比人脸检测稍微具有挑战性,因为模型必须在许多数据样本上进行训练,然后才能区分人。

在建立人脸识别模型之前,您可能还需要执行预处理技术,例如降噪和图像变换。

如果这些概念对您来说很陌生,请不要担心!您可以通过参加我们的Python 图像处理课程了解有关图像处理的所有知识。

获得领域专业知识

图像和视频处理广泛应用于安全、零售、医疗保健和制造业等各个领域。

如果你想成为一名计算机视觉专家,你首先需要了解这些行业使用的数据类型。领域专业知识将使你更容易在现实场景中标记、转换和训练数据集。

首先,您可以参加我们的Python 生物医学图像分析课程。该课程将教您如何处理 CT 扫描图像、分割心脏 MRI 时间序列以及确定阿尔茨海默病是否会改变大脑结构。

这些概念将使您具备进入生物医学成像领域所需的技能。

相关推荐

面试官:来,讲一下枚举类型在开发时中实际应用场景!

一.基本介绍枚举是JDK1.5新增的数据类型,使用枚举我们可以很好的描述一些特定的业务场景,比如一年中的春、夏、秋、冬,还有每周的周一到周天,还有各种颜色,以及可以用它来描述一些状态信息,比如错...

一日一技:11个基本Python技巧和窍门

1.两个数字的交换.x,y=10,20print(x,y)x,y=y,xprint(x,y)输出:102020102.Python字符串取反a="Ge...

Python Enum 技巧,让代码更简洁、更安全、更易维护

如果你是一名Python开发人员,你很可能使用过enum.Enum来创建可读性和可维护性代码。今天发现一个强大的技巧,可以让Enum的境界更进一层,这个技巧不仅能提高可读性,还能以最小的代价增...

Python元组编程指导教程(python元组的概念)

1.元组基础概念1.1什么是元组元组(Tuple)是Python中一种不可变的序列类型,用于存储多个有序的元素。元组与列表(list)类似,但元组一旦创建就不能修改(不可变),这使得元组在某些场景...

你可能不知道的实用 Python 功能(python有哪些用)

1.超越文件处理的内容管理器大多数开发人员都熟悉使用with语句进行文件操作:withopen('file.txt','r')asfile:co...

Python 2至3.13新特性总结(python 3.10新特性)

以下是Python2到Python3.13的主要新特性总结,按版本分类整理:Python2到Python3的重大变化Python3是一个不向后兼容的版本,主要改进包括:pri...

Python中for循环访问索引值的方法

技术背景在Python编程中,我们经常需要在循环中访问元素的索引值。例如,在处理列表、元组等可迭代对象时,除了要获取元素本身,还需要知道元素的位置。Python提供了多种方式来实现这一需求,下面将详细...

Python enumerate核心应用解析:索引遍历的高效实践方案

喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。根据GitHub代码分析统计,使用enumerate替代range(len())写法可减少38%的索引错误概率。本文通过12个生产...

Python入门到脱坑经典案例—列表去重

列表去重是Python编程中常见的操作,下面我将介绍多种实现列表去重的方法,从基础到进阶,帮助初学者全面掌握这一技能。方法一:使用集合(set)去重(最简单)pythondefremove_dupl...

Python枚举类工程实践:常量管理的标准化解决方案

本文通过7个生产案例,系统解析枚举类在工程实践中的应用,覆盖状态管理、配置选项、错误代码等场景,适用于Web服务开发、自动化测试及系统集成领域。一、基础概念与语法演进1.1传统常量与枚举类对比#传...

让Python枚举更强大!教你玩转Enum扩展

为什么你需要关注Enum?在日常开发中,你是否经常遇到这样的代码?ifstatus==1:print("开始处理")elifstatus==2:pri...

Python枚举(Enum)技巧,你值得了解

枚举(Enum)提供了更清晰、结构化的方式来定义常量。通过为枚举添加行为、自动分配值和存储额外数据,可以提升代码的可读性、可维护性,并与数据库结合使用时,使用字符串代替数字能简化调试和查询。Pytho...

78行Python代码帮你复现微信撤回消息!

来源:悟空智能科技本文约700字,建议阅读5分钟。本文基于python的微信开源库itchat,教你如何收集私聊撤回的信息。[导读]Python曾经对我说:"时日不多,赶紧用Python"。于是看...

登录人人都是产品经理即可获得以下权益

文章介绍如何利用Cursor自动开发Playwright网页自动化脚本,实现从选题、写文、生图的全流程自动化,并将其打包成API供工作流调用,提高工作效率。虽然我前面文章介绍了很多AI工作流,但它们...

Python常用小知识-第二弹(python常用方法总结)

一、Python中使用JsonPath提取字典中的值JsonPath是解析Json字符串用的,如果有一个多层嵌套的复杂字典,想要根据key和下标来批量提取value,这是比较困难的,使用jsonpat...

取消回复欢迎 发表评论: