百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

基于Python深度学习实现人脸识别(基于Python的人脸识别)

off999 2024-10-20 08:09 32 浏览 0 评论

人脸识别简介

人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。

人脸与人体的其它生物特征(指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提,与其它类型的生物识别比较人脸识别具有如下特点:

  • 非强制性:用户不需要专门配合人脸采集设备,几乎可以在无意识的状态下就可获取人脸图像,这样的取样方式没有“强制性”;
  • 非接触性:用户不需要和设备直接接触就能获取人脸图像;
  • 并发性:在实际应用场景下可以进行多个人脸的分拣、判断及识别;

除此之外,还符合视觉特性:“以貌识人”的特性,以及操作简单、结果直观、隐蔽性好等特点。

在机器学习领域中,我们可以使用深度神经网络来实现人脸识别技术,也可以作为机器学习领域中的一个研究方向。机器学习实现人脸识别主要完成三个功能:

  • 人脸对齐:可以使用OpenCV CascadeClassifier,MTCNN, dlib等技术提取人脸图片;
  • 使用深度神经网络提取人脸图片的特征点;
  • 通过分类算法对提取的人脸特征进行识别和分类,典型的算法有SVM,以及LabelEncoder算法;

FaceNet简介

FaceNet是谷歌于CVPR2015.02发表,提出了一个对识别(这是谁?)、验证(这是一个人吗?)、聚类(在这些面孔中找到同一个人)等问题的统一解决框架,即它们都可以放到特征空间里统一处理,只需要专注于解决的仅仅是如何将人脸更好的映射到特征空间。其本质是:

通过卷积神经网络学习人脸图像到128维欧几里得空间的映射,该映射将人脸图像映射为128维的特征向量,联想到二维空间的相关系数的定义,使用特征向量之间的距离的倒数来表征人脸图像之间的"相关系数"(为了方便理解,后文称之为相似度),对于相同个体的不同图片,其特征向量之间的距离较小(即相似度较大),对于不同个体的图像,其特征向量之间的距离较大(即相似度较小)。

总体流程:

  1. 将图像通过深度卷积神经网络映射到128维的特征空间(欧几里得空间)中,得到对应的128维特征向量;
  2. 对特征向量进行L2正则化,筛选出有效特征;
  3. 使用正则化后的特征向量,计算Triplets Loss;

人脸识别模型FaceNet

使用基于 NN4 改造的 CNN 模型训练和提取特征nn4.small2.v1 是 FaceNet 论文中描述的 NN4 模型的变体,在 OpenFace 的模型列表中有 nn4.small2 详细介绍。

模型列表

Model

Number of Parameters

nn4.small2

3733968

nn4.small1

5579520

nn4

6959088

nn2

7472144

加载数据集

训练数据集组织形式:

>tree images
├─Deng_chao
├─Di_lireba
├─Fan_Bingbing
├─Liu_Haoran
├─Peng_Yuyan
├─Sun_li
├─Wu_Yifan
├─Yang_mi
├─Yi_Yangqianxi
└─Zhao_Liying
  • 每人一个文件目录,目录以人名命名,如”Fan_Bingbing“
  • 每个人的文件目录下包含10张图像(最好是1:1比例),图像文件以"人名_序号"命名,仅支持.jpg和.jpeg 两种格式。如”Fan_Bingbing_0001.jpg“。

安装人脸检测工具

pip install cmake dlib

自定义一个类用于处理图片元数据类

import numpy as np

import cv2
import os.path
import dlib

class IdentityMetadata():
    def __init__(self, base, name, file):
        self.base = base # 数据集根目录
        self.name = name # 目录名
        self.file = file # 图像文件名

    def __repr__(self):
        return self.image_path()

    def image_path(self):
        return os.path.join(self.base, self.name, self.file) 

扫描根目录下的所有图片路径,该方法循环扫描根目录下的jpg和jpeg格式的图片

def load_metadata(path):
    metadata = []
    for i in os.listdir(path):
        for f in os.listdir(os.path.join(path, i)):
            # 检查文件名后缀,仅支持 jpg 和 jpeg 两种文件格式
            ext = os.path.splitext(f)[1]
            if ext == '.jpg' or ext == '.jpeg':
                metadata.append(IdentityMetadata(path, i, f))
    return np.array(metadata)

使用dlib读取彩色图片,该方法也可以使用OpenCV读取图片

def load_image(path):
    return dlib.load_rgb_image(path)
metadata = load_metadata('images')
array([images\Deng_chao\Deng_chao_0001.jpg,
       images\Deng_chao\Deng_chao_0002.jpg,
       images\Deng_chao\Deng_chao_0003.jpg,
       images\Deng_chao\Deng_chao_0004.jpg,
       images\Deng_chao\Deng_chao_0005.jpg,
       images\Deng_chao\Deng_chao_0006.jpg,
       ...................................
       images\Zhao_Liying\Zhao_liying_0009.jpg,
       images\Zhao_Liying\Zhao_liying_0010.jpg], dtype=object)

人脸检测,对齐和提取

从原图提取 96x96 RGB人脸图像。如果原图不是 1:1 比例,提取后的人脸会进行拉伸变换。

import matplotlib.pyplot as plt
import matplotlib.patches as patches

from align import AlignDlib

# 初始化 OpenFace 人脸对齐工具,使用 Dlib 提供的 68 个关键点
alignment = AlignDlib('face_detection/shape_predictor_5_face_landmarks.dat')

检测人脸并返回人脸的边框坐标

# 加载一张训练图像
img = load_image(metadata[0].image_path())

# 检测人脸并返回边框
bb = alignment.getLargestFaceBoundingBox(img)
rectangle(111,142,379,409)
# 使用指定的人脸关键点转换图像并截取 96x96 的人脸图像
aligned_img = alignment.align_v1(160, img)
array([[[162, 111,  54],
        [167, 116,  59],
        [177, 126,  69],
        ...,
        [ 22,  11,  10],
        [ 21,  10,   9],
        [ 15,   6,   5]],
        ...,
        ...,
        [ 85,  75,  73],
        [ 33,  23,  21],
        [ 31,  21,  21]]], dtype=uint8)
# 绘制原图
plt.subplot(131)
plt.imshow(img)
plt.xticks([])
plt.yticks([])

# 绘制带人脸边框的原图
plt.subplot(132)
plt.imshow(img)
plt.gca().add_patch(patches.Rectangle((bb.left(), bb.top()), bb.width(), bb.height(), fill=False, color='red'))
plt.xticks([])
plt.yticks([])

# 绘制对齐后截取的 96x96 人脸图像
plt.subplot(133)
plt.imshow(aligned_img)
plt.xticks([])
plt.yticks([])

不积跬步,无以至千里;

不积小流,无以成江海;

相关推荐

面试官:来,讲一下枚举类型在开发时中实际应用场景!

一.基本介绍枚举是JDK1.5新增的数据类型,使用枚举我们可以很好的描述一些特定的业务场景,比如一年中的春、夏、秋、冬,还有每周的周一到周天,还有各种颜色,以及可以用它来描述一些状态信息,比如错...

一日一技:11个基本Python技巧和窍门

1.两个数字的交换.x,y=10,20print(x,y)x,y=y,xprint(x,y)输出:102020102.Python字符串取反a="Ge...

Python Enum 技巧,让代码更简洁、更安全、更易维护

如果你是一名Python开发人员,你很可能使用过enum.Enum来创建可读性和可维护性代码。今天发现一个强大的技巧,可以让Enum的境界更进一层,这个技巧不仅能提高可读性,还能以最小的代价增...

Python元组编程指导教程(python元组的概念)

1.元组基础概念1.1什么是元组元组(Tuple)是Python中一种不可变的序列类型,用于存储多个有序的元素。元组与列表(list)类似,但元组一旦创建就不能修改(不可变),这使得元组在某些场景...

你可能不知道的实用 Python 功能(python有哪些用)

1.超越文件处理的内容管理器大多数开发人员都熟悉使用with语句进行文件操作:withopen('file.txt','r')asfile:co...

Python 2至3.13新特性总结(python 3.10新特性)

以下是Python2到Python3.13的主要新特性总结,按版本分类整理:Python2到Python3的重大变化Python3是一个不向后兼容的版本,主要改进包括:pri...

Python中for循环访问索引值的方法

技术背景在Python编程中,我们经常需要在循环中访问元素的索引值。例如,在处理列表、元组等可迭代对象时,除了要获取元素本身,还需要知道元素的位置。Python提供了多种方式来实现这一需求,下面将详细...

Python enumerate核心应用解析:索引遍历的高效实践方案

喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。根据GitHub代码分析统计,使用enumerate替代range(len())写法可减少38%的索引错误概率。本文通过12个生产...

Python入门到脱坑经典案例—列表去重

列表去重是Python编程中常见的操作,下面我将介绍多种实现列表去重的方法,从基础到进阶,帮助初学者全面掌握这一技能。方法一:使用集合(set)去重(最简单)pythondefremove_dupl...

Python枚举类工程实践:常量管理的标准化解决方案

本文通过7个生产案例,系统解析枚举类在工程实践中的应用,覆盖状态管理、配置选项、错误代码等场景,适用于Web服务开发、自动化测试及系统集成领域。一、基础概念与语法演进1.1传统常量与枚举类对比#传...

让Python枚举更强大!教你玩转Enum扩展

为什么你需要关注Enum?在日常开发中,你是否经常遇到这样的代码?ifstatus==1:print("开始处理")elifstatus==2:pri...

Python枚举(Enum)技巧,你值得了解

枚举(Enum)提供了更清晰、结构化的方式来定义常量。通过为枚举添加行为、自动分配值和存储额外数据,可以提升代码的可读性、可维护性,并与数据库结合使用时,使用字符串代替数字能简化调试和查询。Pytho...

78行Python代码帮你复现微信撤回消息!

来源:悟空智能科技本文约700字,建议阅读5分钟。本文基于python的微信开源库itchat,教你如何收集私聊撤回的信息。[导读]Python曾经对我说:"时日不多,赶紧用Python"。于是看...

登录人人都是产品经理即可获得以下权益

文章介绍如何利用Cursor自动开发Playwright网页自动化脚本,实现从选题、写文、生图的全流程自动化,并将其打包成API供工作流调用,提高工作效率。虽然我前面文章介绍了很多AI工作流,但它们...

Python常用小知识-第二弹(python常用方法总结)

一、Python中使用JsonPath提取字典中的值JsonPath是解析Json字符串用的,如果有一个多层嵌套的复杂字典,想要根据key和下标来批量提取value,这是比较困难的,使用jsonpat...

取消回复欢迎 发表评论: