4、树莓派人脸识别-人脸检测与识别实践部分_基于qt+树莓派实现人脸识别-程序员宅基地

技术标签: 学习  python  

如果你需要做树莓派的课程设计(或者说计算机系统综合课程设计),那这几篇博客一定适合你。一开始做课设的时候对硬件、组装、烧录等等词语都很陌生,老师也不会进行过多的辅导,很多同学迷迷糊糊的不知道自己该干嘛,下面是对我课程设计的一个总结,希望对大家有所帮助。
1、树莓派树莓派人脸识别-硬件组装+系统烧录
2、树莓派人脸识别-树莓派人脸识别-环境搭建、相机测试
3、树莓派人脸识别-原理及问题小结
4、树莓派人脸识别-人脸检测与识别实践部分
5、树莓派人脸识别-课程设计报告

传统的人脸识别算法一般需要较高的计算资源,在树莓派上实现会很卡,下面是极简版的人脸识别。

代码文件夹链接如下链接: https://pan.baidu.com/s/1sWnvG7ChoFbkMUAs6nSCsQ?pwd=rdmt

参考文章:https://www.instructables.com/Real-time-Face-Recognition-an-End-to-end-Project/

运行代码:

  1. 拷贝文件目录到树莓派,打开命令行,进入文件目录
  2. ptyhon 01_face_dataset.py (这里输入python 01 之后按tab会自动补齐文件名)
  3. 输入id (任意数字,1-10最佳)
  4. 等待摄像头拍照,照片会存进dataset文件夹,名字跟id和顺序有关
  5. python 02_face_training.py (这里输入python 02 之后按tab会自动补齐文件名)
  6. 训练好的文件会放在trainer文件夹内
  7. python 03_face_recognition.py (这里输入python 03 之后按tab会自动补齐文件名)
  8. 这里会打开摄像头,面部贴近摄像头会显示识别信息,id对应03_face_recognition.py代码中的names数组名字,中文会乱码所以直接用英文缩写就好(比如 张三改成San Zhang )

1、01_face_dataset(捕捉人脸存储到文件用于训练,保存到dataset文件夹)

  1. 下面这段代码使用 OpenCV 捕获摄像头中的视频帧,并利用 haarcascade_frontalface_default.xml 文件来进行人脸检测。
  2. 每输入一个数字人脸ID,并在数据集文件夹中创建一个名为 “User.[face_id].[count].jpg” 的新文件来保存每个采集到的人脸样本。
  3. 程序将等待直到采集到30个人脸样本或按下 ESC 键,然后清理资源并退出程序。
# 从多个用户中捕获多个人脸并将其存储在数据库(数据集目录)中
# ==> 人脸将存储在目录:dataset/(如果不存在,请创建它)
# ==> 每个人脸将有一个唯一的数字ID,如1、2、3等

# 代码原作者:Anirban Kar (https://github.com/thecodacus/Face-Recognition)

import cv2
import os

# 获取默认摄像头
cam = cv2.VideoCapture(0)
# 设置视频宽度
cam.set(3, 640)
# 设置视频高度
cam.set(4, 480)

# 加载人脸检测器
face_detector = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

# 对于每个人,请输入一个数字人脸ID
face_id = input('\n 请输入用户ID,然后按 <回车> 键 ==>  ')

print("\n [INFO] 初始化人脸采集,请直视摄像头并等待...")
# 初始化每个用户的人脸样本计数器
count = 0

while(True):
    # 读取视频帧
    ret, img = cam.read()
    # 垂直翻转视频图像
    img = cv2.flip(img, -1)
    img = cv2.flip(img, 0)
    # 转换为灰度图像
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # 检测人脸
    faces = face_detector.detectMultiScale(gray, 1.3, 5)

    for (x,y,w,h) in faces:
        # 在图像上绘制矩形,标记出人脸位置
        cv2.rectangle(img, (x,y), (x+w,y+h), (255,0,0), 2)
        # 增加采集到的人脸计数器
        count += 1

        # 将采集到的人脸样本保存到数据集文件夹中
        # 文件名格式为 "User.[face_id].[count].jpg"
        cv2.imwrite("dataset/User." + str(face_id) + '.' + str(count) + ".jpg", gray[y:y+h,x:x+w])

        # 显示人脸采集过程
        cv2.imshow('image', img)

    # 等待100毫秒并检测键盘输入,如果按下 ESC 键则退出程序
    k = cv2.waitKey(100) & 0xff
    if k == 27:
        break
    
    # 如果采集到的人脸样本数达到30个,则停止采集
    elif count >= 30:
        break

# 清理资源
print("\n [INFO] 程序已退出并清理资源")
cam.release()
cv2.destroyAllWindows()

2、02_face_training(训练人脸数据,保存到trainer文件夹)

  1. 下面这段代码通过调用 OpenCV 的人脸识别器和人脸检测器,对存储在数据库中的多个人脸图像进行训练。
  2. 函数 getImagesAndLabels() 用于获取数据库中的人脸图像和对应的标签数据。
  3. 然后,使用 LBPH 识别器对这些人脸图像进行训练,并将训练好的模型保存到 trainer/trainer.yml 文件中。
  4. 最后,程序输出训练过的人脸数量,并退出程序。
import cv2
import numpy as np
from PIL import Image
import os

# 存储人脸图像的路径
path = 'dataset'

# 创建 LBPH 人脸识别器和人脸检测器
recognizer = cv2.face.LBPHFaceRecognizer_create()
detector = cv2.CascadeClassifier("haarcascade_frontalface_default.xml");

# 获取人脸图像和标签数据的函数
def getImagesAndLabels(path):

    imagePaths = [os.path.join(path,f) for f in os.listdir(path)]     
    faceSamples=[]
    ids = []

    for imagePath in imagePaths:

        # 将图像转换为灰度图像,并将其转换为 NumPy 数组
        PIL_img = Image.open(imagePath).convert('L') # 将图像转换为灰度图像
        img_numpy = np.array(PIL_img,'uint8')

        # 解析图像文件名以获取人脸ID
        id = int(os.path.split(imagePath)[-1].split(".")[1])
        # 使用人脸检测器检测人脸
        faces = detector.detectMultiScale(img_numpy)

        # 将人脸图像和ID添加到列表中
        for (x,y,w,h) in faces:
            faceSamples.append(img_numpy[y:y+h,x:x+w])
            ids.append(id)

    return faceSamples,ids

print ("\n [INFO] 训练人脸数据,这会花费一些时间,请等待...")
# 获取人脸图像和标签数据
faces,ids = getImagesAndLabels(path)
# 使用 LBPH 识别器进行训练
recognizer.train(faces, np.array(ids))

# 将训练好的模型保存到 trainer/trainer.yml 文件中
recognizer.write('trainer/trainer.yml')

# 打印训练过的人脸数量并退出程序
print("\n [INFO] {0} 个人脸已训练完毕,程序即将退出。".format(len(np.unique(ids))))

3、03_face_recognition

  1. 下面这段代码使用 cv2.VideoCapture 实时获取摄像头捕获的视频图像,然后使用人脸检测器检测图像中的人脸。
  2. 对于检测到的每个人脸,使用训练好的 LBPH 人脸识别器进行识别。
  3. 如果置信度(confidence)小于100,则认为识别成功,并根据 ID 获取对应的名字。否则,将 ID 设置为 “unknown”。
  4. 最后,在图像上显示出识别结果。
  5. 程序会持续地从摄像头中获取图像,并进行实时的人脸识别,直到用户按下 ESC 键退出程序。
import cv2
import numpy as np
import os 

# 加载训练好的 LBPH 人脸识别器
recognizer = cv2.face.LBPHFaceRecognizer_create()
recognizer.read('trainer/trainer.yml')

# 加载人脸检测器
cascadePath = "haarcascade_frontalface_default.xml"
faceCascade = cv2.CascadeClassifier(cascadePath);

# 定义字体
font = cv2.FONT_HERSHEY_SIMPLEX

# 初始化 ID 计数器
id = 0

# ID 对应的名字,例如:Marcelo 的 ID 为 1,对应的 names 列表中的第一个元素,以此类推。
names = ['None', 'Marcelo', 'Paula', 'Ilza', 'Z', 'W'] 

# 初始化并启动实时视频采集
cam = cv2.VideoCapture(0)
cam.set(3, 640) # 设置视频宽度
cam.set(4, 480) # 设置视频高度

# 定义最小窗口大小以被识别为人脸
minW = 0.1*cam.get(3)
minH = 0.1*cam.get(4)

while True:

    ret, img =cam.read()
     # 垂直翻转视频图像
    img = cv2.flip(img, -1)
    img = cv2.flip(img, -1)

    gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

    # 使用人脸检测器检测人脸
    faces = faceCascade.detectMultiScale( 
        gray,
        scaleFactor = 1.2,
        minNeighbors = 5,
        minSize = (int(minW), int(minH)),
       )

    for(x,y,w,h) in faces:

        # 在图像上绘制矩形,标记出人脸位置
        cv2.rectangle(img, (x,y), (x+w,y+h), (0,255,0), 2)

        # 对每个人脸进行识别
        id, confidence = recognizer.predict(gray[y:y+h,x:x+w])

        # 如果置信度小于100,则认为识别成功
        if (confidence < 100):
            id = names[id] # 获取 ID 对应的名字
            confidence = "  {0}%".format(round(100 - confidence))
        else:
            id = "unknown"
            confidence = "  {0}%".format(round(100 - confidence))
        
        # 在图像上显示出识别结果
        cv2.putText(img, str(id), (x+5,y-5), font, 1, (255,255,255), 2)
        cv2.putText(img, str(confidence), (x+5,y+h-5), font, 1, (255,255,0), 1)  
    
    cv2.imshow('camera',img) 

    # 按下 ESC 键退出程序
    k = cv2.waitKey(10) & 0xff 
    if k == 27:
        break

# 清理资源
print("\n [INFO] 退出程序并清理资源")
cam.release()
cv2.destroyAllWindows()

到这里已经完成了树莓派人脸识别的课程设计,但是并不能得到很好地GPA。

故很容易想到用pyqt做一个简单界面,链接数据库做数据的存储(mysql并不能正确配置armhf,所以用平替MariaDB尝试了一下,体验很差),经过笔者的尝试效果并不理想,如果你是使用8核的主板可以尝试一下,4核真的很卡,所以我不建议在这里花时间去做。

所以这里建议直接在自己的笔记本电脑上做其他的人脸识别实验

  1. (CSDN上可以搜到,有人做了很系统的总结)Python3.0+OpenCV4+PyQt5+Mysql8+dlib+conda环境的人脸识别,其中环境使用Anaconda配置的虚拟环境,活体检测使用的dlib眨眼检测(一般我们使用的都是普通的2D相机,不同于景深信息相机和3D结构光相机,不能很好的进行活体检测),界面设计用QT Designer,人脸识别主要使用OpenCV库的一些函数,效果比较好的是ResNet-SSD残差网络,使用affine transformations进行仿射变换,使用2015Google的FaceNet做人脸识别,使用SVM只支持向量机更好的处理向量数据,使用PyMysql操作数据库。
  2. (Kaggle上直接找Olivetti数据集,里面有人做的案例可以参考)使用现有的数据集比如Olivetti数据集(40人x10张人脸灰度图-不同时间、表情、细节),做PCA主要成分分析,在数量足够多的情况下进行局部特征分析、全局分析和混合分析找到三种模型中accury交叉验证准确率得分最高的模型,进行参数优化得到最优的模型用于人脸识别实验的结果。

上面两个实验提供了两个很好地思路,一种是实体的检测,一种是照片的检测,这里想到之前机器视觉有人答辩的时候老师问他准确率怎么有90+,正常70就很好了,他直接懵(因为他用的是手机照片放在摄像头做的测试,环境影响不大所以检测差不不大,实际使用实体人脸的话准确率也在60左右。)


到这里满绩完全没有问题,如果你想让老师眼前一亮到时候科研项目、保研考研一类看好你,可以往下看,

你可以在自己的论文内加入一些比较权威的内容,比如在bilibili上搜CVPR论文,之后关注加v拿资料,可以在论文内找找看有没有感兴趣的加到自己的课程设计内,比如人脸识别&检测、人脸生成&合成&重建&编辑、人脸反欺骗这这些方面入手。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_53377464/article/details/133885291

智能推荐

攻防世界_难度8_happy_puzzle_攻防世界困难模式攻略图文-程序员宅基地

文章浏览阅读645次。这个肯定是末尾的IDAT了,因为IDAT必须要满了才会开始一下个IDAT,这个明显就是末尾的IDAT了。,对应下面的create_head()代码。,对应下面的create_tail()代码。不要考虑爆破,我已经试了一下,太多情况了。题目来源:UNCTF。_攻防世界困难模式攻略图文

达梦数据库的导出(备份)、导入_达梦数据库导入导出-程序员宅基地

文章浏览阅读2.9k次,点赞3次,收藏10次。偶尔会用到,记录、分享。1. 数据库导出1.1 切换到dmdba用户su - dmdba1.2 进入达梦数据库安装路径的bin目录,执行导库操作  导出语句:./dexp cwy_init/[email protected]:5236 file=cwy_init.dmp log=cwy_init_exp.log 注释:   cwy_init/init_123..._达梦数据库导入导出

js引入kindeditor富文本编辑器的使用_kindeditor.js-程序员宅基地

文章浏览阅读1.9k次。1. 在官网上下载KindEditor文件,可以删掉不需要要到的jsp,asp,asp.net和php文件夹。接着把文件夹放到项目文件目录下。2. 修改html文件,在页面引入js文件:<script type="text/javascript" src="./kindeditor/kindeditor-all.js"></script><script type="text/javascript" src="./kindeditor/lang/zh-CN.js"_kindeditor.js

STM32学习过程记录11——基于STM32G431CBU6硬件SPI+DMA的高效WS2812B控制方法-程序员宅基地

文章浏览阅读2.3k次,点赞6次,收藏14次。SPI的详情简介不必赘述。假设我们通过SPI发送0xAA,我们的数据线就会变为10101010,通过修改不同的内容,即可修改SPI中0和1的持续时间。比如0xF0即为前半周期为高电平,后半周期为低电平的状态。在SPI的通信模式中,CPHA配置会影响该实验,下图展示了不同采样位置的SPI时序图[1]。CPOL = 0,CPHA = 1:CLK空闲状态 = 低电平,数据在下降沿采样,并在上升沿移出CPOL = 0,CPHA = 0:CLK空闲状态 = 低电平,数据在上升沿采样,并在下降沿移出。_stm32g431cbu6

计算机网络-数据链路层_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输-程序员宅基地

文章浏览阅读1.2k次,点赞2次,收藏8次。数据链路层习题自测问题1.数据链路(即逻辑链路)与链路(即物理链路)有何区别?“电路接通了”与”数据链路接通了”的区别何在?2.数据链路层中的链路控制包括哪些功能?试讨论数据链路层做成可靠的链路层有哪些优点和缺点。3.网络适配器的作用是什么?网络适配器工作在哪一层?4.数据链路层的三个基本问题(帧定界、透明传输和差错检测)为什么都必须加以解决?5.如果在数据链路层不进行帧定界,会发生什么问题?6.PPP协议的主要特点是什么?为什么PPP不使用帧的编号?PPP适用于什么情况?为什么PPP协议不_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输

软件测试工程师移民加拿大_无证移民,未受过软件工程师的教育(第1部分)-程序员宅基地

文章浏览阅读587次。软件测试工程师移民加拿大 无证移民,未受过软件工程师的教育(第1部分) (Undocumented Immigrant With No Education to Software Engineer(Part 1))Before I start, I want you to please bear with me on the way I write, I have very little gen...

随便推点

Thinkpad X250 secure boot failed 启动失败问题解决_安装完系统提示secureboot failure-程序员宅基地

文章浏览阅读304次。Thinkpad X250笔记本电脑,装的是FreeBSD,进入BIOS修改虚拟化配置(其后可能是误设置了安全开机),保存退出后系统无法启动,显示:secure boot failed ,把自己惊出一身冷汗,因为这台笔记本刚好还没开始做备份.....根据错误提示,到bios里面去找相关配置,在Security里面找到了Secure Boot选项,发现果然被设置为Enabled,将其修改为Disabled ,再开机,终于正常启动了。_安装完系统提示secureboot failure

C++如何做字符串分割(5种方法)_c++ 字符串分割-程序员宅基地

文章浏览阅读10w+次,点赞93次,收藏352次。1、用strtok函数进行字符串分割原型: char *strtok(char *str, const char *delim);功能:分解字符串为一组字符串。参数说明:str为要分解的字符串,delim为分隔符字符串。返回值:从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。其它:strtok函数线程不安全,可以使用strtok_r替代。示例://借助strtok实现split#include <string.h>#include <stdio.h&_c++ 字符串分割

2013第四届蓝桥杯 C/C++本科A组 真题答案解析_2013年第四届c a组蓝桥杯省赛真题解答-程序员宅基地

文章浏览阅读2.3k次。1 .高斯日记 大数学家高斯有个好习惯:无论如何都要记日记。他的日记有个与众不同的地方,他从不注明年月日,而是用一个整数代替,比如:4210后来人们知道,那个整数就是日期,它表示那一天是高斯出生后的第几天。这或许也是个好习惯,它时时刻刻提醒着主人:日子又过去一天,还有多少时光可以用于浪费呢?高斯出生于:1777年4月30日。在高斯发现的一个重要定理的日记_2013年第四届c a组蓝桥杯省赛真题解答

基于供需算法优化的核极限学习机(KELM)分类算法-程序员宅基地

文章浏览阅读851次,点赞17次,收藏22次。摘要:本文利用供需算法对核极限学习机(KELM)进行优化,并用于分类。

metasploitable2渗透测试_metasploitable2怎么进入-程序员宅基地

文章浏览阅读1.1k次。一、系统弱密码登录1、在kali上执行命令行telnet 192.168.26.1292、Login和password都输入msfadmin3、登录成功,进入系统4、测试如下:二、MySQL弱密码登录:1、在kali上执行mysql –h 192.168.26.129 –u root2、登录成功,进入MySQL系统3、测试效果:三、PostgreSQL弱密码登录1、在Kali上执行psql -h 192.168.26.129 –U post..._metasploitable2怎么进入

Python学习之路:从入门到精通的指南_python人工智能开发从入门到精通pdf-程序员宅基地

文章浏览阅读257次。本文将为初学者提供Python学习的详细指南,从Python的历史、基础语法和数据类型到面向对象编程、模块和库的使用。通过本文,您将能够掌握Python编程的核心概念,为今后的编程学习和实践打下坚实基础。_python人工智能开发从入门到精通pdf