【毕业设计选题】基于深度学习的中草药检测识别系统 人工智能 python 计算机视觉 YOLO_深度学习中草药图像识别-程序员宅基地

技术标签: YOLO  毕业设计  机器学习  毕设  深度学习  人工智能  毕业设计开题指导  

目录

一、课题背景与意义

二、算法理论技术

2.1 卷积神经网络

2.2 AlexNet模型

三、模型训练

3.1 数据处理

3.2 实验环境

3.3 结果分析

最后


一、课题背景与意义

        叶片是中草药植物的重要器官,也是区分不同植物的重要参照,大多数中草药的叶片都趋于扁平 化,便于被摄录设备采集并进行数字化存储。传统的中草药叶片识别往往需要人工采集大量的原始样 本,再进行人工分析和研究,需要研究者具有相当丰富的中医药知识储备和经验,整个过程耗时耗力且 识别率难以得到保证。在研究中草药植物叶片分类过程中,借助人工智能算 法的优势,开展基于深度神经网络的图像分类实验,进一步提高识别准确率。

二、算法理论技术

2.1 卷积神经网络

        CNN(卷积神经网络)是一种多层网络模型,用于识别二维形状。它具有对平移、比例缩放、倾斜和其他形式的变形具有高度不变性的特点。CNN采用局部连接和局部感受野的结构,与传统的全连接神经网络不同。从输入层开始,每一层接收上一层的输入,一直到输出层,形成一个有向环图。CNN通过卷积运算和局部池化操作来提取特征,使得得到的特征图逐渐变得复杂。每个图由多个神经元构成,多个图构成一个层。这些图充当过滤器的作用,通过计算输入图像的卷积值并与特征匹配,得到适当的特征,并将其输入到下一层结构中。

【毕业设计选题】基于深度学习的中草药检测识别系统 人工智能 python 计算机视觉 YOLO

        CNN框架通过卷积和池化操作对输入的中草药叶片图像进行特征提取和分类。图像经过多层的卷积和池化操作后,最终得到分类结果。该方法利用CNN的优势,提高了中草药叶片识别的准确率和效率。

【毕业设计选题】基于深度学习的中草药检测识别系统 人工智能 python 计算机视觉 YOLO

代码如下(示例):

import torch
import torch.nn as nn

class CNN(nn.Module):
    def __init__(self, num_classes):
        super(CNN, self).__init__()
        self.conv1 = nn.Conv2d(3, 16, kernel_size=3, stride=1, padding=1)
        self.relu = nn.ReLU()
        self.maxpool = nn.MaxPool2d(kernel_size=2, stride=2)
        self.conv2 = nn.Conv2d(16, 32, kernel_size=3, stride=1, padding=1)
        self.fc = nn.Linear(32 * 16 * 16, num_classes)

    def forward(self, x):
        x = self.conv1(x)
        x = self.relu(x)
        x = self.maxpool(x)
        x = self.conv2(x)
        x = self.relu(x)
        x = self.maxpool(x)
        x = x.view(x.size(0), -1)
        x = self.fc(x)
        return x

2.2 AlexNet模型

        AlexNet是一种深度卷积神经网络模型,通过深层的卷积和池化层堆叠、非线性激活函数、局部响应归一化和Dropout正则化等创新设计,实现了对大规模图像数据集的高效分类。它在计算机视觉领域取得了重要突破,开创了深度学习在图像识别任务上的先河,并对后续网络模型的发展和应用产生了深远影响。

【毕业设计选题】基于深度学习的中草药检测识别系统 人工智能 python 计算机视觉 YOLO

        对原始的AlexNet模型进行了改进和优化。在第三层和第四层特征提取能力最强的基础上,为了进一步提高分类的准确度,插入了一层新的第五层。该新层与原第四层结构一致,但通过增加卷积操作来提取更多有效特征。经过多次实验和探索,改进后的模型命名为AlexNet_En,并且在分类精确度上优于原始的AlexNet模型。AlexNet_En模型的结构,其中第五层以虚线框表示。这种改进和优化有助于进一步提升模型性能和特征提取的准确度。

【毕业设计选题】基于深度学习的中草药检测识别系统 人工智能 python 计算机视觉 YOLO

代码如下(示例):

import torch
import torch.nn as nn

class AlexNet_En(nn.Module):
    def __init__(self, num_classes):
        super(AlexNet_En, self).__init__()
        self.features = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),
            nn.Conv2d(64, 192, kernel_size=5, padding=2),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),
            nn.Conv2d(192, 384, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(384, 384, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(384, 256, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),
        )
        self.classifier = nn.Sequential(
            nn.Dropout(),
            nn.Linear(256 * 6 * 6, 4096),
            nn.ReLU(inplace=True),
            nn.Dropout(),
            nn.Linear(4096, 4096),
            nn.ReLU(inplace=True),
            nn.Linear(4096, num_classes),
        )

    def forward(self, x):
        x = self.features(x)
        x = x.view(x.size(0), 256 * 6 * 6)
        x = self.classifier(x)
        return x

三、模型训练

3.1 数据处理

        通过python爬虫算法爬取百度图片,中文关键字为“苍耳”(xanthium si biricum)、“金银花”(honeysuckle)、“薄荷”(mint)、“藿香”(patchouli)、“白花蛇舌草”(hedyotis diffusa)共5类中药植物图片,每类挑选其中600张,共3000张图片组成数据集,其中2400张作为训练集,300张作为验证集,300张作为测试集,各占总图像数量的80%、10%、10%,将该数据集命名为HERB3K。

        为了解决数据集HERB3K样本数量较少可能影响训练的准确率问题,拟采用以下3种方法对数据集HERB3K进行数据增扩。关于图像增噪有许多算法可以实现,本研究采用加性零均值高斯噪声方法为图像增加相应的噪点。增噪的方式是为图像上每个点的灰度值加上一个噪声值,噪声值的产生方式是使用Box-Muller算法生成高斯噪声。

代码如下(示例):

import numpy as np
import cv2

def add_gaussian_noise(image, mean=0, std=1):
    # 生成相应大小的随机高斯噪声
    noise = np.random.normal(mean, std, image.shape).astype(np.uint8)
    
    # 将噪声添加到原始图像上
    noisy_image = cv2.add(image, noise)
    
    return noisy_image

3.2 实验环境

        实验基于Caffe平台搭建,Caffe是一款基于C++/CUDA,支持命令行、Matlab和Python接口的深度学习框架,该框架利用MKL、OpenBLAS、cuBLAS等矩阵运算库加速计算、同时支持GPU加速,具有例程脚本丰富、入门快等特点。实验软硬件环境为Mac OS操作系统、Intel Core i5 1.6 G CPU、8G内存。

3.3 结果分析

        默认的AlexNet模型使用的是1000类的ImageNet数据集,而本研究只采集了5种中草药图像,因此需要修改每组实验模型参数num_output=5。此外,在训练过程中多次测试发现每组进行了300次左右迭代后准确率及损失值基本趋于平稳。

        改进的AlexNet模型在数据增扩下具有更高的训练准确率。然而,相比于原始的AlexNet模型在数据增扩下所获得的准确率提高,改进的模型的提升幅度较小。基于改进的AlexNet模型的训练结果普遍优于原始模型。结合数据增扩和改进的AlexNet模型能够最大程度地提高图像分类的准确率。

        通过对比和分析改进的AlexNet_En网络模型与原始AlexNet网络模型以及数据增扩后的数据集与原始数据集,展示出了较好的分类效果。然而,从损失值的角度来看,改进后的AlexNet模型的损失值普遍高于原始AlexNet模型。此外,改进后的AlexNet_En模型的训练时间也较原始AlexNet模型长,因为改进后的模型层数较多,复杂度较高,对硬件要求也更高。同时,随着数据集的增大,AlexNet_En对分类性能的提升幅度变小,而在HERB3K这样的小数据集上有较大的准确率提升,这表明存在过拟合问题。这些问题将成为未来模型改进和提升的方向。

最后

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_37340229/article/details/135429878

智能推荐

JWT(Json Web Token)实现无状态登录_无状态token登录-程序员宅基地

文章浏览阅读685次。1.1.什么是有状态?有状态服务,即服务端需要记录每次会话的客户端信息,从而识别客户端身份,根据用户身份进行请求的处理,典型的设计如tomcat中的session。例如登录:用户登录后,我们把登录者的信息保存在服务端session中,并且给用户一个cookie值,记录对应的session。然后下次请求,用户携带cookie值来,我们就能识别到对应session,从而找到用户的信息。缺点是什么?服务端保存大量数据,增加服务端压力 服务端保存用户状态,无法进行水平扩展 客户端请求依赖服务.._无状态token登录

SDUT OJ逆置正整数-程序员宅基地

文章浏览阅读293次。SDUT OnlineJudge#include<iostream>using namespace std;int main(){int a,b,c,d;cin>>a;b=a%10;c=a/10%10;d=a/100%10;int key[3];key[0]=b;key[1]=c;key[2]=d;for(int i = 0;i<3;i++){ if(key[i]!=0) { cout<<key[i.

年终奖盲区_年终奖盲区表-程序员宅基地

文章浏览阅读2.2k次。年终奖采用的平均每月的收入来评定缴税级数的,速算扣除数也按照月份计算出来,但是最终减去的也是一个月的速算扣除数。为什么这么做呢,这样的收的税更多啊,年终也是一个月的收入,凭什么减去12*速算扣除数了?这个霸道(不要脸)的说法,我们只能合理避免的这些跨级的区域了,那具体是那些区域呢?可以参考下面的表格:年终奖一列标红的一对便是盲区的上下线,发放年终奖的数额一定一定要避免这个区域,不然公司多花了钱..._年终奖盲区表

matlab 提取struct结构体中某个字段所有变量的值_matlab读取struct类型数据中的值-程序员宅基地

文章浏览阅读7.5k次,点赞5次,收藏19次。matlab结构体struct字段变量值提取_matlab读取struct类型数据中的值

Android fragment的用法_android reader fragment-程序员宅基地

文章浏览阅读4.8k次。1,什么情况下使用fragment通常用来作为一个activity的用户界面的一部分例如, 一个新闻应用可以在屏幕左侧使用一个fragment来展示一个文章的列表,然后在屏幕右侧使用另一个fragment来展示一篇文章 – 2个fragment并排显示在相同的一个activity中,并且每一个fragment拥有它自己的一套生命周期回调方法,并且处理它们自己的用户输_android reader fragment

FFT of waveIn audio signals-程序员宅基地

文章浏览阅读2.8k次。FFT of waveIn audio signalsBy Aqiruse An article on using the Fast Fourier Transform on audio signals. IntroductionThe Fast Fourier Transform (FFT) allows users to view the spectrum content of _fft of wavein audio signals

随便推点

Awesome Mac:收集的非常全面好用的Mac应用程序、软件以及工具_awesomemac-程序员宅基地

文章浏览阅读5.9k次。https://jaywcjlove.github.io/awesome-mac/ 这个仓库主要是收集非常好用的Mac应用程序、软件以及工具,主要面向开发者和设计师。有这个想法是因为我最近发了一篇较为火爆的涨粉儿微信公众号文章《工具武装的前端开发工程师》,于是建了这么一个仓库,持续更新作为补充,搜集更多好用的软件工具。请Star、Pull Request或者使劲搓它 issu_awesomemac

java前端技术---jquery基础详解_简介java中jquery技术-程序员宅基地

文章浏览阅读616次。一.jquery简介 jQuery是一个快速的,简洁的javaScript库,使用户能更方便地处理HTML documents、events、实现动画效果,并且方便地为网站提供AJAX交互 jQuery 的功能概括1、html 的元素选取2、html的元素操作3、html dom遍历和修改4、js特效和动画效果5、css操作6、html事件操作7、ajax_简介java中jquery技术

Ant Design Table换滚动条的样式_ant design ::-webkit-scrollbar-corner-程序员宅基地

文章浏览阅读1.6w次,点赞5次,收藏19次。我修改的是表格的固定列滚动而产生的滚动条引用Table的组件的css文件中加入下面的样式:.ant-table-body{ &amp;amp;::-webkit-scrollbar { height: 5px; } &amp;amp;::-webkit-scrollbar-thumb { border-radius: 5px; -webkit-box..._ant design ::-webkit-scrollbar-corner

javaWeb毕设分享 健身俱乐部会员管理系统【源码+论文】-程序员宅基地

文章浏览阅读269次。基于JSP的健身俱乐部会员管理系统项目分享:见文末!

论文开题报告怎么写?_开题报告研究难点-程序员宅基地

文章浏览阅读1.8k次,点赞2次,收藏15次。同学们,是不是又到了一年一度写开题报告的时候呀?是不是还在为不知道论文的开题报告怎么写而苦恼?Take it easy!我带着倾尽我所有开题报告写作经验总结出来的最强保姆级开题报告解说来啦,一定让你脱胎换骨,顺利拿下开题报告这个高塔,你确定还不赶快点赞收藏学起来吗?_开题报告研究难点

原生JS 与 VUE获取父级、子级、兄弟节点的方法 及一些DOM对象的获取_获取子节点的路径 vue-程序员宅基地

文章浏览阅读6k次,点赞4次,收藏17次。原生先获取对象var a = document.getElementById("dom");vue先添加ref <div class="" ref="divBox">获取对象let a = this.$refs.divBox获取父、子、兄弟节点方法var b = a.childNodes; 获取a的全部子节点 var c = a.parentNode; 获取a的父节点var d = a.nextSbiling; 获取a的下一个兄弟节点 var e = a.previ_获取子节点的路径 vue

推荐文章

热门文章

相关标签