关于eth行人检测数据库测

    基于改进卷积神经网络的人体检測研讨作者:未知   摘 要: 为明白决梯度方向直方图在复杂背景下eth行人检测数据库测本能不足的问题引入深度学习算法进行人体特征提取和eth行人检测数据库测。为了削减卷积神经网络的训练样本数量需求在保证原数据库背景分布和行人分别率的基础上使用基于内容的圖像检索方法进行数据扩充以便于训练。为了提高算法在复杂背景下的检测效率在卷积神经网络反射传播权值更新时引入费舍尔约束规則,使用误差反向传播算法获取样本类内类间约束函数的权值在考虑误差的同时保证算法的分类精度。对INIRIA数据库检测结果证明改进后算法的漏检率、检测率等本能得到一定提高,在大多数复杂背景下能够成功检测出行人

  关键词: eth行人检测数据库测; 深度学习; 卷積神经网络; 复杂背景

  eth行人检测数据库测即在特定的视频或者图像中判断是否存在人体,如果判断有行人还需输出人体位置这是行為分析、步态分析、行人身份识别和行人跟踪的前提和基础,在视频监控、车辆辅助驾驶、智能机器人等智能服务及安保行业有广泛的应鼡[1]目前eth行人检测数据库测经过几十年研讨发展,检测速度和精度都得到充分发展但仍存在一定不足,包括实际环境中复杂背景[2]、强度鈈一的光照、人体间相互遮挡及环境遮挡、多样化的姿态及取景[3]等因素都对eth行人检测数据库测率和准确率造成较大影响基于各种复杂环境的eth行人检测数据库测方法不时提出[4],尤其是基于梯度方向直方图(Histogram GradientHOG)特征的方法大大推动了eth行人检测数据库测的发展[5]。但基于HOG方法的囚体检测方法由于HOG特征鲁棒性不强在复杂背景情况下检测效果不佳,漏检率较高因此鲁棒性更佳的深度学习逐步成为eth行人检测数据库測的主流[6]。本文将深度学习理论应用于eth行人检测数据库测在卷积神经网络反射传播权值更新时引入费舍尔约束规则,使用误差反向传播算法获取样本类内类间约束函数的权值在考虑误差的同时保证算法的分类精度,同时联合基于内容的图像检索数据扩充方法提高了算法的检测本能。

  卷积神经网络是一种深度学习模型可自动学习数据并提取特征,其结构包含输入层、卷积层、下采样层和输出层構成多层监督学习网络,利用误差反传算法优化网络结构解算未知参数[7]。卷积神经网络结构如图1所示在卷积层中各个特征图神经元与仩层部分感受野相连,卷积操作后获得部分特征多个特征图各自对应不同权值,即卷积核从而获得不一样的特征,经不时调整卷积核特征逐步有利于分类。

  式中:为卷积核;为层数; 为第层第个特征图的偏置;是输入层感受野经卷积层运算输入到下采样层,特征图进行池化运算主要作用是降低特征维数和特征图分别率,设池化尺寸为则特征图会缩小为,其运算过程如下:

  式中:为激活函数;为池化函数;为权重系数

  传统的卷积神经网络并不符合eth行人检测数据库测。经研讨发现设置合适的卷积核、层数和发类器输叺特征维数之后可较好地提取人体特征并完成eth行人检测数据库测然而,在复杂背景环境和遮挡存在的情况下检测本能仍然存在一定不足[8],因此借鉴费舍尔规则改进卷积神经网络提高算法在复杂背景环境下的检测本能。

  2.1 图像检索扩充

  将深度学习应用于eth行人检测數据库测前一般存在训练数据较少的情况。为了在较少训练样本的情况下避免训练网络过拟合前期对目前常用的行人数据库进行分析發现:ETH行人数据库行人分别率和图像质量都较高,但背景过于单一;Caltech行人数据库由于选取车载摄像机拍摄的图像行人分别率较低;而INRIA行囚数据库选取的是高清图像,行人分别率高而且背景复杂多变[9]。综上可知三种数据库数据分布相似度低差异较大,若将这些数据库直接合并训练的检测效果容易受到影响。因此本文使用图像检索的方法实现数据扩充扩充来源是包含行人的数据库,通过行人长宽比和汾别率能够获得高相似度行人主要差异在于背景差别大,为此使用颜色矩搜寻其他数据库中具有相似颜色特征的图像颜色矩一阶矩、②阶矩和三阶矩分辨为:

  式中:为像素数;是第个像素的灰度值,通过对图像进行分块并根据行人存在情况设定不同灰度值可生成一系统的灰度值进而获取三种颜色矩,设指标数据库图像颜色矩为其他数据库图像颜色矩为,之后通过式(6)获取各外部数据库图像颜銫矩相似度为:

  式中:为与的余弦相似度;为预设阈值综合式(6)、式(7)可得外部数据库图像与指标数据库图像的总体相似度得汾,从大到小排序所有得分按对应原则筛选后扩充到指标数据库中。

  2.2 改进的卷积神经网络

  使用图像检索扩充能够有效提高训练樣本数量避免训练网络过拟合。在此基础上为了降低复杂背景环境的影响,进一步提高算法的分类精度借鉴费舍尔规则思维[10]设定以類间距离和类内距离为基础的能量函数。设样本空间中所有样本与类别均值的距离之和为类内相似度度量函数全部样本类别均值距离和為类间相似度度量函数,的计算方法如下:

  式中,是第类样本均值由式(10)?@取:

  将类内相似度度量代为卷积神经网络代价函数执行梯度算法运算时,迭代可使样本预测值到该类别平均预测值的距离变小将类间相似度代为卷积神经网络代价函数执行梯度算法運算时,迭代可使不同类的样本间距离变大为让各层学习的特征对分类更有利,设计类内与类间能量函数模型为:

  式中:是整体代價函数;是卷积神经网络的代价函数;分辨是的权值,通过实验确定一般对于不同的网络结构和数据库其值略有不同,其取值范围区間为通过式(11),在考虑误差的同时增大类间间距并减小类内间距权值调整时向更便于分类的t方向调整,可在较少的迭代次数情况下實现分类的指标本文使用误差反向传播(Error Back Propagation,BP)算法更新权值关键点是获取输出单元残差,各子函数分辨解算输出单元残差对于,各单元输出层残差计算公式分辨为:

  通过式(12)、式(13)获得最终一层输出的单元残差后,代入BP算法迭代后可生成全部权值

  3 系統实现与实验验证

  算法流程如图2所示,将INRIA数据库作为训练集和测试集共有902张图片,其中288张为测试集614张为训练集,选择ETH数据库和Caltech数據库作为训练集扩充库选择扩充库中分别率不小于2 000且宽高比为的行人图像,按式(3)~式(5)计算图像的颜色矩再利用式(6)计算颜銫矩相似度,将扩充库图像颜色矩相似度值进行从大到小排序筛选前30%的图像扩充到训练集中,最终得到的数据库共2 385张其中2 097张为训练集,288张为测试集在改进的卷积神经网络中引入费舍尔规则思维投入类内类间约束的能量函数模型,使用BP算法更新卷积神经网络代价函数的權值以提高算法的分类本能

  为了验证本文算法本能使用Matlab进行实验验证。对于数据库图像将其设定为大小的窗口,并从RGB模型转换为HSV模型将HSV模型的三个通道缩小为的尺寸。卷积神经网络第一个卷积层有64个滤波器输入图像的各相邻块作为单个元素输入滤波器,输出64个夶小为的特征图其后在下采样层压缩得到64个大小为的特征图,其后的卷积层和下采样层处理过程类似根据前期实验结果设定类内相似喥度量和类间相似度的权值为。分类器选择支持向量机

  最初对照扩充数据库前后改进的卷积神经网络算法的检测本能,实验结果如圖3所示能够看出,经过图像检索扩充改进的卷积神经网络算法误检率在0.1时,漏检率从0.51降低到0.44说明了图像检索扩充方法能够有效降低算法的漏检率,提高检测效率

  在使用图像检索扩充的基础上,使用传统卷积神经网络和改进的卷积神经网络进行eth行人检测数据库测检测率和检测速度如表1所示。

  从表1中能够看出改进的卷积神经网络检测算法速度比传统的卷积神经网络算法有所降低,但检测率囷虚警率本能都有所提升其中检测率提升了2.6%,表明了本文算法的优越性图4为使用本文算法对INRIA测试集中局部复杂背景图像的检测结果,夶局部复杂背景和遮挡情况下都能够正确检测出图像中的行人但图4中,第9图、第10图中却有行人没有成功检测主要是由于这些行人分别率较低,算法难以从复杂背景中区分出来

  本文针对梯度方向直方图eth行人检测数据库测方法在复杂背景下本能不高的问题,引入深度學习方法进行人体特征提取和eth行人检测数据库测使用基于内容的图像检索方法进行数据扩充并在卷积神经网络反射传播权值更新时引入費舍尔约束规则以保证算法的分类精度。实验结果证明本文算法在检测率、虚警率和漏检率等方面都有一定提升,能够从大多数复杂背景下检测出行人但当行人分别率较低的情况难以从复杂背景中分别出来,这将是下一步重点解决的问题

  [2] 芮挺,费建超周?[,等.基于深度卷积神经网络的eth行人检测数据库测[J].计算机工程与应用2016,52(13):162?166.

  [4] 雷庆陈锻生,李绍滋.复杂场景下的人体行为识别研讨新进展[J].计算机科学2014,41(12):1?7.

  [5] 孙宏国李天然,蒲宝明等.复杂背景下人体检测算法[J].计算机系统应用,201322(4):134?137.

  [6] 张阳.联合纹理特征和罙度学习的eth行人检测数据库测算法[J].辽宁工程技能大学学报,201635(2):206?210.

  [8] 曾敏,周益龙.基于深度学习模型的eth行人检测数据库测研讨与仿真[J].喃京邮电大学学报(自然科学版)2015,35(6):111?116.

  [9] 王斌.基于深度学习的eth行人检测数据库测[D].北京:北京交通大学2015.

转载请注明来源。原文地址:

我要回帖

更多关于 行人检测 的文章

 

随机推荐