基于GPU的CLABP特征提取方法研究
来源: 作者: 发布时间:2015-11-04 07:19:27 浏览量:为了减少并行计算时对全局存储器的频繁读取,GUP中提供了大量的共享内存和寄存器解决这一问题。同一模压电感器厂个线程块内的程序通过访问共享内存可以获取到计算所需数据,无需再访问全局存储器,而寄存器可以保存每个线程的私有数据。
因此在计算像素点的CLABP值时,每次将整个线程块所需的34×34个像素点的值送入共享内存,则每个像素点的数据均可以读取共享内存以提高数据的读取速度。将每个像素点的CLABP值计算完成后送入寄存器,进行直方图的统计。再将每个线程块的直方图统计结果送回全局存储器进行统计,得到最终的CLABP直方图。
3 实验及讨论
本文采用的实验平台是Windows 7,MATLAB 2011b,联想ThinkPad T420笔记本,其CPU为Intel Core i7 2.8 GHz,显卡为NVIDIA NVS 4200M。评价数据集是公开的纹理数据库Outex[9]。该数据库包含了大量的纹理图片,包括自然纹理和表面纹理,而且提供了不同的光照条件、旋转角度和分辨率。图3是Outex纹理图像数据库的部分示例图像。所有的图像尺度都重新变换为128像素×128像素大小,CLABP的局部区域大小采用3像素×3像素和4像素×4像素两种尺寸。
本文所采用的评价准则是加速比,即:
对于每幅图像,对GPU提取的CLABP特征进行10次实验,加速比取这10次实验的平均值。表1为不同图像数量下CLABP特征提取时间及加速比。
从表1可以看出,本文采用的GPU实现方法比CPU实现方法效率要高,而且随着处理的图像个数的增多,加速比逐渐变大。这是因为传输图像数据采用的是异步传输的方式,传输的图像数量越多,加速越明显,效果越好。
图4是不同图像个数下的CLABP纹理特征提取加速比。从图中可以看出,随着图像个数增加,加速比也随之增多,但是当图像个数稳定为200个之后,加速比提升不明显。这是因为异步传输和并行计算加速已经趋于稳定,进一步提升加速比需要加入其他的加速方法或技巧。
本文针对CLABP特征提取速度较慢的问题,采用GPU对CLABP特征提取方法进行加速,通过异步传输和核函数并行计算提高了纹理特征的计算效率。实验结果表明,本文所采用的GPU实现方法在Outex纹理数据库上具有将近25倍的加速比。对于其他的纹理特征提取方法,本文方法也同样适用。
由于本文主要研究程序方面的优化,对于GPU硬件优化并无深入,将CLABP纹理特征与GPU硬件结合将是今后研究的重点。
参考文献
[1] AHONEN T, HADID A, PIETIK?魧INEN M. Face description with local binary pattern: application to face recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(12):2037-2041.
[2] OJALA T, PIETIKAINEN M, MAENPAA T. Multiresolution gray-scale and rotation-invariant texture classification with local binary patterns[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(7):971-987.
[3] 林似水,郑力新.联合LBP与SOM的多分辨率织物疵点检测[J].微型机与应用,2012,31(23):45-47.
[4] 郭春凤,何建农.彩色与纹理不变性的阴影消除新算法[J].微型机与应用,2013,32(5):38-41.
[5] LEE S H, CHOI J Y, RO Y M, et al. Local color vector binary patterns from multi-channel face images for face recognition[J]. IEEE Transactions on Image Processing, 2012, 21(4):2347-2353.
[6] KIRK D B, HWU W W.大规模并行处理器编程实战[M].陈曙晖,熊淑华,译.北京:清华大学出版社,2010.
[7] SANDERS J, KANDROT E. GPU高性能编程CUDA实战[M].聂雪军,译.北京:机械工业出版社,2011.
[8] 张舒,褚艳利,赵开勇,等.GPU高性能运算之CUDA[M].北京:中国水利水电出版社,2009.
[9] OJALA T, MAENPAA T, PIETIKAINEN M, et al. Outex-a new framework for empirical evaluation of texture analysis algorithms[C]. Proceedings of the 16th Conference on Pattern Recognition, 2002:701-706.
那个大佬能用通俗的语言讲解一下pid啊 论坛
顶起看不懂这个帖子啊
工程师详解:一种车载无线射频耳机系统的设计 4月08日 第三届·无线通信技术研讨会 立即报名 12月04日 2015•第二届中国IoT大会 精彩回顾 10月30日ETF•智能硬件开发技术培训会 精彩回顾 10月23日ETF•第三届 消费
基于TMS320F2812 DSP捕获单元的柴油发电机组的1 引言 应用于高层建筑、银行、机场和油田等场合的柴油发电机组,必须采用相应方法控制其供电电压和频率,以确保在机组运行中具有良好的电气性能,满足应用要求。其频率控制一般是通过转速控制实现,目前应用较多
大电流电感