联系我们
    插件电感_大电流电感
热门搜索
点击排行
推荐电感
推荐阅读
推荐电感
推荐电感
猜猜你喜欢的
行业资讯 您所在的位置: 电感 > 行业资讯

Apriori算法改进研究及实现

来源:    作者:    发布时间:2015-11-08 06:42:24    浏览量:
大电流电感工厂′可以被确定为候选项c1。重复进行以上所述的连接过程,直到筛选产生所有候选k-项集Ck′为止。然后再分析Ck′,依次对Ck′逐项扫描事务数据库所有项目进行支持度计算,进一步筛选出频繁k项集Lk。

3 Apriori算法改进

  经过对上面的情况深入分析发现,该算法Lk-1大部分的自连接是无用的,且基本上绝大多数的判断连接是不成立的。假设Lk-1项集大小为N,则需要判断连接的次数LN为:

LN=∑n (2)

  假定N=4,根据式(2),得出LN=3+2+1=6(次)。然后再对Ck′逐项扫描事务数据库,计算支持度,这个过程需要排队扫描,花费大量的等待时间。考虑以上问题,本文对Lk-1产生Lk的过程提出一种基于对频繁项集分组并行的改进算法P-Apriori。改进算法是在经典Apriori算法基础上修改提出的,效率上有很大的提升。下面将具体介绍改进后算法的这部分改良方法。

首先在Lk-1自连接前对Lk-1进行扫描,按照一定规律分组,把Lk-1每一个频繁项中的前第一项相同的分为一组。例如当l1[1]=l2[1]时,可以分为一组。Lk-1自连接时,要判断它们的前(k-2)个项是否相同。如果它们的前第一个项都不相同,那么这个连接肯定就不会成立。由此可以得出,分组后的每组频繁(k-1)-子项集都可以独自进行自连接,且分组后的最多自连接总次数为PLN: PLN=∑n+∑n+…+∑n (3)

其中i为频繁(k-1)-项集分组量,ni为每组的频繁(k-1)-子项集长度,n1+n2+…+ni=N。

  显然分组后自连接总次数被压缩了,即PLN的值要比LN小得多。假定N=4, 分为两组,令两组的频繁(k-1)-子项集长度分别为n1=2、n2=2,则根据式(3)得出分组后的PLN=1+1=2(次),比原来分组前LN=6(次)少了很多无用连接。当N处于一个较大值,且分组量增加,这种优势将更加明显。由于分组后每组频繁(k-1)-子项集可以并行处理,或者说同步处理,且互不干扰地进行连接、剪枝行为,不仅自连接效率可以进一步提高,同时,把原方法需要逐个根据Apriori性质和扫描事务数据库计算支持度的过程,变成了可以并行进行。如原来只能排成一个队,现在可以排成多个队。显然,分组后效率的提高是可观的。最后把每组频繁(k-1)-子项集直接产生的频繁k-子项集组合起来,即频繁k-项集Lk。改进后的Apriori算法流程如图1所示。

AE_)QRNE`_~Y]@Y{GHJ%HSW.jpg

其实根据事务数据库实际的需求,还可以在Lk-1分组后,把每组的频繁(k-1)-子项集,再将频繁(k-1)-子项集中每一个频繁项的前第二项相同的分为一组。通过组内再分组的方式,更加细化了频繁项集,使得判断连接次数进一步减少,连接速度加快,继而提高效率。也可以直接把频繁(k-1)-项集中每一个频繁项lk-1中的前第一项和前第二项相同的分为一组,这样也能很好地达到分组的效果。

4 实验验证及性能分析

  通过对两种算法的分析,显然在理论上改进后的算法在很多方面效率会更高。下面将通过具体实验来验证算法在改进前后的性能比较。

  本文使用Java语言分别来实现改进前后的两种算法。在相同的实验环境下实现两种算法的比较,实验所用的具体环境配置为:处理器Intel(R)Core(TM)2 Duo CPU P8600,主频2.40 GHz、内存4 GB(实际可用2.96 GB),操作系统Windows 7 旗舰版,系统类型32位。利用系统上安装的Eclipse开发软件来进行实验数据测试。本文将提供8 000条事务数据库,得到在不同最小支持度阈值下两种算法的运行时间。实验结果如表1和图2所示。

8Q]RXZ(RD2([PGRT7RLW8CP.png

由图2可知,在实验环境和事务数据库所有项目不变的前提下,得出了在不同阈值支持度下,两种算法运行时间的值。显然,两种算法在最小支持度阈值变小时,所需要的运行时间都会成几何的增长。通过相互对比,改进后的P-Apriori算法比经典Apriori算法运行时间的增加更缓慢、不迅速。在最小支持度的阈值相同的情况下,改进后的P-Apriori算法运行时间更少,更加高效。当最小支持度的阈值较小时,特别在阈值为0.15时,改进后的P-Apriori算法效率的提升更加明显。当最小支持度的阈值较大时,由于两种算法运行的时间都比较少,所以在图中难以辨别出来。但根据表1可知,通过实际运行数据比较,还是可以发现改进后的P-Apriori算法运行时间比经典Apriori算法的运行时间要少,只是在图2中不明显。

奔驰测试多项安全技术 欲加快汽车智能化 我们之前曾提到过:未来的汽车驾驶将会由不可逆转的变化,最大的变化将是对汽车操控的方式,而我们将会在我们的有生之年看到这些变化。
在汽车领域最有突破性的革新将出现在

传统挠性电路板制造工艺挠性基板传统制造工艺有连续法(Roll-to-Roll,即卷筒法)和非连续法(片材加工法)。不同的制造方法有不同的特点,但最普通的制造方法是非连续法,图1为双面挠性基板加工方法的制造

ESD静电保护器手机静电防护利器近年来,移动设备手机在生活中扮演了越来越重要的角色,人们用它来娱乐、沟通、工作,根本离不开它。 随着手机硬件技术的发展,人们对这种小型设备的要求不再局限于外形和功能,对其集成电路(IC)的稳定性及可靠性更是有了严苛的要求,人们在更多的场合使用手机,这意味着电路必须能够承受温度,电压,电流变动甚至是静电放电的影响。 伴随着手机功能多样性的增加,其输入输出接口的增加也使得各种外界骚扰获得了更多的途径入侵到手机设备中。 屏幕、摄像

大电流电感
 
在线客服