联系我们
    插件电感_大电流电感
热门搜索
点击排行
推荐电感
推荐阅读
推荐电感
推荐电感
猜猜你喜欢的
行业资讯 您所在的位置: 电感 > 行业资讯

Apriori算法改进研究及实现

来源:    作者:    发布时间:2015-11-08 06:42:24    浏览量:

摘 要: 通过对Aprio贴片绕线电感ri算法基本原理和性能的研究分析,针对算法存在的不足,提出了一种更高效的基于对频繁项集分组并行的挖掘算法。该算法把频繁k-1项集按照一定规律分组,每组频繁k-1子项集直接产生频繁k子项集;再把每组产生的频繁k子项集合起来,这样每组不仅在自连接时减少了很多判断连接尝试,而且可以并行绕线型片式电感器处理连接、剪枝行为,减少了等待时间,提高了查找频繁项集的速度。经过实验证实,改进后的算法在性能上有很大的提升。

关键词: 数据挖掘;关联规则;Apriori算法;分组; 并行

数据挖掘是指从数据库的大量数据中提取出先前未知的、具有潜在实际价值的、隐含的信息[1]。关联规则挖掘就是从海量的数据中寻找数据项间的关联关系。

关联规则挖掘是由Agrawal等人于1993年首先提出[2],之后又提出了著名的基于频繁项集的Apriori算法[3-4]。关联分析用来发现购物篮数据事务中各项之间的有趣现象,目前主要被应用于如科学数据分析、生物信息学、医疗诊断和网页分析等许多领域[5]。因此,关联规则挖掘被广泛地研究。为了提高挖掘的效率,近几年国内外学者不断地对基于Apriori算法进行改进和创新,提出了很多优化的改进算法[6-8]。

1 关联规则概念

  令I={i1,i2,…,id}是所有项的集合,而T={t1,t2,…,tN}是所有事务的集合。每一个事务ti包含的项集都是I的子集。在关联规则的分析中,包含多个项的集合被称之为项集。例如一个项集包含了k个项,则此项集被称为k-项集[9]。空集是不包含任何项的项集。

关联规则表达式X→Y,其中X和Y是不相交的项集,即X∩Y=?准。支持度(support)是T中同时包含X和Y的事务占的百分比。置信度(confidence)是T中同时包含X和Y的事务占包含X的事务的百分比。项集的出现频率是包含项集的事务数,称为项集的支持度计数。支持度确定规则可以用于给定数据集的频繁程度。如果项集I的支持度计数大于等于最小支持度阈值,可以确定项集I是频繁项集。支持度(s)度量形式为:

   S(X→Y)=N (1)

2 Apriori算法分析

  Apriori算法是一种非常具有影响力的关联规则频繁项集的算法。它开创性地通过对最小支持度阈值的设置,系统地控制了候选项数量几何的增长。

  该算法采用了宽度优先且逐层搜索的迭代方法,即当第k次迭代时,频繁k-项集通过频繁(k-1)-项集 Lk-1来关联查找。第一次运行迭代时,扫描事务数据库所有项目,找出事务数据库中的所有项集构成的候选1-项集C1,然后根据设定的最小支持度阈值,在C1中筛选出符合条件的项,构成频繁1-项集L1;第二次运行迭代时,用频繁1-项集L1自连接产生候选项,并且扫描所有事务数据库集合,得到C2中每一个项的支持度值,然后通过最小支持度的阈值进一步筛选出符合条件的频繁2-项集L2。一直这样循环迭代下去,直到不能再产生频繁项集为止。

  该算法核心方法主要通过连接(候选项集的产生)和剪枝两个步骤来完成。

(1)连接。由前一次迭代发现的频繁(k-1)-项集Lk-1直接产生新的候选k-项集Ck。

  (2)剪枝。候选k-项集Ck是频繁k-项集Lk的超集,且Ck中的项集不确定是否都是频繁集。剪枝一般分为两步来进行。首先,根据Apriori的性质,任何的非频繁(k-1)-项集都不是频繁k项集的子集。考虑Ck,即X={i1,i2,…,ik}。该算法首先需确定它所有的真子集X-{i1}(?坌j=1,2,…,k)必须都是频繁的。如果其中一个真子集是非频繁的,则X将会被立即剪枝。这种方法能非常有效地减少在支持度计数过程中所要考虑的候选项集的数量。继而可以得到已经被剪枝处理过的候选项集Chttp://www.szmzhg.com/贴片功率电感k′。然后,扫描所有事务数据库集合,计算Ck′每一个候选项的支持度计数,删除支持度计数小于支持度计数阈值的项集,从而得到Lk。

  由于Apriori算法主要通过这两步来实现,为了能对该算法有更加清楚直观的认识,具体分析这个过程,Lk-1自连接来产生新的Ck′。令所有的项集中的项都按照一定的原则来排序。假设任意l1∈Lk-1、l2∈Lk-1、c1∈Ck,c1′∈Ck。当Lk-1进行自连接时,要判断两个频繁项是否能够连接,如果l1[i]=l2[i](?坌i=1,2,…,k-2),则可以连接产生项c1′。根据Apriori的性质,项c1′可以产生(k-1)个(k-1)-项子集,再判断所有的(k-1)-项子集是否都在Lk-1中。若有一个(k-1)-项子集不在Lk-1中,则项c1′为非频繁项,可以忽略此项;反之,项c1

奔驰测试多项安全技术 欲加快汽车智能化 我们之前曾提到过:未来的汽车驾驶将会由不可逆转的变化,最大的变化将是对汽车操控的方式,而我们将会在我们的有生之年看到这些变化。
在汽车领域最有突破性的革新将出现在

传统挠性电路板制造工艺挠性基板传统制造工艺有连续法(Roll-to-Roll,即卷筒法)和非连续法(片材加工法)。不同的制造方法有不同的特点,但最普通的制造方法是非连续法,图1为双面挠性基板加工方法的制造

ESD静电保护器手机静电防护利器近年来,移动设备手机在生活中扮演了越来越重要的角色,人们用它来娱乐、沟通、工作,根本离不开它。 随着手机硬件技术的发展,人们对这种小型设备的要求不再局限于外形和功能,对其集成电路(IC)的稳定性及可靠性更是有了严苛的要求,人们在更多的场合使用手机,这意味着电路必须能够承受温度,电压,电流变动甚至是静电放电的影响。 伴随着手机功能多样性的增加,其输入输出接口的增加也使得各种外界骚扰获得了更多的途径入侵到手机设备中。 屏幕、摄像

大电流电感
 
在线客服