日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀] Apriori算法是經典的挖掘頻繁項集和關聯規(guī)則的數據挖掘算法,也是十大經典機器學習算法之一。 Agrawal和Srikant兩位博士在1994年提出了Apriori算法,主要用于做快速

Apriori算法是經典的挖掘頻繁項集和關聯規(guī)則的數據挖掘算法,也是十大經典機器學習算法之一。

Agrawal和Srikant兩位博士在1994年提出了Apriori算法,主要用于做快速的關聯規(guī)則分析。

A priori在拉丁語中指"來自以前"。當定義問題時,通常會使用先驗知識或者假設,這被稱作"一個先驗"(a priori)。Apriori算法正是基于這樣的事實:算法使用頻繁項集性質的先驗性質,即頻繁項集的所有非空子集也一定是頻繁的。

1.Apriori算法概念:

Apriori算法使用一種稱為逐層搜索的迭代方法,其中k項集用于探索(k+1)項集。首先,通過掃描數據庫,累計每個項的計數,并收集滿足最小支持度的項,找出頻繁1項集的集合。該集合記為L1。然后,使用L1找出頻繁2項集的集合L2,使用L2找出L3,如此下去,直到不能再找到頻繁k項集。每找出一個Lk需要一次數據庫的完整掃描。Apriori算法使用頻繁項集的先驗性質來壓縮搜索空間。

注:數據庫中的數據可以是結構化的,也可以是半結構化的,甚至還可以是分布在網絡上的異構型數據。

Apriori算法是一種最有影響的挖掘布爾關聯規(guī)則頻繁項集的算法。其核心是基于兩階段頻集思想的遞推算法。該關聯規(guī)則在分類上屬于單維、單層、布爾關聯規(guī)則。在這里,所有支持度大于最小支持度的項集稱為頻繁項集,簡稱頻集。

2.Apriori算法中術語:

1、項集和K-項集

令I={i1,i2,i3……id}是數據中所有項的集合,而T={t1,t2,t3….tN}是所有事務的集合,每個事務TI包含的項集都是I的子集。在關聯分析中,包含0個或多個項的集合稱為項集。如果一個項集包含K個項,則稱它為K-項集??占侵覆话魏雾椀捻椉?。

2、支持度計數

項集的一個重要性質是它的支持度計數,即包含特定項集的事務個數,數學上,項集X的支持度計數σ(X)可以表示為 :

σ(X)=|{TI|X?TI,TI∈T}|
其中,符號|*|表示集合中元素的個數。

3、關聯規(guī)則

關聯規(guī)則是形如X→Y的蘊含表達式,其中X和Y是不相交的項集,即X∩Y=空。

關聯規(guī)則的強度可以用它的支持度(support)和置信度(confidence)來度量。

支持度確定規(guī)則可以用于給定數據集的頻繁程度,而置信度確定Y在包含X的事務中出現的頻繁程度。 
支持度(s)和置信度(c)這兩種度量的形式定義如下: 
s(X→Y)=σ(X∪Y)/N 
c(X→Y)=σ(X∪Y)/σ(X) 
其中, σ(X∪Y)是(X∪Y)的支持度計數,N為事務總數,σ(X)是X的支持度計數。

對于靠譜的關聯規(guī)則,其支持度與置信度均應大于設定的閾值。那么,關聯分析問題即等價于:對給定的支持度閾值min_sup、置信度閾值min_conf,找出所有的滿足下列條件的關聯規(guī)則:

支持度>=min_sup

置信度>=min_conf

把支持度大于閾值的項集稱為頻繁項集(frequent itemset)。因此,關聯規(guī)則分析可分為下列兩個步驟:

1)生成頻繁項集F=X∪Y;

2)在頻繁項集F中,找出所有置信度大于最小置信度的關聯規(guī)則X->Y

Apriori算法思想:

1)找出所有的頻集,這些項集出現的頻繁性至少和預定義的最小支持度一樣。

2)由頻集產生強關聯規(guī)則,這些規(guī)則必須滿足最小支持度和最小可信度。

3)使用第1)步找到的頻集產生期望的規(guī)則,產生只包含集合的項的所有規(guī)則,其中每一條規(guī)則的右部只有一項,這里采用的是中規(guī)則的定義。

4)一旦這些規(guī)則被生成,那么只有那些大于用戶給定的最小可信度的規(guī)則才被留下來。為了生成所有頻集,使用了遞歸的方法。

3.Apriori算法優(yōu)點:

1)使用先驗性質,大大提高了頻繁項集逐層產生的效率;

2)簡單易理解;

3)數據集要求低;

4)擴展性較好,可以并行計算。

Apriori算法缺點:

1)    可能產生大量的候選集;

2)    可能需要重復掃描整個數據庫,非常耗時。

4.Apriori算法改進:

定理:如果規(guī)則X->Y?X 不滿足置信度閾值, 則對于X的子集X′->Y?X′也不滿足置信度閾值。

根據此定理,可對規(guī)則樹進行剪枝。

5.Apriori算法應用:

通過對數據的關聯性進行了分析和挖掘,挖掘出的這些信息在決策制定過程中具有重要的參考價值。Apriori 算法被廣泛應用于各種領域:

1)應用于商業(yè)活動領域,應用于消費市場價格分析中,它能夠很快的求出各種產品之間的價格關系和它們之間的影響。

2)應用于網絡安全領域,通過模式的學習和訓練可以發(fā)現網絡用戶的異常行為模式,能夠快速的鎖定攻擊者,提高了基于關聯規(guī)則的入侵檢測系統(tǒng)的檢測性。

3)應用于高校管理中。隨著高校貧困生人數的不斷增加,學校管理部門資助工作難度也越加增大。針對這一現象,將關聯規(guī)則的Apriori算法應用到貧困助學體系中,挖掘出的規(guī)則也可以有效地輔助學校管理部門有針對性的開展貧困助學工作。

4)應用于移動通信領域?;谝苿油ㄐ胚\營商正在建設的增值業(yè)務Web數據倉庫平臺,對來自移動增值業(yè)務方面的調查數據進行了相關的挖掘處理,從而獲得了關于用戶行為特征和需求的間接反映市場動態(tài)的有用信息,這些信息在指導運營商的業(yè)務運營和輔助業(yè)務提供商的決策制定等方面具有十分重要的參考價值。

結語:

Apriori算法是一種挖掘關聯規(guī)則的頻繁項集算法,其核心思想是通過候選集生成和情節(jié)的向下封閉檢測兩個階段來挖掘頻繁項集。主要用于做快速的關聯規(guī)則分析。Apriori算法在世界上廣為流傳,得到極大的關注。Apriori算法已經被廣泛的應用到商業(yè)、網絡安全、高校管理和移動通信等領域。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除。
換一批
延伸閱讀

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字: 工業(yè)電機 驅動電源

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅動電源 照明系統(tǒng) 散熱

根據LED驅動電源的公式,電感內電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅動電源

在現代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質量和效率直接關系到城市的公共安全、居民生活質量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅動電源 功率因數校正

在LED照明技術日益普及的今天,LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現在的LED驅動電源

關鍵字: LED 驅動電源 開關電源

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器,通常情況下:LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅動電源
關閉