數據挖掘中的一箇重要技術
關聯規則是數據挖掘中的一箇重要技術,用於從大量數據中挖掘出有價值的數據項之間的相關關係。
關聯規則通常形如X→Y的蘊涵式,其中X和Y分別是關聯規則的先導(antecedent或left-hand-side,LHS)和後繼(consequent或right-hand-side,RHS)。在關聯規則中,存在兩個關鍵概念:支持度和置信度。支持度是指項集(X,Y)在總項集中出現的概率,而置信度則是在先決條件X發生的條件下,由關聯規則(X→Y)推出Y的概率。例如,在超市交易數據中,可能會發現一箇隱含的關係,如“購買牀單的顧客有很大可能購買枕套”,這就可以表示爲一箇關聯規則“牀單→枕套”,其中牀單是先導,枕套是後繼。這種規則可以幫助商場優化商品佈局,提高銷售效率。