Ich möchte die maximal häufigen Objektgruppen und die geschlossenen häufigen Objektgruppen herausfinden .
- Die häufige Objektmenge ist maximal, wenn keine häufigen Obermengen vorhanden sind.
- Die häufige Objektmenge X ∈ F wird geschlossen, wenn keine Obermenge mit derselben Frequenz vorhanden ist
Also habe ich das Vorkommen jedes Item-Sets gezählt.
{A} = 4 ; {B} = 2 ; {C} = 5 ; {D} = 4 ; {E} = 6
{A,B} = 1; {A,C} = 3; {A,D} = 3; {A,E} = 4; {B,C} = 2;
{B,D} = 0; {B,E} = 2; {C,D} = 3; {C,E} = 5; {D,E} = 3
{A,B,C} = 1; {A,B,D} = 0; {A,B,E} = 1; {A,C,D} = 2; {A,C,E} = 3;
{A,D,E} = 3; {B,C,D} = 0; {B,C,E} = 2; {C,D,E} = 3
{A,B,C,D} = 0; {A,B,C,E} = 1; {B,C,D,E} = 0
Min_Support auf // Sehr wichtig. Danke steffen, dass du daran erinnert hast.
Ist maximal = ?
Hat geschlossene = ?
data-mining
dataset
association-rules
Mike John
quelle
quelle
Vielleicht möchten Sie sich über den APRIORI-Algorithmus informieren. Es vermeidet unnötige Objektgruppen durch cleveres Beschneiden.
B ist nicht häufig, entfernen.
Konstruiere und zähle zwei Itemsets (noch keine Magie, außer das
B
ist schon raus)All dies ist häufig (beachten Sie, dass alles, was hatte,
B
nicht häufig sein kann!)Verwenden Sie nun die Präfixregel. Kombinieren Sie NUR Itemsets, die mit denselben n-1 Items beginnen. Entfernen Sie alle, wenn eine Teilmenge nicht häufig ist. Zählen Sie die verbleibenden Artikelgruppen.
Beachten Sie, dass dies
{A,C,D}
nicht häufig ist. Da es kein gemeinsames Präfix gibt, kann es kein größeres häufiges Itemset geben!Beachten Sie, wie viel weniger Arbeit ich getan habe!
Überprüfen Sie für maximale / geschlossene Elementmengen Teilmengen / Obermengen.
Beachten Sie, dass zB
{E}=6
und{A,E}=4
.{E}
ist eine Teilmenge, hat aber eine höhere Unterstützung, dh sie ist geschlossen, aber nicht maximal.{A}
ist auch nicht, da es keine höhere Unterstützung als hat{A,E}
, dh es ist redundant .quelle