無能学生の作業ログ

せっかく新しいことやっても作業ログがないと身にならないので.

aprioriアルゴリズムってなんぞ?

apriori algorismとは

アイテムの出現頻度からアイテム間の関連性を出そうとするアルゴリズム. いわゆるビールとオムツの関係を出す. {オムツ,ビール} {オムツ,洗剤,お菓子} {ビール,お菓子,アイス}…みたいなデータ

支持度=アイテムA,アイテムBが共に含まれる確率

確信度=アイテムAが含まれるうちアイテムA,アイテムBが含まれる確率

ブランド推薦なら支持度がある程度低くても確信度の高いブランドを推薦する. 支持度を低くしすぎるとアイテムCが含まれる確率よりアイテムA,アイテムBが共に含まれる確率が高くなる. そもそもアイテムCの頻度が小さいならあまり正確ではない.

f:id:sakamoto-ryoma0930:20170603131109p:plain 使ったデータ.

参考サイト

実装したやつ.環境はpython2なので環境を分けないとな. github.com

skzy.hatenablog.com