aprioriアルゴリズムってなんぞ?
apriori algorismとは
アイテムの出現頻度からアイテム間の関連性を出そうとするアルゴリズム. いわゆるビールとオムツの関係を出す. {オムツ,ビール} {オムツ,洗剤,お菓子} {ビール,お菓子,アイス}…みたいなデータ
支持度=アイテムA,アイテムBが共に含まれる確率
確信度=アイテムAが含まれるうちアイテムA,アイテムBが含まれる確率
ブランド推薦なら支持度がある程度低くても確信度の高いブランドを推薦する. 支持度を低くしすぎるとアイテムCが含まれる確率よりアイテムA,アイテムBが共に含まれる確率が高くなる. そもそもアイテムCの頻度が小さいならあまり正確ではない.
使ったデータ.
参考サイト
実装したやつ.環境はpython2なので環境を分けないとな. github.com