読者です 読者をやめる 読者になる 読者になる

Twitterを解析して個別にオススメのお土産を紹介

プログラミング

スポンサーリンク


書かないとなって思って忘れていたんですが,Twitterを解析して,個別にオススメのお土産を紹介するプログラムを書きました.

 

この「たのみやげ」の機能の一つですね.

mcg.hateblo.jp

 

以下のTwitterアカウントに,リプライを飛ばしてもらえればお土産が解析されます.

このように,@omiyage_listに 解析したい人のIDとハッシュタグおすすめを付加して呟きます.

f:id:McG:20151125183232p:plain

 

すると,このように,おすすめのカテゴリがおすすめされます.

f:id:McG:20151125183653p:plain

 

ナイーブベイジアンフィルタというものを用いて実装は行いました.

 

簡単に言うと,あるツイートが与えられた時に,そのツイートがあらかじめ用意されてあるカテゴリのどこに属するかっていうのを確率的に算出して,その確率が一番高いカテゴリをおすすめするというものになっています.

 

 

下記にナイーブベイジアンの解説はのっていますので,興味のある方は是非.

 

 

 

 

ソースコードは,一部こちらにアップしてあります.Bot関係はあげていませんが,カテゴライズのところ辺りは見ていただけます.

 

お土産データはwikipedianaverまとめからとらせていただきました.

 

ツイートは,mecabを用いて形態素解析し,名詞,動詞,形容詞のみを抽出しています.(「です」とか,「http」を解析データに入れてしまうと結果がおかしくなるため)

 

© 2016 Yuki Sako.