麻生首相の所信表明演説を形態素解析してみた
mecabを使った形態素解析で首相の所信表明演説の単語出現頻度を分析してみた。形態素解析を使ってみたいという思いつきの勢いだけでやった。あんまり(政治的な)意味とかはないよー。
1,2時間で書いてる&未テストだからバグもあると思うので信頼性とか全くないしねー
条件は下記の通り
- 形態素解析ツール
- mecab 0.97
- 分析用の辞書
- IPA辞書
- 計測するの品詞(あまり根拠無く、適当に選別)
- 名詞,サ変接続,*,* 36
- 名詞,ナイ形容詞語幹,*,* 37
- 名詞,一般,*,* 38
- 名詞,引用文字列,*,* 39
- 名詞,形容動詞語幹,*,* 40
- 名詞,固有名詞,一般,* 41
- 名詞,固有名詞,人名,一般 42
- 名詞,固有名詞,人名,姓 43
- 名詞,固有名詞,人名,名 44
- 名詞,固有名詞,組織,* 45
- 名詞,固有名詞,地域,一般 46
- 名詞,固有名詞,地域,国 47
- 分析元の文章
- 閾値
- 出現頻度が5回以上のもの
- 表現形式
- タグクラウドっぽく、出現頻度が大きい物ほど大きいフォントで表示