情報知能学IVの活動(2009年度)
- 10月13日: 情報検索の基礎:形態素解析、ChaSen, 索引語-文書行列
- 10月20日: 情報検索の基礎:プログラムを書こう---ChaSenを使う、
語の頻度表を求める、重みづけを考える(TF-IDFなど)
- 前回の報告一覧
- 解説資料(ppt)
- 情報検索プログラムの例
- 分析対象のファイルの集まり(フォルダー)のzipファ
イル
これをダウンロードしてから、「情報検索プログラム」と同じフォルダ
に置き、「展開」してください。そこで z というフォルダができていることと、
そのフォルダの中にdoc01.txtなどのファイルが入っていることを確認してく
ださい。これがプログラム課題を行う準備になります。
注意:
zというフォルダのなかにもzというフォルダがあった場合は、
内側のzフォルダの中にあるファイルを外側のzフォルダに移してから、内側の
zフォルダを削除してください。
- 10月27日: 正規表現の基礎: 正規表現, Rubyの正規表現
- 11月10日: 正規表現の応用: 日本語の文章の解析、単語や品詞の頻度表、
頻度表作成プログラム