鷲見有哉の卒業研究への道
履歴
3月26日: 作業報告
3月5日: 作業報告
2月5日: 作成
2019年3月26日
LINEのトークのデータ収集
OriHime, OriHime eyeについて
Twitterから会話データを取得
スクレイピング
2019年3月5日
作業報告:
LINEから会話データを取得
NIIのサイトから会話データを取得 →準備中でデータが無かったため、また後日
Twitterから会話データを取得する方法 →TensorFlowを使用したツールがあった
Pythonプログラミングパーフェクトマスターを読
白井から: 国立国語研究所の日常会話コーパスも調べてみよ
2019年2月5日版
題目:
非タスク指向型対話システム
目的:
タスク型ではなく非タスク指向型にすることで、より幅の広い会話ができるシステムを作成する
動機:
AIスピーカー等の対話システムはタスク指向型に特化している面が強く、非タスク指向型の面はあまり得意では無いため、会話もQ&A方式の短いものが多い。非タスク指向型に強くなれば、タスク指向型の部分と併せて、より自然な会話が出来るようになるのではと考えた。
新規性:
自ら会話の話題を作れる非タスク型システムにしたい。また、タスク型と非タスク型が合体したような、Q&A、雑談の両方をこなせるシステムができれば重畳。
予想される困難:
システムの評価が難しい、会話のデータ採取が困難になると考えられる
関連研究:
Twitterを用いた非タスク指向型対話システムのための発話候補分獲得
雑談対話システムにおけるユーザの趣味を考慮した発話手法に関する検討
対話システムにおける多様な話題の展開手法
言語資源を用いた非タスク指向型対話システム
再帰型ニューラルネットワークを用いた特定話者の個性を学習可能な非タスク指向型対話システム
資料:
.第3回人狼知能と対話システム
対話システムの類型とその実現に向けた方法論
Twitterから対話データを収集する
.対話システムライブコンペティション
個性に着目した対話システムの自然性の評価実験
道具、準備、学習
eq2seqで利用可能な日本語対話データをダウンロードするツール
研究計画
春休み期間
RNNの復習
RNNの他に非タスク指向型システムを作成するにあたり、ルールベースや機械学習、深層学習等どんなアプローチの仕方があるのかを調べる
会話のテキストデータセットがweb上で手に入るものがあるか調べる(Twitter等から会話を収集する方法も調べる)
春学期
会話データの収集、整理
システムの作成
夏休み期間
システムの評価を行いシステムの性能の向上させる
秋学期
システムの評価を行いシステムの性能の向上させる
進捗に応じて、新たなテキストデータの採取、会話の話題の自動生成等を試みる
評価方法:
複数の人にシステムを使ってもらいアンケートを実施、コンペティションなどの評価方法を参考にする。
波及効果:
コミュニケーション