第1回読み会

Profile Research Publications Tutorials

第1回読み会

参加者: 駒谷, 武田(阪大), Neubig, 水上, 杉山(NAIST), 森, 井上, 吉野(京大)
日　時: 2014年11月01日 14:00--18:00
場　所: 大阪大学吹田キャンパス産業科学研究所 (大阪府茨木市美穂ヶ丘8-1)

以下にあるコメントなどは吉野の個人的なメモです。

Word-Based Dialog State Tracking with Recurrent Neural Networks (吉野)

SIGDIAL 2014, Dialog State Tracking Challenge で２位（L2では最高精度）
資料
対話制御のBelief Updateに相当する部分をRNNに置き換え（ASRの認識結果をそのまま使う）
単語を直接入力としたNNを作る
StateやValueを抽象化して未観測状態に対応するNNを作っている
Auto encoderでnoise reductionをしている
Baseline SLUを入力とする場合よりASRの結果を入力とする方が精度が高い

Resolving Referring Expressions in Conversational Dialogs for Natural User Interfaces (吉野)

EMNLP 2014
スマートフォンなどの画面を持つ対話システムを想定して、画面上のオブジェクトのうちユーザがどれを支持したかを解決する
画面上に6x1, 6x2, 6x3いずれかのリストを表示して見たい対象を支持してもらう
ユーザの支持は"Referential"と"Locational"に分かれ、それぞれを解くための素性を用意する
Gradient Boosted Decision Treeで最高精度、ExplicitなLocationalはそこそこ解けたがImplicitなLocational（著者Aの2番目の本、など）はかなり難しい
ドメイン適応性も確かめている

Inverse Reinforcement Learning for Micro-Turn Management (井上)

INTERSPEECH 2014
資料
Micro-Turn Management (約100msec単位でのターン管理)における強化学習（マルコフ決定過程）
報酬関数 (Reward function) を逆強化学習により獲得
Supervised classification (割引係数=0の場合) に比べて，交差検定での政策(Policy)の対数尤度が向上
生成された政策を例示

Evaluating a Spoken Dialogue System that Detects and Adapts to User Affective States (水上)

SIGDIAL 2014
資料
授業を教えるようなエージェントの振る舞いとユーザ側の性差の話
ユーザのdisengagement（諦めみたいな感じ）とuncertainty（◯◯？みたいな不確かな確認）にどう行動するか
男性はdisengagementに対応するのがよい、女性はuncertaintyに対応するのがよい（disengagementに対応するとむしろ下がる）
データが少し少ないので本当にそう言えるかは微妙

Sequence to Sequence Learning with Neural Networks (Neubig)

NIPS 2014
資料
系列を入力として系列を出力するRNN
機械翻訳で使う場合は対訳のどちらかを逆順にする（逆に言えば順序は揃っていた方がよい）
今回は機械翻訳タスクでやっているが他のタスクでも使えそう
機械翻訳の共通タスクでかなり上位に食い込める

Discovering Latent Structure in Task-Oriented Dialogue (Neubig)

ACL 2014
著者の資料
バス案内対話の対話構造を潜在変数によってモデル化
オリジナルな手法の論文は別にあるので、対話に適用すればそうなるよねーという感じ

Link

KAWAHARA Laboratory Top Page
KAWAHARA Laboratory Members Page
Koichiro Yoshino Top Page

yoshino [at] pomdp.net

Kyoto University, Media Archiving Research Laboratory, Koichiro Yoshino.