Profile
Research
Publications
Tutorials
第1回読み会
参加者: 駒谷, 武田(阪大), Neubig, 水上, 杉山(NAIST), 森, 井上, 吉野(京大)
日 時: 2014年11月01日 14:00--18:00
場 所: 大阪大学 吹田キャンパス 産業科学研究所 (大阪府茨木市美穂ヶ丘8-1)
以下にあるコメントなどは吉野の個人的なメモです。
- SIGDIAL 2014, Dialog State Tracking Challenge で2位(L2では最高精度)
- 資料
- 対話制御のBelief Updateに相当する部分をRNNに置き換え(ASRの認識結果をそのまま使う)
- 単語を直接入力としたNNを作る
- StateやValueを抽象化して未観測状態に対応するNNを作っている
- Auto encoderでnoise reductionをしている
- Baseline SLUを入力とする場合よりASRの結果を入力とする方が精度が高い
- EMNLP 2014
- スマートフォンなどの画面を持つ対話システムを想定して、画面上のオブジェクトのうちユーザがどれを支持したかを解決する
- 画面上に6x1, 6x2, 6x3いずれかのリストを表示して見たい対象を支持してもらう
- ユーザの支持は"Referential"と"Locational"に分かれ、それぞれを解くための素性を用意する
- Gradient Boosted Decision Treeで最高精度、ExplicitなLocationalはそこそこ解けたがImplicitなLocational(著者Aの2番目の本、など)はかなり難しい
- ドメイン適応性も確かめている
- INTERSPEECH 2014
- 資料
- Micro-Turn Management (約100msec単位でのターン管理)における強化学習(マルコフ決定過程)
- 報酬関数 (Reward function) を逆強化学習により獲得
- Supervised classification (割引係数=0の場合) に比べて,交差検定での政策(Policy)の対数尤度が向上
- 生成された政策を例示
- SIGDIAL 2014
- 資料
- 授業を教えるようなエージェントの振る舞いとユーザ側の性差の話
- ユーザのdisengagement(諦めみたいな感じ)とuncertainty(◯◯?みたいな不確かな確認)にどう行動するか
- 男性はdisengagementに対応するのがよい、女性はuncertaintyに対応するのがよい(disengagementに対応するとむしろ下がる)
- データが少し少ないので本当にそう言えるかは微妙
- NIPS 2014
- 資料
- 系列を入力として系列を出力するRNN
- 機械翻訳で使う場合は対訳のどちらかを逆順にする(逆に言えば順序は揃っていた方がよい)
- 今回は機械翻訳タスクでやっているが他のタスクでも使えそう
- 機械翻訳の共通タスクでかなり上位に食い込める
- ACL 2014
- 著者の資料
- バス案内対話の対話構造を潜在変数によってモデル化
- オリジナルな手法の論文は別にあるので、対話に適用すればそうなるよねーという感じ
Link
KAWAHARA Laboratory Top Page
KAWAHARA Laboratory Members Page
Koichiro Yoshino Top Page
yoshino [at] pomdp.net
Kyoto University, Media Archiving Research Laboratory, Koichiro Yoshino.