接着剤の精進日記

競プロでの精進や研究に関係したことを書いていきます。

論文メモ 「Joint Learning of the Embedding of Words and Entities for Named Entity Disambiguation」

Joint Learning of the Embedding of Words and Entities for Named Entity Disambiguation

Ikuya Yamada, Hiroyuki Shindo, Hideaki Takeda, Yoshiyasu Takefuji
The SIGNLL Conference on Computational Natural Language Learning (CoNLL), 2016
https://aclweb.org/anthology/K16-1025

どんなもの?

Named Entity Disambiguation(NED)タスクに対し単語とエンティティを一緒に連続したベクトル空間に埋め込んだもの(embedding)を利用することを提案

先行研究と比べてどこがすごい?

・CoNLLデータセット:93.1%
・TAC2010データセット:85.2%
上記のデータセットにおいて、accuracyでSOTA(当時)

技術や手法のキモはどこ?

Knowledge base(KB)モデルとanchor context modelの2つを使用してskip gramモデルを拡張する

どうやって有効だと検証した?

実験結果によりSOTA達成
f:id:tkm-kyudo:20190531170056p:plain

議論はある?

候補エンティティ生成方法がパフォーマンスに影響することがわかった

システムに特徴量を加えた結果、SOTAに匹敵する結果を得られた
f:id:tkm-kyudo:20190531170240p:plain

次に読むべき論文は?

Johannes Hoffart, Stephan Seufert, Dat Ba Nguyen, Martin Theobald, and Gerhard Weikum. 2012. KORE: Keyphrase Overlap Relat- edness for Entity Disambiguation. In Proceedings ofthe 21st ACMInternational Conference on Infor- mation andKnowledge Management (CIKM), pages 545–554.