変数の拡張に対する最適輸送を用いたドメイン適応

Abstract

ドメイン適応はソースドメインから得られたラベル付きデータに関する知識をターゲットドメイン転移し, ドメイン間での違いを考慮した学習を行うことを目的としている.多くのドメイン適応の方法はソース,ターゲット ドメインが同じ次元であることを仮定している.特にターゲットドメインから得られるテストデータに対してラベル 情報が与えられない場合,各ドメインで変数の数が異なる場合に利用可能な方法の研究は限定的である.本稿では, ソース,ターゲットドメインに共通の変数が存在し,ターゲットドメインでは新たな変数が観測されると仮定し,ター ゲットドメインの変数の数がソースドメインより多くな場合を考える.そして,ソース,ターゲットドメイン間で変 数が共通となる性質を利用し,ドメイン間の適応を最適輸送問題として定式化し,ドメイン適応のアルゴリズムを提 案する.また,提案した最適輸送にもとづくアルゴリズムのターゲット領域における汎化誤差の上界を導出し,提案 法の有効性を人工データおよび実データによって評価する.

Publication
情報論的学習理論と機械学習研究会 (IBISML)