論文読んだ記録の記録 3
最近、Machine teachingという分野の論文を読んだ.
機械学習(ここではと書く)とは、究極まで突き詰めれば、あるデータを使ってモデルのパラメータを推定する写像
とみなすことができる. Machine teachingとは、(多分他にも定義とか使い方があるんだろうけれど), 最高のパラメータを知っている「先生」が、「生徒」たる機械学習アルゴリズムがパラメータをうまく推定できるようにデータを作ることを目的にしている.要するに, となるようなDを求める逆問題
をうまいこと解けないだろうか? という問題である. 当然ながら大量にデータを与えればうまく学習できるだろうと思われるので、可能な限りデータ数を小さくなるようにする. ただ、この論文(AAAI2015)ではデータを一回渡しただけで終わってしまっていたので、一回データを渡して、学習の成果を見て、その成果を見つつまた良さげな学習データを渡して、という操作を繰り返そう、というのがICML2017でIterative Machine Teachingとして提案されていた.
問題設定などはまぁわからなくもないのだが、いったいどういう場面で使われるのだろうか? 機械学習で真のパラメータを知っててデータを生成するシチュエーションなんてあるか? なんかhigh-dimのデータがどうとか言ってたので、簡単な場合に結果がわかってるデータでモデルを弱く学習させてから本気でトレーニングするとか、そういう初期化の部分で使われる、というのならわかるのだが・・・.
この話には続きがあって、AAAI2015にはof Humansというセクションがある. 学校などで人間に何かを教えるときに教材を作れないか、みたいな話らしい. まぁ人間にそんなにうまいことパラメータがあるわけはないのだが、非常に理解しやすい話だし、博物館にいる猿に芸を仕込むとかそういうシチュエーションで使えたりしないのかなぁとか妄想してしまった.