局所性保存射影 (Locality Preserving Projection, LPP)とラプラス固有写像 (Laplacian Eigenmap)
次元削減手法の局所性保存射影とラプラス固有写像について.これらは局所性を保存する,という特性がある.局所性とはデータの局所的な構造のことで,例えばクラスタ構造なんかがそれに当たる.PCAも含めて,これらは全て固有値問題を解くことで解を求める.この二つの手法は密接に関係している.整理のためのポスト. 局所性保存射影は,データとその類似度行列を入力とし,以下の一般化固有値問題の解である.
ここで, である.これをカーネル化することを考える.を で置き換えて,
を得る.例のごとく,と置くと,
を得て,これがカーネルLPP.さらに,とおくと,
となり,これがラプラス固有写像.
カーネルLPPで得られた射影行列を用いて,データは,と埋め込まれる.ちなみに,ラプラス固有写像の解はであり,はカーネルLPPでサンプルを射影した結果に一致する!つまり,データにカーネルLPPを施したもの=ラプラス固有写像の解,である. カーネルLPPによって,元のデータはある特徴空間へ射影される.ラプラス固有写像はその結果をダイレクトに求める.ラプラス固有写像は局所性,例えばクラスタ構造を保存するので,クラスタリングの前処理に適しているとされている.ラプラス固有写像を施した後にK-Meansなどのクラスタリングをする手法はスペクトラルクラスタリングと呼ばれ,ものすごく研究されている. 以上自分用メモ.