tanimoto係数のメモ

オブジェクト間の類似度を測る方法の一つにtanimoto係数というのがあります。wikipediaには集合間の類似度を求めるとの説明がありますが、オブジェクトはプロパティの集合なので別に問題はありませんね。

定義はwikipediaの通りなのですが、日本語では無いので書いておきます。
[tex]
\begin{eqnarray}
T(A,B)=\frac{ A\cdot B }{ |A|^2+|B|^2-A\cdot B}
\end{eqnarray}
[/tex]
この値はベクトルAとBが完全に一致した場合は1、全く一致しない場合は0になるので正規化等する必要もなく使い易いですね。もちろん1に近いほど類似度は高くなります。

Continue reading “tanimoto係数のメモ”