‘tanimoto coefficient’ タグのついている投稿

tanimoto係数のメモ

2009年9月16日 水曜日

オブジェクト間の類似度を測る方法の一つにtanimoto係数というのがあります。wikipediaには集合間の類似度を求めるとの説明がありますが、オブジェクトはプロパティの集合なので別に問題はありませんね。

定義はwikipediaの通りなのですが、日本語では無いので書いておきます。
<br />
\begin{eqnarray}<br />
T(A,B)=\frac{ A\cdot B }{ |A|^2+|B|^2-A\cdot B}<br />
\end{eqnarray}<br />
この値はベクトルAとBが完全に一致した場合は1、全く一致しない場合は0になるので正規化等する必要もなく使い易いですね。もちろん1に近いほど類似度は高くなります。

(続きを読む…)