局所性鋭敏型ハッシュを行うためのパラメータの集合をLSH族(Locality Sensitive Hashing Family)と呼ぶ。LSH族は距離空間
と閾値
、近似因子
によって定義される。LSH族[1][2]は2点
について次の2つの性質、
ならば
となる確率は
以上である。
ならば
となる確率は
以下である。
を満たす関数
により与えられる族であり,
は
から一様乱数にしたがって選択される。このとき
は2点
の距離を表す関数であり、
となるよう設計する。このような族
は
に鋭敏であるという。
これに準ずる定義として、領域
における類似度関数
によるものがある[3]。局所性鋭敏型ハッシュの性質は、ハッシュ関数の集合
と確率分布
により与えられる。あるハッシュ関数
は集合
から確率分布
により選ばれるが、
とは領域
に存在する2点
について、
![{\displaystyle Pr_{h\in H}[h(a)=h(b)]=\phi (a,b)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2682d7294bfd352e151fcabc2760e83a080791a9)
を満たすような確率分布である。