K-medoids

From Wikipedia, the free encyclopedia

k-medoids es un algoritmo de agrupamiento (del inglés clustering) relacionado con los algoritmos k-means y medoidshift. Tanto el k-medoids como el k-means son algoritmos que trabajan con particiones (dividiendo el conjunto de datos en grupos) y ambos intentan minimizar la distancia entre puntos que se añadirían a un grupo y otro punto designado como el centro de ese grupo. En contraste con el algoritmo k-means, k-medoids escoge datapoints como centros y trabaja con una métrica arbitraria de distancias entre datapoints en vez de usar la norma . En 1987 se propuso este método para el trabajo con la norma y otras distancias.

K-medoid es una técnica clásica de particionado de grupos que divide los datos conformados por n objetos en k grupos (con k conocido de antemano).

Es más robusto ante el ruido y a partes aisladas que k-means porque minimiza una suma de disimilaridades (entre pares de puntos) en vez de una suma de distancias euclidianas cuadradas.

Un medoid puede ser definido como el objeto de un grupo cuya disimilaridad media a todos los objetos en el grupo es mínima. Es el punto ubicado más hacia el centro en todo el grupo.

La aplicación práctica más común de k-medoids es el algoritmo Partición Alrededor de Medoids (PAM). PAM utiliza una búsqueda golosa que puede no encontrar la solución óptima, pero es más rápido que la búsqueda exhaustiva.Trabaja como sigue:

  1. Inicialización: seleccionar k de los n puntos como el medoid.
  2. Asociar cada punto al medoid más cercano.
  3. Mientras el costo de la configuración disminuya:
    1. Para cada medoid m, para cada no medoid o:
      1. Intercambiar m y o, recalcular el costo (suma de la distancia de los puntos a sus medoids).
      2. Si el costo total de la configuración aumentó en el paso anterior, deshacer el intercambio.

Otros algoritmos han sido sugeridos en la literatura, incluyendo el siguiente método de Iteración Voronoi:

  1. Seleccionar los medoids iniciales.
  2. Iterar mientras el costo disminuya:
    1. En cada grupo, marcar como medoid el punto que minimiza la suma de distancias dentro del grupo.
    2. Reasignar cada punto al grupo definido por el medoid más cercano determinado en el paso anterior.

Demostración de PAM

Software

Referencias

Related Articles

Wikiwand AI