laminación
ción de n vectores x j
, j = 1, … , n, en c grupos G i
, i=1, …, c,
y encuentra un centro de cluster en cada grupo tal que
una función de costo (o función objetivo) de desigualdad
(o distancia) medida es reducida al mínimo. Cuando la
distancia Euclideana es escogida como la medida de
desigualdad entre un vector x k
en un grupo j y el correspondiente
centro de cluster c i
, la función objetivo puede
ser definida por
donde J i
=
k,xk Gi ||x k - c i ||2 es la función objetivo dentro
del grupo i. Para simplicidad, la distancia Euclidiana es
usada como medida de desigualdad.
Los grupos son definidos por una matriz de pertenencia
U binaria c x n
Donde el elemento uij es 1 si el j-esimo dato de xj pertenece
al grupo i, y 0 de otra manera. El centro optimo
que minimiza la función objetivo es la media de todo los
vectores en el grupo i.
donde |Gi| es el tamaño de Gi.
Los cluster C-means difusos (FCM), también conocido
como ISODATA difuso es un algoritmo cluster de datos
en el cual cada punto de referencia pertenece a un cluster
a un grado especifico por un grado de pertenencia.
Bezdek propuso este algoritmo en 1973 como una mejora
del anterior algoritmo hard C-means (HCM). La función
objetivo para FCM es entonces una generalización
de la ecuación de HCM
donde u ij
esta entre 0 y 1; c i
es el cluster central del grupo
difuso i; d ij
=||c i
- x j
|| es la distancia euclidiana entre el i-esimo
cluster central y el j-esimo dato; y m es un exponente
de ponderación .
Las condiciones necesarias J.-S .R. Jang 1997 [6] para
alcanzar el mínimo de la función objetivo es
16 HIERRO yACERO/AIST MÉXICO