Show Menu
TEMAS×

Generación de clústeres

Seleccione las variables de entrada, el número de clústeres y una población de destino (si lo desea) para definir clústeres en el conjunto de datos.
Generación de clústeres
  1. Abra el Cluster Builder .
    Haga clic en Visualización > Análisis predictivos > Clúster > Generador de clústeres .
  2. Seleccione las variables de entrada.
    • Para agregar métricas a la Input Variables lista, seleccione en el Metric menú de la barra de herramientas.
    • Agregue elementos de dimensión a la Input Variables lista arrastrándolos desde una tabla de dimensión.
      Pulse Ctrl + Alt y arrastre los elementos de dimensión seleccionados a la Input Variables lista o al Element cuadro de la barra de herramientas.
      De forma predeterminada, la agrupación en clúster se realiza en todo el conjunto de datos. Puede ver todas las variables de entrada en el Preprocessing panel izquierdo.
  3. Utilice el Options menú para seleccionar el número deseado de clústeres.
  4. Si desea agrupar un subconjunto de Visitantes en el conjunto de datos, puede definir un filtro de población.
    Comience definiendo el subconjunto deseado mediante las selecciones realizadas en el espacio de trabajo o mediante el uso del Filter Editor . Una vez seleccionado el subconjunto deseado, establezca la opción Población de destino en el Options menú. Se recomienda asignar al grupo objetivo un nombre de identificación.
    El Options menú también tiene opciones para controlar el número máximo de pasadas y el umbral aceptable para la convergencia central.
  5. Una vez configuradas las entradas y las opciones, haga clic en el botón Ir para ejecutar el agrupamiento de forma local o presione Submit para enviar la tarea al servidor de análisis predictivo. Los envíos al servidor guardarán la dimensión resultante en el conjunto de datos cuando se complete la convergencia.
    Cuando se ejecuta localmente, verá que el Generador de clústeres se mueve a través de cuatro etapas de agrupación en clústeres de dosel, ya que define centros inteligentes basados en las entradas.
    Una vez que los centros de los clústeres dejan de cambiar más que el umbral de convergencia especificado, la dimensión de clúster se convierte y el Generador de clústeres muestra información adicional sobre la importancia de una entrada para cada clúster.
  6. Personalice los clústeres.
    Al hacer clic con el botón derecho en la barra de color de las estadísticas, se abre un menú contextual que permite personalizar los umbrales de relevancia y, en el caso de las distribuciones de elementos de dimensión, elegir qué prueba se muestra.
    Las entradas de métricas proporcionan una prueba t para cada clúster, mientras que las entradas de elementos de dimensión proporcionan tres pruebas de distribución (Chi squared, una estadística U de entropía y la estadística V de Cramer) para cada clúster.
    Si agrega o elimina entradas durante la convergencia, el proceso se detendrá hasta que vuelva a pulsar Ir .
    Después de crear clústeres, puede abrir el selector de color para asignar colores a diferentes resultados de distribución.
  7. Con la dimensión de clúster convergente, puede agregar métricas a la tabla y realizar selecciones de forma normal. También puede hacer clic con el botón derecho en los nombres de elementos (Cluster 1, Cluster 2, etc.) para abrir el menú contextual y cambiarles el nombre por otro más significativo.
  8. Si desea utilizar esta dimensión de clúster en otras visualizaciones, puede Save hacerlo localmente o Submit en el servidor.
Si desea volver a ejecutar la convergencia o ver la pertinencia de las entradas, el Generador de clústeres también puede cargar las dimensiones de clúster existentes.
Cuando se selecciona, Reset se liberan completamente todas las variables de entrada y se proporciona una visualización en blanco del generador de clústeres para definir nuevos clústeres.