Show Menu
ARGOMENTI×

Clustering visitatore

Il clustering dei visitatori consente di sfruttare le caratteristiche dei clienti per classificare in modo dinamico i visitatori e generare set di cluster basati su input di dati selezionati, identificando così i gruppi che hanno interessi e comportamenti simili per l'analisi e il targeting dei clienti.
Processo di cluster
Il processo di clustering richiede l'identificazione di metriche ed elementi dimensionali da utilizzare come input e consente di scegliere una popolazione target specifica per applicare questi elementi per creare cluster specifici. Quando si esegue il processo di clustering, il sistema utilizza gli input di metrica e dimensione per determinare i centri iniziali appropriati per il numero specificato di cluster. Questi centri vengono quindi utilizzati come punto di partenza per applicare l'algoritmo K-Means.
  • I centri iniziali vengono scelti in modo intelligente tramite un passaggio di Clustering Canopy.
  • I cluster di dati vengono creati associando ogni punto dati al centro più vicino.
  • La media di ciascun cluster K diventa il nuovo centro.
  • L'algoritmo viene ripetuto nei passaggi 2 e 3 fino al raggiungimento della convergenza. Questo può richiedere più passaggi.
Il Maximum Iterations Options menu consente all'analista di specificare il numero massimo di iterazioni da eseguire dall'algoritmo di clustering. L'impostazione di questa opzione può comportare un completamento più rapido del processo di clustering basato sul limite massimo di iterazioni a scapito della convergenza esatta dei centri cluster.
Una volta definiti i cluster, la Dimensione cluster può essere salvata per l'utilizzo come qualsiasi altra dimensione. È inoltre possibile caricarlo in Esplora cluster per esaminare la separazione dei centri cluster.
In Generatore cluster, potete selezionare Options > Algorithm per selezionare gli algoritmi al momento della definizione dei cluster. Attualmente, sono supportati 3 algoritmi:
  • KMeans
  • Kway ++
  • Ottimizzazione delle aspettative
Il processo di clustering può essere eseguito in due modi:
  • Metodo 1 - Fare clic Go nella finestra di visualizzazione del cluster.
  • Metodo 2 - Fare clic Submit nella finestra di visualizzazione del cluster, che invia direttamente il processo di clustering al server. Potete tenere traccia dell’avanzamento tramite l’opzione "Stato dettagliato per la query".
L'algoritmo presenta le seguenti limitazioni:
  1. Se si utilizza il metodo 1, è possibile selezionare uno qualsiasi degli algoritmi di clustering supportati.
  2. Se si utilizza il metodo 2, è possibile selezionare kmedium o kmedium++. L'opzione Ottimizzazione attesa non sarà disponibile.
Nel DPU.cfg file, il valore per 'Query, Limite di memoria' è impostato su 500 MB per impostazione predefinita. Questo valore deve essere aumentato durante l'esecuzione di più processi di clustering. Ad esempio, se eseguite 5 processi di clustering in parallelo, aumentate questo valore a 1 GB. Non è possibile annullare il processo di clustering senza riavviare il server.
Consigli
Il numero di iterazioni (il numero di volte che i dati vengono sottoposti a scansione) e la soglia di convergenza configurata, influiscono notevolmente sulle prestazioni del clustering. La tabella seguente contiene una linea guida più ampia che potete seguire:
Numero di cluster
Algoritmo
Iterazioni
Soglia convergenza
Normalizzazione
6
Kway
25,50
1e-3
Min-Max
6
Kway
25,50
1e-6
Min-Max
6
KMedia+
50
1e-6
Min-Max