Show Menu
主題×

訪客叢集

訪客叢集可讓您運用客戶特性來動態分類訪客,並根據選取的資料輸入產生叢集,從而識別具有類似興趣和行為的群組,以用於客戶分析和定位。
叢集程式
叢集程式需要您識別要用作輸入的量度和維度元素,並允許您選擇特定的目標群體來套用這些元素來建立指定的叢集。 當您執行叢集程式時,系統會使用度量和維度輸入來決定指定叢集數目的適當初始中心。 然後,這些中心被用作應用K-Means算法的起點。
  • 通過樹冠叢集通道智慧選擇初始中心。
  • 通過將每個資料點與最近的中心相關聯來建立資料群集。
  • 每個K簇的平均值成為新的中心。
  • 算法在步驟2和3中重複,直到收斂。 這可能需要多次通過。
功能 Maximum Iterations 表中 Options 的分析人員可指定由叢集演算法執行的最大迭代次數。 設定此選項可導致基於最大迭代上限的群集過程更快完成,而犧牲群集中心的精確收斂。
定義群集後,可以保存群集維,以便像其他維一樣使用。 它還可以載入到群集資源管理器中,以檢查群集中心的分離情況。
在「叢集產生器」中,您可以選取 Options >以 Algorithm 在定義叢集時選取演算法。 目前,有3種支援的演算法:
  • KMeans
  • Kmeans ++
  • 期望最大化
執行叢集程式有2種方式:
  • 方法1 —— 在群集 Go 視覺化視窗中按一下。
  • 方法2 —— 在群集 Submit 可視化窗口中按一下,該窗口將群集作業直接發送到伺服器。 您可以透過「查詢的詳細狀態」選項來追蹤進度。
演算法有下列限制:
  1. 如果您使用方法1,則可以選取任何支援的叢集演算法。
  2. 如果您使用方法2,則可以選取kmeans或kmeans++。 「期望最大化」(Expectation Maximization)選項將不可用。
在檔 DPU.cfg 案中,「查詢,記憶體限制」的值預設為500 MB。 運行多個群集作業時,必須增加此值。 例如,如果您並行運行5個群集作業,請將此值增加為1 GB。 如果不重新啟動伺服器,就無法取消群集作業。
Recommendations
迭代次數(掃描資料的次數)和您配置的收斂閾值會嚴重影響群集效能。 下表提供您可遵循的更廣泛准則:
叢集數
演算法
迭代
收斂閾值
標準化
6
Kmeans
25,50
1e-3
最小——最大
6
Kmeans
25,50
1e-6
最小——最大
6
Kmeans++
50
1e-6
最小——最大