Show Menu
화제×

방문자 클러스터링

방문자 클러스터링을 사용하면 고객 특성을 활용하여 방문자를 다이내믹하게 분류하고 선택한 데이터 입력을 기반으로 클러스터 세트를 생성할 수 있으므로 고객 분석 및 타깃팅에 대해 유사한 관심사와 행동을 갖는 그룹을 식별할 수 있습니다.
클러스터링 프로세스
클러스터링 프로세스에서는 입력으로 사용할 지표 및 차원 요소를 식별해야 하며, 특정 대상 모집단을 선택하여 이러한 요소를 적용하여 지정된 클러스터를 만들 수 있습니다. 클러스터링 프로세스를 실행할 때 시스템은 지표 및 차원 입력을 사용하여 지정된 클러스터 수에 적합한 초기 센터를 결정합니다. 그런 다음 이러한 중심은 K-Means 알고리즘을 적용하는 시작점으로 사용됩니다.
  • 초기 중심은 캐노피 클러스터링 경로를 통해 지능적으로 선택됩니다.
  • 데이터 클러스터는 모든 데이터 포인트를 가장 가까운 센터에 연결하여 만듭니다.
  • 각 K 클러스터의 평균은 새로운 중심이 됩니다.
  • 수렴에 도달할 때까지 2단계와 3단계에서 알고리즘이 반복됩니다. 여러 개의 패스를 사용할 수 있습니다.
분석가는 Maximum Iterations Options 메뉴에서 클러스터링 알고리즘에 의해 수행할 최대 반복 횟수를 지정할 수 있습니다. 이 옵션을 설정하면 클러스터 센터의 정확한 컨버전스를 사용하지 않고도 최대 반복 횟수를 기반으로 클러스터링 프로세스가 보다 빠르게 완료될 수 있습니다.
클러스터가 정의되면 클러스터 차원을 저장하여 다른 차원과 마찬가지로 사용할 수 있습니다. 또한 클러스터 탐색기에 로드하여 클러스터 센터의 분리를 검사할 수도 있습니다.
클러스터 빌더에서 클러스터를 정의할 때 Options > Algorithm 을 선택하여 알고리즘을 선택할 수 있습니다. 현재 지원되는 알고리즘은 다음과 같습니다.
  • KMeans
  • Kmeans ++
  • 기대 최대화
클러스터링 프로세스는 다음 두 가지 방법으로 실행할 수 있습니다.
  • 방법 1 - 클러스터 시각화 Go 창에서 클릭합니다.
  • 방법 2 - 클러스터 시각화 Submit 창에서 을 클릭하여 클러스터링 작업을 서버에 직접 보냅니다. "쿼리에 대한 세부 상태" 옵션을 통해 진행 상황을 추적할 수 있습니다.
알고리즘에는 다음과 같은 제한이 있습니다.
  1. 방법 1을 사용하는 경우 지원되는 클러스터링 알고리즘을 선택할 수 있습니다.
  2. 방법 2를 사용하는 경우 kmeans 또는 kmeans++를 선택할 수 있습니다. 예상 최대화 옵션을 사용할 수 없습니다.
파일에서 '쿼리, 메모리 제한'의 값은 기본적으로 500MB로 설정됩니다. DPU.cfg 여러 클러스터링 작업을 실행하는 동안 이 값을 늘려야 합니다. 예를 들어 5개의 클러스터링 작업을 동시에 실행하는 경우 이 값을 1GB로 높이십시오. 서버를 다시 시작하지 않으면 클러스터링 작업을 취소할 수 없습니다.
권장 사항
반복 횟수(데이터를 스캔한 횟수) 및 구성하는 수렴 임계값은 클러스터링 성능에 크게 영향을 줍니다. 다음 표는 사용자가 따를 수 있는 더 광범위한 지침을 제공합니다.
클러스터 수
알고리즘
반복
컨버전스 임계값
표준화
6
Kmeans
25,50
1e-3
최소-최대
6
Kmeans
25,50
1e-6
최소-최대
6
Kmeans++
50
1e-6
최소-최대