Show Menu
화제×

성향 점수 계산

성향 점수에 대한 통계 계산은 정의됩니다.
개념적으로, 각 방문자에 대해 계산된 점수는 지정된 이벤트(대상 필터에 의해 정의됨)가 발생할 수 있는 예상 가능성으로, 점수 값 범위는 0에서 100%입니다. 점수 지정 절차에서는 기존 샘플을 교육 데이터로 사용하여 이벤트 확률과 선택된 개별 관심 변수 간의 관계를 찾습니다.
수학적으로, 이러한 관계는 각 독립 변수에 연관된 각 수량 값에 반영됩니다. 이러한 값을 모델 계수라고 합니다. ScoreDim은 현재 IRLS(Iterially Reweited Lite Square) 알고리즘을 사용하여 모델 계수를 예측합니다. IRLS는 현재 패스와 이전 패스의 계수의 차이가 1.0e-6보다 작아 융합이라고 ​합니다. 그러나 데이터에 따라 IRLS가 컨버전스에 도달할 수 없을 수 있습니다.
이 경우 모델 교육 반복은
  • 계수 차이가 더 작은 대신 더 커집니다
  • 1,000개의 패스에 도달했거나
  • 수학적 오류로 인해 반복을 계속할 수 없습니다.
IRLS가 수렴되지 않으면 SGD(Stochastic Gradient Reshed)라는 백업 알고리즘이 사용됩니다. SGD는 또한 여러 번 트레이닝 샘플을 조사합니다. 그러나 IRLS와 달리 SGD 모델 계수는 반복의 차이가 항상 지수 방식으로 감소하도록 제어됩니다. 마찬가지로 SGD는 계수 차이가 1.0e-6 또는 100,000회 이하에 도달하면 종료됩니다. IRLS 오류 및 SGD 참여는 추적 로그에 기록됩니다.
두 알고리즘의 경우 모든 샘플이 모델 트레이닝으로 이동되는 것은 아닙니다. 80%는 현재 모델을 훈련하는데 사용되고 있습니다. 모델을 교육한 후 나머지 20% 샘플을 사용하여 혼동 매트릭스에서 계산된 정확도, 리콜 및 정밀도 측면에서 모델 강도를 평가하게 됩니다. 100%에 가까울수록 점수 모델이 좋아집니다.