Show Menu
主題×

計算傾向得分

定義「傾向評分」的統計計算。
從概念上講,為每個訪客計算的分數是指定事件(由目標篩選器定義)可能發生的估計概率,導致分數值範圍從0到100%。 該評分過程利用現有樣本作為訓練資料,尋找事件概率與所選獨立興趣變數之間的關係。
在數學上,這些關係反映在每個獨立變數的關聯的每個量化值中。 這些值稱為模型系數。 ScoreDim目前使用迭代重加權最小二乘(IRLS)算法來估計模型系數。 IRLS多次通過樣本,直到電流通過和前一次通過的系數差小於1.0e-6,此時稱為收斂 。 但是,IRLS可能無法達到收斂的目的。
在這種情況下,模型訓練迭代將在
  • 系數差變大,
  • 已達1,000次,或
  • 數學錯誤會阻止繼續迭代。
如果IRLS不收斂,則使用一種稱為隨機梯度下降(SGD)的備份算法。 新加坡元也將多次檢閱訓練樣本。 但與IRLS不同,SGD模型系數受到控制,使得迭代間的差值總是以指數形式減小。 同樣地,當系數差小於1.0e-6或100,000道次時,SGD將終止。 IRLS故障和SGD接合將記錄在跟蹤日誌中。
對於這兩種算法,並非所有樣本都會進入模型訓練。 目前80%用於培訓模型。 在模型訓練後,剩餘的20%樣本將用於根據混淆矩陣計算的準確性、召回率和精確度來評估模型強度。 接近100%時,得分模型越好。