Campionamento di dati e tassi di errore nei report selezionati di Audience Manager data-sampling-and-error-rates-in-selected-audience-manager-reports

Sintesi della metodologia di campionamento utilizzata per alcune relazioni, tassi di errore di campionamento e un elenco di relazioni che restituiscono informazioni basate sui dati campionati.

Rapporto di campionamento dei dati data-sampling-ratio

Alcuni Audience Manager i rapporti visualizzano i risultati in base a un set campionato della quantità totale di dati disponibili. Il rapporto tra i dati campionati è di 1:54. Per i rapporti che utilizzano dati campionati, ciò significa che i risultati si basano su 1 record su ogni set di 54 record.

Questi rapporti utilizzano dati statistici campionati perché hanno bisogno di una quantità enorme di potenza di elaborazione per generare risultati. Il campionamento consente di trovare un equilibrio tra la riduzione delle esigenze di elaborazione, il mantenimento delle prestazioni del sistema e la fornitura di risultati accurati.

Tassi di errore error-rates

Nei rapporti che generano dati di sovrapposizione possono verificarsi errori. Un errore è definito come la percentuale di record che:

  • Non avrebbero dovuto essere inclusi in un rapporto, ma sono stati aggiunti comunque.
  • Avrebbe dovuto essere incluso in un report ma è stato escluso.

È importante notare che i nostri test e modelli mostrano che il tasso di errore diminuzioni in proporzione inversa al numero di record nel set di dati. I set di dati con un numero elevato di record generano meno errori rispetto ai set con un numero limitato di record. Vediamo questa affermazione in modo più quantitativo. Come mostrato nella tabella seguente, per un determinato numero di record, il 95% dei risultati del rapporto sarà inferiore a un tasso di errore specifico.

Numero di record
Frequenza errori
500 - 1,000
Il 95% è al di sotto di un tasso di errore del 42%.
1,000 - 1,500
Il 95% è al di sotto di un tasso di errore del 34%.
10,000 - 50,000
Il 95% è al di sotto di un tasso di errore del 14%.
50,000
Il 95% è al di sotto di un tasso di errore del 6%.
100,000
Il 95% è al di sotto di un tasso di errore del 4%.
500.000 (o più)
Il 95% è al di sotto di un tasso di errore del 2%.

Utilizzo della metodologia di campionamento Minhash minhash

In base al Minhash metodologia di campionamento, Audience Manager utilizza un nuovo metodo per calcolare i stimatori di caratteristiche e segmenti sopra uno schizzo di dati con hash a una permutazione. Questo nuovo metodo produce una varianza inferiore rispetto allo stimatore standard per la somiglianza Jaccard. Consulta la sezione seguente per i rapporti che utilizzano questa metodologia.

Rapporti Che Utilizzano Dati Campionati reports-using-sampled-data

Il Audience Manager i rapporti che utilizzano i dati statistici campionati e la metodologia di campionamento Minhash includono:

Campionamento statistico
Metodologia di campionamento Minhash
Pubblico di riferimento dati (dati a livello di cliente e di segmento).
Rapporti di sovrapposizione (da caratteristica a caratteristica, da segmento a caratteristica e da segmento a segmento)
Il Dispositivi totali metrica per un Profile Merge Rule.
Raccomandazioni sulle caratteristiche
Data Explorer utilizza i dati campionati in Search e qualsiasi Saved Searches
Audience Marketplace Recommendations
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695