Daten-Sampling und Fehlerraten in ausgewählten Audience Manager-Berichten data-sampling-and-error-rates-in-selected-audience-manager-reports

Eine Zusammenfassung der für einige Berichte verwendeten Stichprobenmethodik, Stichprobenfehlerraten und eine Liste von Berichten, die Informationen auf der Grundlage von Stichprobendaten liefern.

Daten-Sampling-Verhältnis data-sampling-ratio

Einige Audience Manager -Berichte zeigen Ergebnisse basierend auf einem Stichprobensatz der insgesamt verfügbaren Datenmenge an. Das Datenverhältnis der Stichprobe beträgt 1:54. Für Berichte, die Stichprobendaten verwenden, bedeutet dies, dass Ihre Ergebnisse auf 1 Datensatz aus jedem Satz von 54 Datensätzen basieren.

Diese Berichte verwenden Daten aus statistischen Stichproben, da sie eine enorme Rechenleistung benötigen, um Ergebnisse zu erzielen. Das Sampling hilft, ein Gleichgewicht zwischen reduzierten Rechenanforderungen, der Aufrechterhaltung der Systemleistung und der Bereitstellung genauer Ergebnisse zu finden.

Fehlerraten error-rates

Fehler können in Berichten auftreten, die Überlagerungsdaten generieren. Ein Fehler ist definiert als der Prozentsatz der Datensätze, die:

  • Hätte nicht in einen Bericht aufgenommen, aber trotzdem hinzugefügt werden sollen.
  • Sollte in einen Bericht aufgenommen, aber nicht berücksichtigt werden.

Beachten Sie, dass unsere Tests und Modelle zeigen, dass die Fehlerrate um einen umgekehrten Anteil an der Anzahl der Datensätze in Ihrem Datensatz abnimmt. Datensätze mit vielen Datensätzen erzeugen weniger Fehler als Datensätze mit einer geringen Anzahl von Datensätzen. Sehen wir uns diese Behauptung quantitativer an. Wie in der folgenden Tabelle dargestellt, liegen 95 % der Berichtsergebnisse bei einer bestimmten Datensatzanzahl unter einer bestimmten Fehlerrate.

Anzahl Datensätze
Fehlerrate
500-1.000
95 % weisen eine Fehlerrate von 42 % auf.
1.000-1.500
95 % weisen eine Fehlerrate von 34 % auf.
10.000 - 50.000
95 % weisen eine Fehlerrate von 14 % auf.
50.000
95 % weisen eine Fehlerrate von 6 % auf.
100.000
95 % weisen eine Fehlerrate von 4 % auf.
500.000 (oder mehr)
95 % weisen eine Fehlerrate von 2 % auf.

Verwenden der Minhash-Sampling-Methode minhash

Basierend auf der Sampling-Methode Minhash verwendet Audience Manager eine neuartige Methode, um Eigenschaften- und Segmentschätzungen auf einer Datenskizze "One Permutation Hashing"zu berechnen. Diese neue Methode erzeugt eine geringere Varianz als der Standardschätzer für die Ähnlichkeit von Jaccard. Im folgenden Abschnitt finden Sie die Berichte, die diese Methode verwenden.

Berichte mit Stichprobendaten reports-using-sampled-data

Zu den Audience Manager-Berichten, die statistische Stichprobendaten und die Minhash-Stichprobenmethode verwenden, gehören:

Statistische Auswahl
Minhash-Sampling-Methode
AddressableAudiences (Daten auf Kunden- und Segmentebene).
Überlagerungsberichte (Eigenschaft zu Eigenschaft, Segment zu Eigenschaft und Segment zu Segment)
Die Metrik Geräte insgesamt für Profile Merge Rule.
Eigenschaftenempfehlungen
DataExplorer verwendet gesampelte Daten im Search Tab und beliebige Saved Searches
Audience Marketplace Recommendations
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695