Show Menu
THEMEN×

Definieren von Suchtransformationen

Informationen zu den Transformationen, mit denen Sie Nachschlagedaten in den Datensatz integrieren können.
Beachten Sie, dass nicht alle Typen in beiden Phasen des Datensatzerstellungsprozesses verwendet werden können.

Kategorisieren

Die Categorize Transformation verwendet eine zweispaltige Nachschlagetabelle, die aus Paaren aus Musterzeichenfolge und Wert besteht. Während dieser Transformation liest der Data Workbench-Server jeden Ereignisdatensatz nacheinander und vergleicht den Inhalt eines angegebenen Felds im Datensatz mit jeder der in der ersten Spalte der Suchtabelle aufgeführten Musterzeichenfolgen. Wenn das angegebene Feld mit einer der Musterzeichenfolgen übereinstimmt, schreibt der Data Workbench-Server den Wert (in der zweiten Spalte zu finden), der mit dieser Musterzeichenfolge verknüpft ist, in ein angegebenes Ausgabefeld im Datensatz.
Die Zeichenfolgen in der ersten Spalte der Suchtabelle können optional mit dem Zeichen ^ beginnen und/oder mit dem Zeichen $ enden, um die Übereinstimmung am Anfang und/oder Ende zu erzwingen. Diese Transformation akzeptiert keine regulären Ausdrücke zum Definieren von Übereinstimmungsbedingungen in der ersten Spalte. Wenn der Eingabewert ein Vektor von Zeichenfolgen ist, wird jede Zeichenfolge durch die Transformation ausgeführt und das Ergebnis/die Ergebnisse werden an einen Ausgabezeichenfolgen-Vektor angehängt.
Eine Categorize Transformation ist im Allgemeinen einfacher und schneller als die Verwendung einer Regular Expression Transformation, um dasselbe zu erreichen.
Bei dem in verwendeten Teilzeichenfolgentest wird Categorize die Groß-/Kleinschreibung beachtet, sofern nicht anders mit dem Case Sensitive Parameter angegeben.
Parameter Beschreibung Standardeinstellung
Name Beschreibender Name der Transformation. Sie können hier einen beliebigen Namen eingeben.
Groß-/Kleinschreibung True oder false. Gibt an, ob beim Unterzeichenfolgentest die Groß-/Kleinschreibung beachtet wird. true (wahr)
Kommentare Optional. Anmerkungen zur Transformation.
Bedingung Die Bedingungen, unter denen diese Umwandlung angewendet wird.
Standardeinstellung Der Standardwert, der verwendet wird, wenn der Bedingungstest erfolgreich verläuft und kein Eintrag in der Kategorisierungsdatei mit der Eingabe übereinstimmt oder das Eingabefeld im angegebenen Protokolleintrag nicht definiert ist.
Trennzeichen
String, der zum Trennen der Spalten in der Lookup-Datei verwendet wird. Muss ein einzelnes Zeichen lang sein.
Wenn Sie die Strg-Taste gedrückt halten und mit der rechten Maustaste in den Trennzeichner-Parameter klicken, wird ein Menü " Einfügen "angezeigt. Dieses Menü enthält eine Liste von Sonderzeichen, die häufig als Trennzeichen verwendet werden.
Mehrfachwerte True oder false. Wenn "true", werden mehrere Zeilen in der Datei mit der Eingabe übereinstimmen, wird bei jeder Übereinstimmung ein Wert an den Ausgabevektor der Zeichenfolgen angehängt. Bei "false"wird nur die erste übereinstimmende Zeile in der Datei in der Ausgabe verwendet. Im letzteren Fall, wenn die Eingabe ein Vektor ist, ist die Ausgabe auch ein Vektor der entsprechenden Länge. Wenn die Eingabe eine einfache Zeichenfolge ist, ist die Ausgabe auch eine einfache Zeichenfolge. false (falsch)
Datei Pfad und Dateiname der Kategorisierungsdatei. Relative Pfade beziehen sich auf den Installationsordner für den Data Workbench-Server. Diese Datei befindet sich normalerweise im Ordner "Suchen"im Installationsordner des Data Workbench-Servers.
Eingabe Die Kategorisierungsdatei stimmt mit ihren Unterzeichenfolgen mit dem Wert in diesem Feld überein, um die übereinstimmende Zeile in der Datei zu identifizieren.
Ausgabe Der Name des mit dem Ergebnis verknüpften Felds.
Überlegungen zur Kategorisierung
  • Änderungen an Lookup-Dateien in Categorize Konvertierungen, die in der Transformation.cfg Datei oder in einer Transformation Dataset Include Datei definiert sind, erfordern eine erneute Transformation des Datensatzes. Suchdateien für Categorize Konvertierungen, die in der Log Processing.cfg Datei oder in einer Log Processing Dataset Include Datei definiert sind, unterliegen nicht dieser Einschränkung. Weitere Informationen zur erneuten Verarbeitung Ihrer Daten finden Sie unter Verarbeitung und Verarbeitung .
  • Categorize Konvertierungen, die in der Log Processing.cfg Datei oder in einer Log Processing Dataset Include Datei definiert sind, laden ihre Lookup-Dateien erneut, sobald sich die Lookup-Dateien ändern. Änderungen werden nicht rückwirkend angewendet, sondern gelten für alle Protokolldaten, die nach der Änderung gelesen werden.
In diesem Beispiel wird die Verwendung der Categorize Transformation zur Integration von Nachschlagedaten mit Ereignisdaten veranschaulicht, die aus dem Website-Traffic erfasst wurden. Nehmen wir an, eine bestimmte Website hat Geschäftsbereiche, und es ist erforderlich, dass Sie Vergleiche auf Grundlage des Traffic-Flusses und des durch die verschiedenen Abschnitte generierten Wertes anstellen und durchführen können. Sie können eine Lookup-Datei erstellen, die die Unterzeichenfolgen auflistet, die zur Identifizierung dieser verschiedenen Abschnitte verwendet werden.
Die Lookup-Datei Lookups\custommap.txt enthält die folgende Tabelle:
/products/
Produkte
^/Sport/
Sport
^/News/
Nachrichten
...
...
Diese Kategorisierungsdatei ordnet alles, was die Zeichenfolge "/products/"enthält, dem Wert "Produkte"zu, alles was mit "/sports/"beginnt, dem Wert "Sports"und alles, was mit "/news/"beginnt, dem Wert "News"zu. Die folgende Kategorisierungstransformation verwendet den Wert im Feld "cs-uri-stamm"als Zeichenfolge, in der wir nach einer übereinstimmenden Teilzeichenfolge suchen. Das Ergebnis der Transformation wird in das Feld x-customMap platziert.
Unter der Annahme, dass der Parameter "Mehrere Werte"auf "false"gesetzt ist, würde das Beispiel die folgenden Werte für x-customMap bei den aufgeführten Werten für cs-uri-stamm erzeugen.
cs-uri-stem
x-custommap
/sports/news/today.php
Sport
/sports/products/buy.php
Produkte
/news/headlines.php
Nachrichten
/news/products/subscribe.php
Produkte
Die Ausgabe basiert auf der Reihenfolge der Unterzeichenfolgen in der Abfragedatei. Der Stamm "cs-uri" /sports/products/buy.php gibt beispielsweise "Produkte"zurück. Obwohl der URI-Stamm mit "/sports/"beginnt, wird die Zeichenfolge "/products/"vor "/sports/"in der Lookup-Datei aufgeführt. Wenn der Parameter "Mehrere Werte"auf "true"gesetzt wurde, gibt es einen zusätzlichen Wert für x-customMap, da das letzte Beispiel zwei Zeilen in der Suchtabelle entsprechen würde: Produkte und Nachrichten.

FlatFileLookup

Die FlatFileLookup Transformation verwendet eine Nachschlagetabelle, die aus einer beliebigen Anzahl von Spalten und Zeilen besteht (auch wenn Sie sich daran erinnern, dass sie sich im Speicher befindet). Während dieser Art der Transformation liest der Data Workbench-Server jeden Ereignisdatensatz nacheinander und vergleicht den Inhalt eines angegebenen Felds im Datensatz mit jedem der Werte in einer angegebenen Spalte der Suchtabelle. Wenn eine Übereinstimmung vorliegt, schreibt der Data Workbench-Server einen oder mehrere Werte aus der übereinstimmenden Zeile in der Suchtabelle in eines oder mehrere festgelegte Ausgabefelder im Ereignisdatensatz.
Die bei dieser Transformation verwendete Nachschlagetabelle wird aus einer reduzierten Datei gefüllt, deren Speicherort Sie beim Definieren der Transformation angeben.
Parameter Beschreibung Standardeinstellung
Name Beschreibender Name der Transformation. Sie können hier einen beliebigen Namen eingeben.
Kommentare Optional. Anmerkungen zur Transformation.
Bedingung Die Bedingungen, unter denen diese Umwandlung angewendet wird.
Standardeinstellung Der Standardwert, der verwendet wird, wenn die Bedingung erfüllt ist und kein Eintrag in der Abfragedatei mit der Eingabe übereinstimmt.
Trennzeichen
String, der zum Trennen der Spalten in der Lookup-Datei verwendet wird. Muss ein einzelnes Zeichen lang sein.
Wenn Sie die Strg-Taste gedrückt halten und mit der rechten Maustaste in den Trennzeichner-Parameter klicken, wird ein Menü " Einfügen "angezeigt. Dieses Menü enthält eine Liste von Sonderzeichen, die häufig als Trennzeichen verwendet werden.
Datei Pfad und Dateiname der Lookup-Datei. Relative Pfade beziehen sich auf den Installationsordner für den Data Workbench-Server. Diese Datei befindet sich normalerweise im Ordner "Suchen"im Installationsordner von Data Workbench Server.
Kopfzeile True oder false. Gibt an, dass die erste Zeile in der Tabelle eine Kopfzeile ist, die bei der Verarbeitung ignoriert werden soll.
Eingabe Spaltenname ist der Name der Spalte, die für die Zuordnung der Eingabe zu der/den Zeilen in der Datei verwendet wird/werden. Wenn "Kopfzeile"den Wert "true"hat, kann dies der Name einer Spalte in der Lookup-Datei sein. Andernfalls muss es sich um die auf null basierende Spaltennummer handeln, mit der abgeglichen werden soll. Feldname ist der Name des Felds, das zum Suchen der Zeile in der Nachschlagedatei verwendet wird.
Mehrfachwerte
True oder false. Bestimmt, ob ein einzelner Wert (eine übereinstimmende Zeile) oder mehrere Werte zurückgegeben werden sollen (einer für jede übereinstimmende Zeile).
Hinweis: Wenn " Mehrere Werte "auf "false"gesetzt ist, müssen Sie sicherstellen, dass nicht mehrere Übereinstimmungen vorhanden sind. Wenn mehrere Übereinstimmungen auftreten, gibt es keine Garantie, welche Übereinstimmung zurückgegeben wird.
Ausgaben
Ein Vektor von Spaltenobjekten (Ergebnisse), in dem jedes Objekt durch Spalten- und Feldnamen definiert wird.
Spaltenname ist die Spalte, aus der der Ausgabewert abgerufen wird. Wenn Kopfzeile "true"ist, kann dies der Name einer Spalte in der Lookup-Datei sein. Andernfalls muss es sich um die auf null basierende Spaltennummer handeln, mit der abgeglichen werden soll.
Feldname ist der Name des Felds, das zum Erfassen der Ausgabe verwendet wird. Beachten Sie, dass dies ein Vektor von Ergebnissen sein kann, einer für jede Zeile, die identifiziert wird, wenn der Parameter "Mehrere Werte"wahr ist.
Überlegungen zuFlatFileLookup
  • Beim Abgleichen des Eingabefelds mit der Nachschlagedatei wird immer zwischen Groß- und Kleinschreibung unterschieden.
  • Änderungen an Lookup-Dateien in FlatFileLookup Konvertierungen, die in der Transformation.cfg -Datei oder in den Transformation Dataset Include -Dateien definiert sind, erfordern eine Konvertierung des Datensatzes. Nachschlagedateien für FlatFileLookup Konvertierungen, die in der Log Processing.cfg Datei oder in den Log Processing Dataset Include Dateien definiert sind, unterliegen nicht dieser Einschränkung. Weitere Informationen zur erneuten Verarbeitung Ihrer Daten finden Sie unter Verarbeitung und Verarbeitung .
  • FlatFileLookup Konvertierungen in der Log Processing.cfg Datei oder in den Log Processing Dataset Include Dateien laden ihre Lookup-Dateien erneut, sobald sich die Lookup-Dateien ändern. Änderungen werden nicht rückwirkend angewendet, sondern gelten für alle Protokolldaten, die nach der Änderung gelesen werden.
In diesem Beispiel wird die Verwendung der FlatFileLookup Transformation zur Integration von Nachschlagedaten mit Ereignisdaten veranschaulicht, die aus dem Website-Traffic erfasst wurden. Angenommen, Sie möchten Website-Partner isolieren, die Traffic zu der Website weiterleiten, und ihre Partner-IDs in benutzerfreundlichere Namen umwandeln. Anschließend können Sie die benutzerfreundlichen Namen verwenden, um erweiterte Dimensionen und Visualisierungen zu erstellen, die der Geschäftsbeziehung klarer zugeordnet sind als die Site-zu-Site-Beziehung, die für das Routing von Traffic verwendet wird.
Die Beispieltransformation durchsucht das Feld cs(referrer-query) nach dem PartnerID-Namen-Wert-Paar. Wenn sich dieses befindet, Lookups\partners.txt wird die Lookup-Datei verwendet, um den PartnerID-Wert mit den Werten in der Partner Tabellenspalte zu vergleichen. Wenn sich eine Zeile befindet, erhält das Ausgabefeld x-partner-name den Namen aus der PrintName Spalte der angegebenen Zeile.
Wenn die Suchtabelle die folgenden Informationen enthält:
ID
Partner
Gestartet
PrintName
1
P154
21.08.1999
Yahoo
2
P232
10. Juli 2000
Microsoft
3
P945
12.01.2001
Amazon
Die folgenden Beispiele würden sich wie folgt verändern:
  • Wenn cs(referrer)(PartnerID) P232 zurückgegeben hat, erhält das Feld x-partner-name den Wert "Microsoft".
  • Wenn cs(referrer)(PartnerID) P100 zurückgegeben hat, erhält das Feld x-partner-name den Wert "Kein Partner".
  • Wenn cs(referrer)(PartnerID) nichts zurückgegeben hat, erhält das Feld x-partner-name den Wert "Kein Partner", wie im Parameter Default angegeben.

ODBCLookup

Die ODBCLookup Transformation funktioniert wie eine FlatFileLookup Transformation. Der einzige Unterschied besteht darin, dass die bei dieser Transformation verwendete Nachschlagetabelle aus einer ODBC-Datenbank und nicht aus einer einfachen Datei gefüllt wird.
ODBCLookup Transformationen können nur während der Umwandlungsphase des Dataset-Aufbaus ausgeführt werden. Adobe empfiehlt, nach Möglichkeit die FlatFileLookup Transformation anstelle der ODBCLookup Transformation zu verwenden. FlatFileLookup Transformationen sind von Natur aus zuverlässiger, da sie nicht von der Verfügbarkeit eines externen Systems abhängen. Außerdem besteht weniger Risiko, dass die Suchtabelle geändert wird, wenn sie sich in einer flachen Datei befindet, die Sie lokal steuern.
Parameter Beschreibung Standardeinstellung
Name Beschreibender Name der Transformation. Sie können hier einen beliebigen Namen eingeben.
Kommentare Optional. Anmerkungen zur Transformation.
Bedingung Die Bedingungen, unter denen diese Umwandlung angewendet wird.
Datenquellenname Ein DSN, das von einem Administrator des Data Workbench-Servercomputers, auf dem der Datensatz verarbeitet wird, bereitgestellt wird und sich auf die Datenbank bezieht, aus der Daten geladen werden sollen.
Datenbankkennwort Das Kennwort, das beim Herstellen einer Verbindung zur Datenbank verwendet wird. Wenn im Datenquellen-Administrator ein Kennwort für das DSN konfiguriert wurde, bleibt dieses ggf. leer. Jedes hier bereitgestellte Kennwort setzt das für das DSN konfigurierte Kennwort im Datenquellen-Administrator außer Kraft.
Benutzer-ID der Datenbank Die beim Herstellen einer Verbindung zur Datenbank zu verwendende Benutzer-ID. Wenn im Datenquellen-Administrator eine Benutzer-ID für das DSN konfiguriert wurde, bleibt diese ggf. leer. Jede hier bereitgestellte Benutzer-ID setzt die Benutzer-ID außer Kraft, die für das DSN im Datenquellenadministrator konfiguriert wurde.
Standardeinstellung Der Standardwert, der verwendet wird, wenn die Bedingung erfüllt ist und kein Eintrag in der Abfragedatei mit der Eingabe übereinstimmt.
Eingabespalte Spaltenname ist der Spaltenname oder SQL-Ausdruck für die Daten, die mit der Eingabe abgeglichen werden. Feldname ist der Name des Felds, das die zu suchenden Daten enthält.
Mehrfachwerte
True oder false. Bestimmt, ob ein einzelner Wert (eine übereinstimmende Zeile) oder mehrere Werte zurückgegeben werden sollen (einer für jede übereinstimmende Zeile).
Hinweis: Wenn " Mehrere Werte "auf "false"gesetzt ist, müssen Sie sicherstellen, dass nicht mehrere Übereinstimmungen vorhanden sind. Wenn mehrere Übereinstimmungen auftreten, gibt es keine Garantie, welche Übereinstimmung zurückgegeben wird.
Ausgabespalten
Ein Vektor von Spaltenobjekten (Ergebnisse), bei dem jedes Objekt durch Spalten- und Feldnamen definiert wird.
Spaltenname ist der Name oder SQL-Ausdruck für die Spalte, aus der der Ausgabewert abgerufen wird. Feldname ist der Name des Felds, das zum Erfassen der Ausgabe verwendet wird.
Tabellenkennung Ein SQL-Ausdruck, der die Tabelle oder Ansicht benennt, aus der Daten geladen werden sollen. Eine typische Tabellenkennung ist die Form SCHEMA.TABLE.
  • Die Parameter "Datenquellenname", " Database User IDTabelle-ID" Database Passwordund "Tabellenname"entsprechen den Parametern der gleichen Namen, die für ODBC-Datenquellen beschrieben werden. See ODBC Data Sources .
  • Im Gegensatz zu ODBC-Datenquellen erfordern ODBCLookup Transformationen keine zunehmende ID-Spalte. See ODBC Data Sources . Das liegt daran, dass sich der Inhalt der Suchtabelle während der aktiven Ausführung des Datensatzes in keiner Weise ändern darf. Änderungen in einer Suchtabelle oder Ansicht können erst erkannt werden, wenn eine Umgestaltung erfolgt. Weitere Informationen zur erneuten Verarbeitung Ihrer Daten finden Sie unter Verarbeitung und Verarbeitung .
Angenommen, Sie möchten veraltete DNS-Datensätze in die aktualisierten Datensätze konvertieren. Beide Datensätze werden in einer SQL-Datenbank gespeichert. Zur Durchführung dieser Aufgabe würden Sie auf eine Nachschlagetabelle verweisen, die aus der Datenbank generiert wird, und die veralteten DNS-Datensätze ersetzen.
Unsere Beispieltransformation durchsucht die Protokolleinträge nach dem s-dns-Feld und, falls vorhanden, die Suchtabelle VISUAL.LOOKUP wird verwendet, um den s-dns-Eintrag mit den Einträgen in der OLDDNS Tabellenspalte zu vergleichen. Befindet sich eine Zeile in der Tabelle, erhält das Ausgabefeld s-dns den aktualisierten DNS-Datensatz aus der NEWDNS Spalte der angegebenen Zeile.