Show Menu
SUJETS×

Ingestion de données dans Adobe Experience Platform

Adobe Experience Platform allows you to easily import data into Platform as batch files. Examples of data to be ingested may include profile data from a flat file in a CRM system (such as a parquet file) or data that conforms to a known Experience Data Model (XDM) schema in the Schema Registry.

Prise en main

Pour suivre ce tutoriel, vous devez avoir accès à Experience Platform. If you do not have access to an IMS Organization in Experience Platform, please speak to your system administrator before proceeding.
Si vous préférez ingérer des données à l’aide des API Data Ingestion, lisez d’abord le guide de développement de l’ingestion par lots .

Espace de travail des jeux de données

The Datasets workspace within Experience Platform allows you to view and manage all of the datasets that your IMS organization has made, as well as create new ones.
Affichez l’espace de travail des jeux de données en cliquant sur Jeux de données dans le volet de navigation de gauche. L'espace de travail Jeux de données contient une liste de jeux de données, y compris des colonnes indiquant le nom, la création (date et heure), la source, le schéma et l'état du dernier lot, ainsi que la date et l'heure de la dernière mise à jour du jeu de données.
Cliquez sur l’icône de filtre en regard de la barre de recherche pour utiliser les fonctionnalités de filtrage afin de n’afficher que les jeux de données activés pour Profile.

Création d’un jeu de données

Pour créer un jeu de données, cliquez sur Créer un jeu de données dans le coin supérieur droit de l’espace de travail des jeux de données.
On the Create Dataset screen, select whether you would like to "Create Dataset from Schema" or "Create Dataset from CSV File".
Dans ce tutoriel, un schéma sera utilisé pour créer le jeu de données. Cliquez sur Créer un jeu de données à partir d’un schéma pour continuer.

Sélectionner le schéma d’un jeu de données

Dans l’écran Sélectionner un schéma , choisissez un schéma en cliquant sur la case d’option située à côté du schéma que vous souhaitez utiliser. Pour ce tutoriel, le jeu de données sera créé à l’aide du schéma Loyalty Members. L’utilisation de la barre de recherche pour filtrer les schémas est un moyen utile de trouver le schéma exact dont vous avez besoin.
Une fois que vous avez sélectionné la case d’option en regard du schéma que vous souhaitez utiliser, cliquez sur Suivant .

Configuration d’un jeu de données

On the Configure Dataset screen, you will be required to give your dataset a name and may also provide a description of the dataset as well.
Remarques sur les noms des jeux de données :
  • Les noms des jeux de données doivent être courts et descriptifs afin qu’ils puissent être facilement retrouvés par la suite dans la bibliothèque.
  • Les noms des jeux de données doivent être uniques, ce qui signifie qu’ils doivent également être suffisamment précis pour ne pas être réutilisés à l’avenir.
  • Il est recommandé de fournir des informations supplémentaires sur le jeu de données à l’aide du champ de description, car cela peut aider d’autres utilisateurs à différencier les jeux de données à l’avenir.
Une fois que le jeu de données possède un nom et une description, cliquez sur Terminer .

Activité du jeu de données

Un jeu de données vide a désormais été créé et vous avez été renvoyé à l’onglet Activité du jeu de données dans l’espace de travail des jeux de données. Vous devriez voir le nom du jeu de données dans le coin supérieur gauche de l’espace de travail, ainsi qu’une notification indiquant « Aucun lot n’a été ajouté ». Cela est normal puisque vous n’avez encore ajouté aucun lot à ce jeu de données.
On the right-hand side of the Datasets workspace you will see the Info tab containing information related to your new dataset such as dataset ID, name, description, table name, schema, streaming, and source. L’onglet Informations contient également des informations sur le moment de création du jeu de données et sa date de dernière modification.
L’onglet Informations contient également un bouton activer/désactiver de Profile qui permet d’activer votre jeu de données pour l’utiliser avec Real-time Customer Profile. Use of this toggle, and Real-time Customer Profile, will be explained in more detail in the section that follows.

Activer le jeu de données pour Real-time Customer Profile

Datasets are used for ingesting data into Experience Platform, and that data is ultimately used to identify individuals and stitch together information coming from multiple sources. Cette information collée ensemble s'appelle un Real-Time Customer Profile. In order for Platform to know which information should be included in the Real-Time Profile, datasets can be marked for inclusion using the Profile toggle.
Par défaut, ce bouton est désactivé. If you choose to toggle on Profile, all data ingested into the dataset will be used to help identify an individual and stitch together their Real-Time Profile.
To learn more about Real-time Customer Profile and working with identities, please review the Identity Service documentation.
To enable the dataset for Real-time Customer Profile, click the Profile toggle in the Info tab.
Une boîte de dialogue s’affiche vous demandant de confirmer que vous souhaitez activer le jeu de données pour Real-time Customer Profile.
Cliquez sur Activer et le bouton activer/désactiver devient bleu, indiquant qu’il est activé.

Ajout de données à un jeu de données

Les données peuvent être ajoutées à un jeu de données de différentes manières. You could choose to use Data Ingestion APIs or an ETL partner such as Unifi or Informatica. Dans ce tutoriel, les données seront ajoutées au jeu de données à l’aide de l’onglet Ajouter des données dans l’interface utilisateur.
Pour commencer à ajouter des données au jeu de données, cliquez sur l’onglet Ajouter des données . Vous pouvez désormais faire glisser et déposer des fichiers ou rechercher sur votre ordinateur les fichiers à ajouter.
Platform prend en charge deux types de fichiers pour l’ingestion de données : parquet ou JSON. Vous pouvez ajouter jusqu’à cinq fichiers à la fois, la taille maximale de chaque fichier étant de 10 Go.

Chargement d’un fichier

Once you drag and drop (or browse and select) a parquet or JSON file that you wish to upload, Platform will immediately begin to process the file and an Uploading dialog will appear on the Add Data tab showing the progress of your file upload.

Mesures de jeux de données

Une fois le chargement du fichier terminé, l’onglet Activité du jeu de données n’indique plus qu’« aucun lot n’a été ajouté ». Instead, the Dataset Activity tab now shows dataset metrics. Toutes les mesures indiqueront « 0 » à cette étape, car le lot n’a pas encore été chargé.
En bas de l’onglet se trouve une liste présentant l’ identifiant du lot des données qui venaient d’être ingérées via le processus « Ajouter des données à un jeu de données » . Sont également incluses les informations relatives au lot, y compris la date d'assimilation, le nombre d'enregistrements assimilés et l'état actuel du lot.

Détails du lot

Cliquez sur l’ identifiant du lot pour afficher un aperçu du lot , indiquant des détails supplémentaires sur le lot. Une fois le chargement du lot terminé, les informations relatives au lot sont mises à jour afin d’afficher le nombre d’enregistrements ingérés et la taille du fichier. L’état devient également "Succès" ou "Échec". Si le lot échoue, la section Code d’erreur contiendra des informations détaillées sur les erreurs survenues lors de l’ingestion.
Pour plus d’informations et pour obtenir des questions fréquentes sur l’ingestion par lots, consultez le guide de dépannage de l’ingestion par lots .
Pour revenir à l’écran Activité du jeu de données , cliquez sur le nom du jeu de données ( Loyalty Details ) dans le chemin de navigation.

Prévisualisation d’un jeu de données

Une fois que le jeu de données est prêt, une option Prévisualisation du jeu de données s’affiche en haut de l’onglet Activité du jeu de données .
Cliquez sur Prévisualisation du jeu de données pour ouvrir une boîte de dialogue présentant les données d’exemple du jeu de données. Si le jeu de données a été créé à l’aide d’un schéma, les informations concernant le schéma du jeu de données s’affichent sur le côté gauche de la prévisualisation. Vous pouvez développer le schéma à l’aide des flèches pour voir la structure du schéma. Chaque en-tête de colonne dans la prévisualisation des données représente un champ dans le jeu de données.

Étapes suivantes et ressources supplémentaires

Now that you have created a dataset and successfully ingested data into Experience Platform, you can repeat these steps to create a new dataset or ingest more data into the existing dataset.
Pour en savoir plus sur l'assimilation par lots, veuillez lire l'aperçu Batch Ingestionaperçu de l'assimilation par lots et compléter votre apprentissage en regardant la vidéo ci-dessous.
L’ Platform interface utilisateur affichée dans la vidéo suivante est obsolète. Reportez-vous à la documentation ci-dessus pour obtenir les dernières captures d'écran et fonctionnalités de l'interface utilisateur.