Show Menu
SUJETS×

Configuration d’un flux de données pour un connecteur de lot d’enregistrement cloud dans l’interface utilisateur

Un flux de données est une tâche planifiée qui récupère et ingère des données d’une source dans un Platform jeu de données. Ce didacticiel décrit la procédure à suivre pour configurer un nouveau flux de données à l’aide de votre compte d’enregistrement cloud.

Prise en main

Ce tutoriel nécessite une compréhension du fonctionnement des composants suivants d’Adobe Experience Platform :
  • Experience Data Model (XDM) Système : Cadre normalisé selon lequel Experience Platform organiser les données d’expérience client.
    • Principes de base de la composition des schémas  : découvrez les blocs de création de base des schémas XDM, y compris les principes clés et les bonnes pratiques en matière de composition de schémas.
    • Didacticiel sur l’éditeur de schéma : Découvrez comment créer des schémas personnalisés à l’aide de l’interface utilisateur de l’éditeur de Schémas.
  • Profil client en temps réel : Fournit un profil de consommation unifié en temps réel basé sur des données agrégées provenant de plusieurs sources.
De plus, ce didacticiel nécessite que vous disposiez d’un compte d’enregistrement cloud établi. Vous trouverez une liste de didacticiels pour la création de différents comptes d’enregistrement cloud dans l’interface utilisateur dans l’aperçu des connecteurs source.

Formats de fichiers pris en charge

Experience Platform prend en charge les formats de fichier suivants à ingérer à partir d’enregistrements externes :
  • Valeurs séparées par des délimiteurs (DSV) : La prise en charge des fichiers de données au format DSV est actuellement limitée aux valeurs séparées par des virgules. La valeur des en-têtes de champ des fichiers au format DSV ne doit être composée que de caractères alphanumériques et de traits de soulignement. La prise en charge des fichiers DSV généraux sera assurée à l’avenir.
  • JavaScript Object Notation (JSON) : Les fichiers de données au format JSON doivent être compatibles XDM.
  • Apache Parquet: Les fichiers de données au format Parquet doivent être compatibles XDM.

Sélectionner des données

Après avoir créé votre compte d’enregistrement de cloud, l’étape Sélectionner les données s’affiche, ce qui vous permet d’explorer la hiérarchie de votre enregistrement de cloud.
  • La moitié gauche de l'interface est un navigateur d'annuaire qui affiche les fichiers et répertoires de votre serveur.
  • La moitié droite de l'interface vous permet de prévisualisation jusqu'à 100 lignes de données à partir d'un fichier compatible.
La sélection d’un dossier répertorié vous permet de parcourir la hiérarchie de dossiers en dossiers plus profonds. Une fois que vous avez sélectionné un fichier ou un dossier compatible, la liste déroulante Sélectionner le format de données s'affiche, dans laquelle vous pouvez choisir un format pour afficher les données dans la fenêtre de prévisualisation.
Une fois la fenêtre de prévisualisation renseignée, vous pouvez sélectionner Suivant pour télécharger tous les fichiers du dossier sélectionné. Si vous souhaitez télécharger un fichier spécifique, sélectionnez-le dans la liste avant de sélectionner Suivant .

Invitation de fichiers Parquet ou JSON

Les formats de fichier pris en charge pour un compte d’enregistrement cloud incluent également JSON et Parquet. Les fichiers JSON et Parquet doivent être compatibles XDM. Pour importer des fichiers JSON ou Parquet, sélectionnez le format de fichier approprié dans le navigateur d’annuaire et appliquez un format de données compatible à partir de l’interface de droite. Sélectionnez Suivant pour continuer.
Contrairement aux types de fichiers délimités, les fichiers au format JSON et Parquet ne sont pas disponibles pour la prévisualisation.

Mappage des champs de données à un schéma XDM

L’étape Mappage s’affiche, fournissant une interface interactive permettant de mapper les données source à un Platform jeu de données. Les fichiers source mis en forme dans JSON ou Parquet doivent être compatibles XDM et ne nécessitent pas de configuration manuelle du mappage. Inversement, les fichiers CSV nécessitent de configurer explicitement le mappage, mais vous permettent de sélectionner les champs de données source à mapper.
Choisissez un jeu de données dans lequel les données entrantes doivent être assimilées. Vous pouvez soit utiliser un jeu de données existant, soit en créer un nouveau.
Utilisation d’un jeu de données existant
Pour importer des données dans un jeu de données existant, sélectionnez Jeu de données ​existant, puis sélectionnez l’icône Jeu de données.
The Select dataset dialog appears. Recherchez le jeu de données que vous souhaitez utiliser, sélectionnez-le, puis cliquez sur Continuer .
Utiliser un nouveau jeu de données
Pour importer des données dans un nouveau jeu de données, sélectionnez Nouveau jeu de données et entrez un nom et une description pour le jeu de données dans les champs fournis. Pour ajouter un schéma, vous pouvez entrer un nom de schéma existant dans la boîte de dialogue Sélectionner un schéma . Vous pouvez également sélectionner le Schéma de recherche avancée pour rechercher un schéma approprié.
Au cours de cette étape, vous pouvez activer votre jeu de données pour Real-time Customer Profile et créer une vue holistique des attributs et des comportements d’une entité. Les données de tous les jeux de données activés seront incluses dans Profile et des modifications seront appliquées lorsque vous enregistrez votre flux de données.
Active/désactive le bouton Profil dataset pour activer votre jeu de données de cible pour Profile.
The Select schema dialog appears. Sélectionnez le schéma à appliquer au nouveau jeu de données, puis sélectionnez Terminé .
Selon vos besoins, vous pouvez choisir de mapper directement les champs ou utiliser les fonctions de mappage pour transformer les données source afin de dériver des valeurs calculées ou calculées. Pour plus d’informations sur les fonctions de mappage et de mappage de données, consultez le didacticiel sur le mappage des données CSV aux champs de schéma XDM.
Platform fournit des recommandations intelligentes pour les champs à mappage automatique en fonction du schéma de cible ou du jeu de données que vous avez sélectionné. Vous pouvez ajuster manuellement les règles de mappage en fonction de vos cas d’utilisation.
Sélectionnez des données de Prévisualisation pour afficher les résultats de mappage de 100 lignes de données d’exemple au maximum du jeu de données sélectionné.
Au cours de la prévisualisation, la colonne d'identité est considérée comme le premier champ, car il s'agit des informations clés nécessaires à la validation des résultats de mappage.
Une fois les données source mises en correspondance, sélectionnez Fermer .

Planifier les exécutions d'assimilation

L'étape Planification s'affiche, ce qui vous permet de configurer un programme d'assimilation pour assimiler automatiquement les données source sélectionnées à l'aide des mappages configurés. Le tableau suivant décrit les différents champs configurables pour la planification :
Champ
Description
Fréquence
Les fréquences sélectionnables sont Once , Minute , Hour , Day et Week .
Intervalle
Entier qui définit l’intervalle pour la fréquence sélectionnée.
Début
Horodatage UTC indiquant à quel moment la première importation est prévue.
Renvoi
Valeur booléenne qui détermine quelles données sont initialement ingérées. Si le renvoi est activé, tous les fichiers actuels du chemin d’accès spécifié seront ingérés lors de la première assimilation planifiée. Si le renvoi est désactivé, seuls les fichiers chargés entre la première exécution de l’assimilation et le début de temps seront ingérés. Les fichiers chargés avant l'heure du début ne seront pas ingérés.
Les flux de données sont conçus pour intégrer automatiquement les données sur une base planifiée. Début en sélectionnant la fréquence d'ingestion. Ensuite, définissez l’intervalle pour désigner la période entre deux exécutions de flux. La valeur de l’intervalle doit être un entier non nul et doit être définie sur supérieur ou égal à 15.
Pour définir l’heure de début d’assimilation, ajustez la date et l’heure affichées dans la zone début d’heure. Vous pouvez également sélectionner l’icône de calendrier pour modifier la valeur de début. L'heure du début doit être supérieure ou égale à l'heure actuelle en UTC.
Indiquez les valeurs de la planification et sélectionnez Suivant .

Configuration d’un flux de données d’assimilation unique

Pour configurer l’assimilation unique, sélectionnez la flèche de la liste déroulante des fréquences et sélectionnez Une fois . Vous pouvez continuer à apporter des modifications à un jeu de flux de données pour une assimilation de fréquence unique, tant que le début de temps restera dans le futur. Une fois l’heure du début écoulée, la valeur de fréquence unique ne peut plus être modifiée.
L’intervalle et la Renvoi ne sont pas visibles lors d’une assimilation unique.
Une fois que vous avez fourni les valeurs appropriées à la planification, sélectionnez Suivant .

Fournir des détails sur le flux de données

L’étape de détail ​Flux de données s’affiche, vous permettant de nommer et de décrire brièvement votre nouveau flux de données.
Au cours de ce processus, vous pouvez également activer les tests de diagnostic d'assimilation partielle et d' erreur. L'activation de l'assimilation ​partielle permet d'assimiler des données contenant des erreurs, jusqu'à un certain seuil que vous pouvez définir. L’activation des diagnostics d’ erreur fournit des détails sur les données incorrectes mises en lots séparément. Pour plus d'informations, consultez la présentation de l'assimilation partielle des lots.
Fournissez des valeurs pour le flux de données et sélectionnez Suivant .

Vérifier votre flux de données

L’étape Révision s’affiche, vous permettant de vérifier votre nouveau flux de données avant sa création. Les détails sont regroupés dans les catégories suivantes :
  • Connexion : Indique le type de source, le chemin d’accès approprié du fichier source choisi et le nombre de colonnes qu’il contient.
  • Attribuer des champs de jeu de données et de mappage : Affiche le jeu de données dans lequel les données source sont ingérées, y compris le schéma auquel le jeu de données adhère.
  • Planification : Indique la principale période, fréquence et intervalle du calendrier d'assimilation.
Une fois que vous avez passé en revue votre flux de données, cliquez sur Terminer et accordez un certain temps à la création du flux de données.

Surveiller votre flux de données

Une fois le flux de données créé, vous pouvez surveiller les données ingérées pour afficher des informations sur les taux d'assimilation, la réussite et les erreurs. Pour plus d’informations sur la surveillance du flux de données, voir le didacticiel sur la surveillance des comptes et des flux de données dans l’interface utilisateur .

Supprimer votre flux de données

Vous pouvez supprimer des flux de données qui ne sont plus nécessaires ou qui ont été créés incorrectement à l’aide de la fonction Supprimer disponible dans l’espace de travail Flux de données . Pour plus d'informations sur la suppression de flux de données, consultez le didacticiel sur la suppression de flux de données dans l'interface utilisateur .

Étapes suivantes

En suivant ce didacticiel, vous avez réussi à créer un flux de données pour importer des données à partir d’un enregistrement cloud externe et à mieux comprendre la surveillance des jeux de données. Pour en savoir plus sur la création de flux de données, vous pouvez compléter votre apprentissage en regardant la vidéo ci-dessous. En outre, les données entrantes peuvent désormais être utilisées par Platform les services en aval tels que Real-time Customer Profile et Data Science Workspace. Pour plus d’informations, voir les documents suivants :
L’ Platform interface utilisateur affichée dans la vidéo suivante est obsolète. Reportez-vous à la documentation ci-dessus pour obtenir les dernières captures d'écran et fonctionnalités de l'interface utilisateur.

Annexe

Les sections suivantes fournissent des informations supplémentaires sur l’utilisation des connecteurs source.

Désactivation d’un flux de données

Lorsqu’un flux de données est créé, il devient immédiatement principal et ingère les données selon le planning qu’il a reçu. Vous pouvez désactiver un flux de données principal à tout moment en suivant les instructions ci-dessous.
Dans l’espace de travail Sources , cliquez sur l’onglet Parcourir . Cliquez ensuite sur le nom du compte associé au flux de données principal que vous souhaitez désactiver.
La page activité ​source s'affiche. Sélectionnez le flux de données principal dans la liste pour ouvrir sa colonne Propriétés sur le côté droit de l'écran, qui contient un bouton d'activation ​de la bascule. Cliquez sur la bascule pour désactiver le flux de données. La même bascule peut être utilisée pour réactiver un flux de données après sa désactivation.

Activer les données entrantes pour Profile la population

Les données entrantes provenant de votre connecteur source peuvent être utilisées pour enrichir et renseigner vos Real-time Customer Profile données. Pour plus d'informations sur le remplissage de vos Real-time Customer Profile données, consultez le didacticiel sur la population Activer les données source entrantes pour renseigner les profils client Profil.