Show Menu
SUJETS×

Configuration d’un flux de données pour un connecteur de lot d’enregistrement cloud dans l’interface utilisateur

Un flux de données est une tâche planifiée qui récupère et ingère des données d'une source dans un jeu de données de la plateforme. Ce didacticiel décrit les étapes à suivre pour configurer un nouveau flux de données à l’aide de votre connecteur de base d’enregistrements de cloud.

Prise en main

Ce didacticiel nécessite une compréhension pratique des composants suivants d’Adobe Experience Platform :
  • Système de modèle de données d’expérience (XDM) : Cadre normalisé selon lequel la plate-forme d’expérience organise les données d’expérience client.
    • Principes de base de la composition des schémas : Découvrez les éléments de base des schémas XDM, y compris les principes clés et les meilleures pratiques en matière de composition des schémas.
    • Didacticiel sur l’éditeur de Schéma : Découvrez comment créer des schémas personnalisés à l’aide de l’interface utilisateur de l’éditeur de Schémas.
  • Profil client en temps réel : Fournit un profil de consommation unifié en temps réel basé sur des données agrégées provenant de plusieurs sources.
De plus, ce didacticiel nécessite que vous ayez déjà créé un connecteur d’enregistrement de cloud. Vous trouverez une liste de didacticiels pour la création de différents connecteurs d’enregistrement de cloud dans l’interface utilisateur dans l’aperçu des connecteurs source.

Formats de fichiers pris en charge

Experience Platform prend en charge les formats de fichier suivants à assimiler à partir d’enregistrements externes :
  • Valeurs séparées par des délimiteurs (DSV) : La prise en charge des fichiers de données au format DSV est actuellement limitée aux valeurs séparées par des virgules. La valeur des en-têtes de champ des fichiers au format DSV ne doit être composée que de caractères alphanumériques et de traits de soulignement. La prise en charge des fichiers DSV généraux sera assurée à l’avenir.
  • Notation d’objet JavaScript (JSON) : Les fichiers de données au format JSON doivent être compatibles XDM.
  • Apache Parquet : Les fichiers de données au format Parquet doivent être compatibles XDM.

Sélectionner des données

Après avoir créé votre connecteur d’enregistrement de cloud, l’étape Sélectionner les données s’affiche, ce qui vous permet d’explorer la hiérarchie de votre enregistrement de cloud.
  • La moitié gauche de l'interface est un navigateur d'annuaire qui affiche les fichiers et répertoires de votre serveur.
  • La moitié droite de l'interface vous permet de prévisualisation jusqu'à 100 lignes de données à partir d'un fichier compatible.
Le fait de cliquer sur un dossier répertorié vous permet de parcourir la hiérarchie de dossiers en dossiers plus profonds. Une fois que vous avez sélectionné un fichier ou un dossier compatible, la liste déroulante Sélectionner le format de données s'affiche, dans laquelle vous pouvez choisir un format pour afficher les données dans la fenêtre de prévisualisation.
Une fois la fenêtre de prévisualisation renseignée, vous pouvez cliquer sur Suivant pour télécharger tous les fichiers du dossier sélectionné. Si vous souhaitez télécharger un fichier spécifique, sélectionnez-le dans la liste avant de cliquer sur Suivant .
Les formats de fichier pris en charge sont CSV, JSON et Parquet. Les fichiers JSON et Parquet doivent être compatibles XDM.

Mappage des champs de données à un schéma XDM

L’étape Mappage s’affiche, fournissant une interface interactive permettant de mapper les données source à un jeu de données de plateforme. Les fichiers source mis en forme dans JSON ou Parquet doivent être compatibles XDM et ne nécessitent pas de configuration manuelle du mappage. Inversement, les fichiers CSV nécessitent de configurer explicitement le mappage, mais vous permettent de sélectionner les champs de données source à mapper.
Choisissez un jeu de données dans lequel les données entrantes doivent être assimilées. Vous pouvez soit utiliser un jeu de données existant, soit en créer un nouveau.
Utiliser un jeu de données existant
Pour importer des données dans un jeu de données existant, sélectionnez Utiliser un jeu de données existant, puis cliquez sur l’icône Jeu de données.
La boîte de dialogue Sélectionner un jeu de données s'affiche. Recherchez le jeu de données que vous souhaitez utiliser, sélectionnez-le, puis cliquez sur Continuer .
Utiliser un nouveau jeu de données
Pour importer des données dans un nouveau jeu de données, sélectionnez Créer un jeu de données et saisissez un nom et une description pour le jeu de données dans les champs fournis. Cliquez ensuite sur l’icône schéma.
La boîte de dialogue Sélectionner un schéma s'affiche. Sélectionnez le schéma à appliquer au nouveau jeu de données, puis cliquez sur Terminé .
Selon vos besoins, vous pouvez choisir de mapper directement les champs ou utiliser les fonctions de mappage pour transformer les données source afin de dériver des valeurs calculées ou calculées. Pour plus d’informations sur les fonctions de mappage et de mappage de données, consultez le didacticiel sur le mappage des données CSV aux champs de schéma XDM.
Une fois les données source mises en correspondance, cliquez sur Suivant .

Planifier les exécutions d'assimilation

L'étape Planification s'affiche, ce qui vous permet de configurer un programme d'assimilation pour assimiler automatiquement les données source sélectionnées à l'aide des mappages configurés. Le tableau suivant décrit les différents champs configurables pour la planification :
Champ
Description
Fréquence
Les fréquences sélectionnées sont les suivantes : Minute, Heure, Jour et Semaine.
Intervalle
Entier qui définit l’intervalle pour la fréquence sélectionnée.
Début
Horodatage UTC pour lequel la toute première importation aura lieu.
Renvoi
Valeur booléenne qui détermine quelles données sont initialement ingérées. Si le renvoi est activé, tous les fichiers actuels du chemin d’accès spécifié seront ingérés lors de la première assimilation planifiée. Si le renvoi est désactivé, seuls les fichiers chargés entre la première exécution de l’assimilation et le délai de Début seront ingérés. Les fichiers chargés avant l'heure de Début ne seront pas ingérés.
Les flux de données sont conçus pour intégrer automatiquement les données sur une base planifiée. Si vous souhaitez effectuer une seule assimilation via ce flux de travail, vous pouvez le faire en configurant la fréquence sur "Jour" et en appliquant un nombre très élevé pour l’ intervalle , tel que 10000 ou un nombre similaire.
Indiquez les valeurs de la planification et cliquez sur Suivant .

Nommer votre flux de données

L’étape de flux ** Nom s’affiche, vous permettant de nommer et de fournir une brève description de votre nouveau flux de données.
Fournissez des valeurs pour le flux de données et cliquez sur Suivant .

Vérifier votre flux de données

L’étape Révision s’affiche, vous permettant de vérifier votre nouveau flux de données avant sa création. Les détails sont regroupés dans les catégories suivantes :
  • Détails de la source : Indique le type de source, le chemin d’accès approprié du fichier source choisi et le nombre de colonnes qu’il contient.
  • Détails de la Cible : Affiche le jeu de données dans lequel les données source sont ingérées, y compris le schéma auquel le jeu de données adhère.
  • Détails de la planification : Affiche la période active, la fréquence et l'intervalle du programme d'assimilation.
Une fois que vous avez passé en revue votre flux de données, cliquez sur Terminer et accordez un certain temps à la création du flux de données.

Surveiller votre flux de données

Une fois le flux de données de votre enregistrement cloud créé, vous pouvez surveiller les données qui y sont ingérées. Pour plus d’informations sur la surveillance des jeux de données, voir le didacticiel sur la surveillance des flux de données en flux continu.

Étapes suivantes

En suivant ce didacticiel, vous avez réussi à créer un flux de données pour importer des données à partir d’un enregistrement cloud externe et à mieux comprendre la surveillance des jeux de données. Les données entrantes peuvent désormais être utilisées par les services Plateforme en aval, tels que le Profil client en temps réel et l’espace de travail Data Science. Pour plus d’informations, voir les documents suivants :

Annexe

Les sections suivantes fournissent des informations supplémentaires sur l’utilisation des connecteurs source.

Désactivation d’un flux de données

Lorsqu’un flux de données est créé, il devient immédiatement actif et ingère les données selon le planning qu’il a reçu. Vous pouvez désactiver un flux de données actif à tout moment en suivant les instructions ci-dessous.
Dans l’espace de travail Sources , cliquez sur l’onglet Parcourir . Cliquez ensuite sur le nom du compte associé au flux de données actif que vous souhaitez désactiver.
La page activité source s'affiche. Sélectionnez le flux de données actif dans la liste pour ouvrir sa colonne Propriétés sur le côté droit de l'écran, qui contient un bouton d'activation ​** de la bascule. Cliquez sur la bascule pour désactiver le flux de données. La même bascule peut être utilisée pour réactiver un flux de données après sa désactivation.

Activer les données entrantes pour la population de Profils

Les données entrantes de votre connecteur source peuvent être utilisées pour enrichir et renseigner vos données de Profil client en temps réel. Pour plus d’informations sur le renseignement de vos données de Profil client réel, voir le didacticiel sur la population de Profils.