Show Menu
TEMAS×

Configuración de un flujo de datos para un conector de almacenamiento de nube en la interfaz de usuario

Un flujo de datos es una tarea programada que recupera e ingiere datos de un origen a un conjunto de datos de la Plataforma. Este tutorial proporciona pasos para configurar un nuevo flujo de datos mediante el conector base del almacenamiento de nube.

Primeros pasos

Este tutorial requiere un conocimiento práctico de los siguientes componentes de Adobe Experience Platform:
  • Sistema de modelo de datos de experiencia (XDM): Marco normalizado mediante el cual la plataforma de experiencias organiza los datos de experiencia del cliente.
    • Conceptos básicos de la composición de esquemas: Obtenga información sobre los componentes básicos de los esquemas XDM, incluidos los principios clave y las prácticas recomendadas en la composición de esquemas.
    • Tutorial del Editor de Esquemas: Obtenga información sobre cómo crear esquemas personalizados mediante la interfaz de usuario del Editor de Esquemas.
  • Perfil del cliente en tiempo real: Proporciona un perfil de consumo unificado y en tiempo real basado en datos agregados de varias fuentes.
Además, este tutorial requiere que ya haya creado un conector de almacenamiento de nube. Encontrará una lista de tutoriales para crear diferentes conectores de almacenamiento en la interfaz de usuario en la descripción general de los conectores de origen.

Formatos de archivo compatibles

La plataforma de experiencia admite los siguientes formatos de archivo para la ingesta desde almacenamientos externos:
  • Valores separados por delimitadores (DSV): Actualmente, la compatibilidad con archivos de datos con formato DSV está limitada a valores separados por comas. El valor de los encabezados de campo dentro de archivos con formato DSV solo debe consistir en caracteres alfanuméricos y guiones bajos. En el futuro se proporcionará compatibilidad con archivos DSV generales.
  • Notación de objetos JavaScript (JSON): Los archivos de datos con formato JSON deben ser compatibles con XDM.
  • Apache Parquet: Los archivos de datos con formato de parqué deben ser compatibles con XDM.

Seleccionar datos

Después de crear el conector de almacenamiento de nube, aparece el paso Seleccionar datos , que proporciona una interfaz interactiva para explorar la jerarquía de almacenamientos de nube.
  • La mitad izquierda de la interfaz es un navegador de directorios, que muestra los archivos y directorios del servidor.
  • La mitad derecha de la interfaz permite la previsualización de hasta 100 filas de datos desde un archivo compatible.
Si hace clic en una carpeta de la lista, podrá recorrer la jerarquía de carpetas para colocarla en carpetas más profundas. Una vez seleccionado un archivo o carpeta compatible, aparece la lista desplegable Seleccionar formato de datos, donde puede elegir un formato para mostrar los datos en la ventana previsualización.
Una vez que se complete la ventana de previsualización, puede hacer clic en Siguiente para cargar todos los archivos de la carpeta seleccionada. Si desea cargar en un archivo específico, selecciónelo en el listado antes de hacer clic en Siguiente .
Los formatos de archivo admitidos son CSV, JSON y Parquet. Los archivos JSON y Parquet deben ser compatibles con XDM.

Asignación de campos de datos a un esquema XDM

Aparece el paso Asignación , que proporciona una interfaz interactiva para asignar los datos de origen a un conjunto de datos de la plataforma. Los archivos de origen formateados en JSON o Parquet deben ser compatibles con XDM y no requieren la configuración manual de la asignación. Los archivos CSV, por el contrario, requieren que configure explícitamente la asignación, pero permiten elegir los campos de datos de origen que se asignarán.
Elija un conjunto de datos para los datos de entrada en los que se van a ingerir. Puede usar un conjunto de datos existente o crear uno nuevo.
Usar un conjunto de datos existente
Para ingerir datos en un conjunto de datos existente, seleccione Utilizar conjunto de datos existente y, a continuación, haga clic en el icono de conjunto de datos.
Aparece el cuadro de diálogo Seleccionar conjunto de datos . Busque el conjunto de datos que desee utilizar, selecciónelo y haga clic en Continuar .
Usar un nuevo conjunto de datos
Para ingestar datos en un nuevo conjunto de datos, seleccione Crear nuevo conjunto de datos e introduzca un nombre y una descripción para el conjunto de datos en los campos proporcionados. A continuación, haga clic en el icono de esquema.
Aparecerá el cuadro de diálogo Seleccionar esquema . Seleccione el esquema que desee aplicar al nuevo conjunto de datos y haga clic en Finalizado .
En función de sus necesidades, puede elegir asignar los campos directamente o utilizar funciones de asignador para transformar los datos de origen para derivar valores calculados o calculados. Para obtener más información sobre la asignación de datos y las funciones del asignador, consulte el tutorial sobre la asignación de datos CSV a campos de esquema XDM.
Una vez asignados los datos de origen, haga clic en Siguiente .

Programar ejecuciones de ingestión

Aparece el paso Programación , que le permite configurar una programación de ingestión para ingestar automáticamente los datos de origen seleccionados mediante las asignaciones configuradas. La siguiente tabla describe los diferentes campos configurables para la programación:
Campo
Descripción
Frecuencia
Las frecuencias seleccionables incluyen Minuto, Hora, Día y Semana.
Intervalo
Un entero que establece el intervalo para la frecuencia seleccionada.
Tiempo de Inicio
Marca de hora UTC para la que se producirá la primera ingestión.
Rellenar
Un valor booleano que determina qué datos se ingieren inicialmente. Si Rellenar está activado, todos los archivos actuales de la ruta especificada se ingerirán durante la primera ingestión programada. Si Rellenar está desactivado, solo se ingerirán los archivos que se carguen entre la primera ejecución de la ingesta y el tiempo de Inicio. Los archivos cargados antes de la hora de Inicio no se ingieren.
Los flujos de datos están diseñados para transferir datos automáticamente en forma programada. Si solo desea realizar una ingesta una vez a través de este flujo de trabajo, puede hacerlo configurando la Frecuencia en "Día" y aplicando un número muy grande para el intervalo , como 10000 o similar.
Proporcione valores para la programación y haga clic en Siguiente .

Asigne un nombre al flujo de datos

Aparece el paso de flujo ** Nombre, que le permite asignar un nombre y una breve descripción al nuevo flujo de datos.
Proporcione valores para el flujo de datos y haga clic en Siguiente .

Revise el flujo de datos

Aparece el paso Revisar , que le permite revisar el nuevo flujo de datos antes de crearlo. Los detalles se agrupan en las siguientes categorías:
  • Detalles de la fuente: Muestra el tipo de origen, la ruta de acceso relevante del archivo de origen seleccionado y la cantidad de columnas dentro de ese archivo de origen.
  • Detalles del Destinatario: Muestra en qué conjunto de datos se están ingeriendo los datos de origen, incluido el esquema al que se adhiere el conjunto de datos.
  • Detalles de programación: Muestra el período activo, la frecuencia y el intervalo del programa de ingestión.
Una vez que haya revisado el flujo de datos, haga clic en Finalizar y permita que se cree el flujo de datos.

Monitorear el flujo de datos

Una vez creado el flujo de datos del almacenamiento de nube, puede supervisar los datos que se están ingeriendo a través de él. Siga los pasos a continuación para acceder al monitor de conjuntos de datos de un flujo de datos.
En el espacio de trabajo Fuentes , haga clic en la ficha Examinar para lista de las conexiones base. En la lista mostrada, haga clic en su nombre para buscar la conexión que contiene el flujo de datos que desea controlar.
Aparece la pantalla actividad ** de origen. Desde aquí, haga clic en el nombre de un conjunto de datos cuya actividad desee monitorear.
Aparece la pantalla actividad del conjunto de datos. Esta página muestra la velocidad de los mensajes que se consumen en forma de gráfico.
Debajo del gráfico hay una lista de lotes que se ingeryeron en el conjunto de datos, mostrando su estado (correcto o fallido) y el número de registros ingestados. Si se ingesta un lote en un conjunto de datos con Perfil habilitado, se muestra el número de perfiles e identidades ingeridos.
Puede vista más detalles sobre un lote de la lista haciendo clic en su ID.
Para obtener más información sobre la supervisión de conjuntos de datos y la ingestión, consulte el tutorial sobre la supervisión de flujos de datos de flujo continuo.

Pasos siguientes

Siguiendo este tutorial, ha creado correctamente un flujo de datos para traer datos de un almacenamiento de nube externo y ha adquirido una perspectiva sobre la supervisión de conjuntos de datos. Los datos entrantes ahora se pueden utilizar en los servicios de plataforma descendente, como Perfil del cliente en tiempo real y Área de trabajo de ciencias de datos. Consulte los siguientes documentos para obtener más información:

Apéndice

Las secciones siguientes proporcionan información adicional para trabajar con conectores de origen.

Deshabilitar un flujo de datos

Cuando se crea un flujo de datos, se activa inmediatamente y se ingieren datos según la programación que se le haya dado. Puede desactivar un flujo de datos activo en cualquier momento siguiendo las instrucciones que se indican a continuación.
En el espacio de trabajo Fuentes , haga clic en la ficha Examinar . A continuación, haga clic en el nombre de la conexión base asociada al flujo de datos activo que desea deshabilitar.
Aparece la página actividad de origen. Seleccione el flujo de datos activo de la lista para abrir su columna Propiedades en el lado derecho de la pantalla, que contiene un botón de alternancia ​Habilitado** . Haga clic en el botón de alternancia para deshabilitar el flujo de datos. Se puede utilizar la misma opción para volver a habilitar un flujo de datos después de desactivarlo.

Activar datos de entrada para población de Perfiles

Los datos de entrada del conector de origen se pueden utilizar para enriquecer y completar los datos de Perfil del cliente en tiempo real. Para obtener más información sobre cómo rellenar los datos de Perfil de clientes reales, consulte el tutorial sobre población de Perfiles.