Documentación Experience Platform Guía de Data Science Workspace

JupyterLab Información general de IU

Last update: Mon Mar 13 2023 00:00:00 GMT+0000 (Coordinated Universal Time)

Temas:
Data Science Workspace

Creado para:

User
Developer

JupyterLab es una interfaz de usuario basada en web para Proyecto Jupyter y está totalmente integrado en Adobe Experience Platform. Proporciona un entorno de desarrollo interactivo para que los científicos de datos trabajen con Jupyter Notebooks, código y datos.

Este documento proporciona información general sobre JupyterLab y sus características, así como instrucciones para realizar acciones comunes.

JupyterLab en Experience Platform

La integración de JupyterLab de Experience Platform se acompaña de cambios arquitectónicos, consideraciones de diseño, extensiones de portátiles personalizadas, bibliotecas preinstaladas y una interfaz temática de Adobe.

La siguiente lista describe algunas de las funciones exclusivas de JupyterLab en Platform:

Función

Descripción

Núcleos

Los núcleos proporcionan cuaderno y otros JupyterLab front-end permite ejecutar e inspeccionar código en diferentes lenguajes de programación. Experience Platform proporciona núcleos adicionales para apoyar el desarrollo en Python, R, PySpark y Spark. Consulte la granos para obtener más información.

Acceso a datos

Acceder a conjuntos de datos existentes directamente desde JupyterLab con compatibilidad total con las funciones de lectura y escritura.

Platformintegración de servicios

Las integraciones integradas le permiten utilizar otras Platform servicios directamente desde JupyterLab. En la sección sobre, encontrará una lista completa de las integraciones compatibles Integración con otros servicios de Platform.

Autenticación

Además de El modelo de seguridad integrado de JupyterLab, todas las interacciones entre la aplicación y el Experience Platform, incluida la comunicación entre servicios de Platform, se cifran y autentican a través de Adobe Identity Management System (IMS).

Bibliotecas de desarrollo

Entrada Experience Platform, JupyterLab proporciona bibliotecas preinstaladas para Python, R y PySpark. Consulte la apéndice para obtener una lista completa de las bibliotecas compatibles.

Controlador de biblioteca

Cuando faltan las bibliotecas preinstaladas para sus necesidades, se pueden instalar bibliotecas adicionales para Python y R, y se almacenan temporalmente en contenedores aislados para mantener la integridad de Platform y mantenga sus datos seguros. Consulte la granos para obtener más información.

NOTE

Las bibliotecas adicionales solo están disponibles para la sesión en la que se instalaron. Debe volver a instalar las bibliotecas adicionales que necesite al iniciar nuevas sesiones.

Integración con otros Platform servicios service-integration

La estandarización y la interoperabilidad son conceptos clave Experience Platform. La integración de JupyterLab el Platform como IDE incrustado le permite interactuar con otros Platform servicios, lo que le permite utilizar Platform a todo su potencial. Lo siguiente Platform Los servicios de están disponibles en JupyterLab:

Catalog Service: Acceda y explore conjuntos de datos con funcionalidades de lectura y escritura.
Query Service: Acceda y explore conjuntos de datos mediante SQL, lo que reduce los gastos generales de acceso a datos al tratar grandes cantidades de datos.
Sensei ML Framework: Desarrollo de modelos con la capacidad de entrenar y puntuar datos, así como la creación de fórmulas con un solo clic.
Experience Data Model (XDM): La estandarización y la interoperabilidad son conceptos clave detrás de Adobe Experience Platform. Modelo de datos de experiencia (XDM), impulsado por el Adobe, es un esfuerzo para estandarizar los datos de experiencia del cliente y definir esquemas para la administración de experiencias del cliente.

NOTE

Algunos Platform integraciones de servicio en JupyterLab se limitan a núcleos específicos. Consulte la sección sobre granos para obtener más información.

Funciones clave y operaciones comunes

Información sobre las características principales de JupyterLab En las siguientes secciones se proporcionan instrucciones e instrucciones para realizar operaciones comunes:

Acceder a JupyterLab
Interfaz de JupyterLab
Celdas de código
Núcleos
Sesiones de kernel
Lanzador

Acceso JupyterLab access-jupyterlab

Entrada Adobe Experience Platform, seleccione Notebooks en la columna de navegación izquierda. Espere un poco JupyterLab para inicializar completamente.

JupyterLab interfaz jupyterlab-interface

El JupyterLab La interfaz de consta de una barra de menús, una barra lateral izquierda contraíble y el área de trabajo principal que contiene pestañas de documentos y actividades.

Barra de menú

La barra de menús de la parte superior de la interfaz tiene menús de nivel superior que exponen acciones disponibles en JupyterLab con sus métodos abreviados del teclado:

Archivo: Acciones relacionadas con archivos y directorios
Editar: Acciones relacionadas con la edición de documentos y otras actividades
Ver: Acciones que modifican el aspecto de JupyterLab
Ejecutar: Acciones para ejecutar código en diferentes actividades, como blocs de notas y consolas de códigos
Núcleo: Acciones para administrar núcleos
Fichas: Lista de documentos y actividades abiertos
Configuración: Configuración común y un editor de configuración avanzada
Ayuda: Una lista de JupyterLab Vínculos de ayuda del núcleo y

Barra lateral izquierda

La barra lateral izquierda contiene pestañas en las que se puede hacer clic y que proporcionan acceso a las siguientes funciones:

Explorador de archivos: Lista de documentos y directorios guardados del bloc de notas
Explorador de datos: Examinar, acceder y explorar conjuntos de datos y esquemas
Núcleos y terminales en ejecución: Una lista de sesiones activas del núcleo y de terminales con la capacidad de terminar
Comandos: Una lista de comandos útiles
Inspector de celdas: Editor de celdas que proporciona acceso a herramientas y metadatos útiles para configurar un bloc de notas con fines de presentación
pestañas: Una lista de pestañas abiertas

Seleccione una pestaña para exponer sus funciones o seleccione en una pestaña expandida para contraer la barra lateral izquierda como se muestra a continuación:

Área de trabajo principal

El área de trabajo principal en JupyterLab permite organizar documentos y otras actividades en paneles de pestañas que se pueden cambiar de tamaño o subdividir. Arrastre una pestaña al centro de un panel de pestañas para migrar la pestaña. Divida un panel arrastrando una pestaña a la izquierda, a la derecha, a la parte superior o a la parte inferior del panel:

Configuración de GPU y servidor de memoria en Python/R

Entrada JupyterLab seleccione el icono de engranaje en la esquina superior derecha para abrirlo Configuración del servidor de portátiles. Puede activar la GPU y asignar la cantidad de memoria que necesite mediante el control deslizante. La cantidad de memoria que puede asignar depende de la cantidad que haya aprovisionado su organización. Seleccionar Actualizar configuraciones para guardar.

NOTE

Solo se proporciona una GPU por organización para Notebooks. Si la GPU está en uso, tendrá que esperar a que la libere el usuario que la ha reservado actualmente. Esto se puede hacer cerrando la sesión o dejando la GPU en estado inactivo durante cuatro horas o más.

Finalizar y reiniciar JupyterLab

Entrada JupyterLab, puede finalizar la sesión para evitar que se utilicen más recursos. Comience por seleccionar la icono de energía , luego seleccione Apagar desde la ventana emergente que parece finalizar la sesión. Las sesiones de Notebook finalizan automáticamente después de 12 horas de inactividad.

Para reiniciar JupyterLab, seleccione la icono de reinicio situado directamente a la izquierda del icono de encendido, y seleccione Restart desde la ventana emergente que aparece.

finalizar jupyterlab

Celdas de código code-cells

Las celdas de código son el contenido principal de los blocs de notas. Contienen código fuente en el idioma del núcleo asociado del bloc de notas y la salida como resultado de la ejecución de la celda de código. Se muestra un recuento de ejecución a la derecha de cada celda de código que representa su orden de ejecución.

Las acciones celulares comunes se describen a continuación:

Agregar una celda: Haga clic en el símbolo más (+) en el menú del bloc de notas para agregar una celda vacía. Las nuevas celdas se colocan debajo de la celda con la que se está interactuando actualmente, o al final del bloc de notas si no hay ninguna celda en particular enfocada.
Mover una celda: Coloque el cursor a la derecha de la celda que desea mover y, a continuación, haga clic en la celda y arrástrela a una nueva ubicación. Además, al mover una celda de un bloc de notas a otro se replica la celda junto con su contenido.
Ejecutar una celda: Haga clic en el cuerpo de la celda que desea ejecutar y luego haga clic en el botón play icono (▶) en el menú del bloc de notas. Un asterisco (*) se muestra en el contador de ejecución de la celda cuando el núcleo está procesando la ejecución y se reemplaza por un entero al finalizar.
Eliminar una celda: Haga clic en el cuerpo de la celda que desea eliminar y, a continuación, haga clic en el botón tijera icono.

Núcleos kernels

Los núcleos de los portátiles son los motores informáticos específicos del idioma para el procesamiento de las celdas de los portátiles. Además de Python, JupyterLab proporciona compatibilidad adicional con idiomas en R, PySpark y Spark (Scala). Al abrir un documento de bloc de notas, se inicia el núcleo asociado. Cuando se ejecuta una celda de un bloc de notas, el núcleo realiza el cálculo y produce resultados que pueden consumir recursos significativos de CPU y memoria. Tenga en cuenta que la memoria asignada no se libera hasta que se apaga el núcleo.

Ciertas características y funcionalidades están limitadas a núcleos particulares como se describe en la tabla siguiente:

Núcleo

Compatibilidad con instalación de biblioteca

Platform integraciones

Python

Sí

Sensei ML Framework
Catalog Service
Query Service

Sí

Sensei ML Framework
Catalog Service

Scala

Sensei ML Framework
Catalog Service

Sesiones de kernel kernel-sessions

Cada bloc de notas o actividad activa en JupyterLab utiliza una sesión del núcleo. Todas las sesiones activas se pueden encontrar ampliando el Terminales y núcleos en funcionamiento de la barra lateral izquierda. El tipo y el estado del núcleo de un portátil se pueden identificar observando la parte superior derecha de la interfaz del portátil. En el diagrama siguiente, el núcleo asociado del bloc de notas es Python3 y su estado actual se representa mediante un círculo gris a la derecha. Un círculo hueco implica un núcleo inactivo y un círculo sólido implica un núcleo ocupado.

Si el núcleo está apagado o inactivo durante un periodo prolongado, entonces ¡No hay kernel! se muestra con un círculo sólido. Active un núcleo haciendo clic en el estado del núcleo y seleccionando el tipo de núcleo apropiado como se muestra a continuación:

Lanzador launcher

El personalizado Lanzador le proporciona plantillas de bloc de notas útiles para sus núcleos compatibles que le ayudarán a iniciar su tarea, entre las que se incluyen:

Plantilla

Descripción

En blanco

Un archivo de bloc de notas vacío.

Starter

Un bloc de notas precargado que muestra la exploración de datos con datos de ejemplo.

Ventas minoristas

Un portátil precargado con la fórmula de venta al por menor uso de datos de ejemplo.

Generador de fórmulas

Una plantilla de bloc de notas para crear una fórmula en JupyterLab. Está rellenado previamente con código y comentarios que muestran y describen el proceso de creación de la fórmula. Consulte la tutorial de bloc de notas a fórmula para obtener una introducción detallada.

Query Service

Un portátil precargado que muestra el uso de Query Service directamente en JupyterLab con flujos de trabajo de muestra proporcionados que analizan datos a escala.

Eventos de XDM

Un bloc de notas precargado que muestra la exploración de datos en datos de evento de experiencia de valor posterior, centrándose en las funciones comunes en toda la estructura de datos.

Consultas de XDM

Un portátil precargado que muestra ejemplos de consultas empresariales sobre los datos de Experience Event.

Agregación

Un portátil precargado que muestra flujos de trabajo de ejemplo para acumular grandes cantidades de datos en fragmentos más pequeños y manejables.

Clustering

Un bloc de notas precargado que muestra el proceso completo de modelado de aprendizaje automático mediante algoritmos de agrupación en clúster.

Algunas plantillas de bloc de notas están limitadas a determinados núcleos. La disponibilidad de la plantilla para cada núcleo se asigna en la siguiente tabla:

En blanco

Starter

Ventas minoristas

Generador de fórmulas

Query Service

Eventos de XDM

Consultas de XDM

Agregación

Clustering

Python

sí

PySpark 3 (Spark 2,4)

sí

Scala

sí

Para abrir un nuevo Lanzador, haga clic en Archivo > Nuevo lanzador. Como alternativa, expanda el Explorador de archivos en la barra lateral izquierda y haga clic en el símbolo más (+):

Pasos siguientes

Para obtener más información sobre cada uno de los portátiles compatibles y cómo utilizarlos, visite el Acceso a datos de portátiles Jupyterlab guía para desarrolladores. Esta guía se centra en cómo utilizar cuadernos de JupyterLab para acceder a sus datos, incluidos los datos de lectura, escritura y consulta. La guía de acceso a datos también contiene información sobre la cantidad máxima de datos que puede leer cada bloc de notas compatible.

Bibliotecas compatibles supported-libraries

Para obtener una lista de los paquetes compatibles en Python, R y PySpark, copie y pegue !conda list en una celda nueva y, a continuación, ejecute la celda. Una lista de paquetes admitidos se rellena en orden alfabético.

ejemplo

Además, se utilizan las siguientes dependencias, pero no se enumeran:

CUDA 11.2
CUDNN 8.1

recommendation-more-help

cc79fe26-64da-411e-a6b9-5b650f53e4e9