Show Menu
TEMAS×

JupyterLab guía del usuario

JupyterLab es una interfaz de usuario basada en web para Project Jupyter y está estrechamente integrada en Adobe Experience Platform. Proporciona un entorno de desarrollo interactivo para que los científicos de datos trabajen con portátiles Jupyter, código y datos.
Este documento proporciona información general sobre JupyterLab y sus características, así como instrucciones para realizar acciones comunes.

JupyterLab en Experience Platform

La integración de JupyterLab de Experience Platform va acompañada de cambios arquitectónicos, consideraciones de diseño, extensiones personalizadas de portátiles, bibliotecas preinstaladas y una interfaz temática de Adobe.
La siguiente lista describe algunas de las características exclusivas de JupyterLab en la plataforma:
Función
Descripción
Kernels
Los kernels proporcionan al portátil y a otros JupyterLab front-end la capacidad de ejecutar e introducir código en diferentes lenguajes de programación. Experience Platform proporciona núcleos adicionales para admitir el desarrollo en Python, R, PySpark y Spark. Consulte la sección kernels para obtener más detalles.
Acceso a datos
Acceda directamente a los conjuntos de datos existentes desde dentro JupyterLab con compatibilidad total con las capacidades de lectura y escritura.
Platformintegración de servicios
Las integraciones integradas le permiten utilizar otros Platform servicios directamente desde dentro JupyterLab. En la sección sobre Integración con otros servicios de la Plataforma se proporciona una lista completa de las integraciones admitidas.
Autenticación
Además del modelo security.html de seguridad integrado deJupyterLab, todas las interacciones entre la aplicación y el Experience Platform, incluida la comunicación entre servicio y servicio de plataforma, se cifran y autentican a través del auth-methods.html Adobe Identity Management System (IMS).
Bibliotecas de desarrollo
En Experience Platform, JupyterLab proporciona bibliotecas preinstaladas para Python, R y PySpark. Consulte el apéndice para obtener una lista completa de las bibliotecas admitidas.
Controlador de biblioteca
Cuando las bibliotecas preinstaladas no están adaptadas a sus necesidades, se pueden instalar bibliotecas adicionales para Python y R, y se almacenan temporalmente en contenedores aislados para mantener la integridad de Platform los datos y mantenerlos seguros. Consulte la sección kernels para obtener más detalles.
Las bibliotecas adicionales solo están disponibles para la sesión en la que se instalaron. Debe reinstalar las bibliotecas adicionales que necesite al iniciar sesiones nuevas.

Integración con otros Platform servicios

La estandarización y la interoperabilidad son conceptos clave que sustentan Experience Platform. La integración de JupyterLab on Platform como un IDE integrado le permite interactuar con otros Platform servicios, permitiéndole utilizar Platform todo su potencial. Los siguientes Platform servicios están disponibles en JupyterLab:
  • Catalog Service:: Acceda y explore conjuntos de datos con funcionalidades de lectura y escritura.
  • Query Service:: Acceda y explore conjuntos de datos mediante SQL, proporcionando un acceso a los datos más bajo en los costes generales cuando se trata de grandes cantidades de datos.
  • Sensei ML Framework:: Desarrollo de modelos con la capacidad de entrenar y marcar datos, así como la creación de fórmulas con un solo clic.
  • Experience Data Model (XDM):: La estandarización y la interoperabilidad son conceptos clave para Adobe Experience Platform. El modelo de datos de experiencia (XDM) , impulsado por el Adobe, es un esfuerzo para estandarizar los datos de experiencia del cliente y definir esquemas para la administración de la experiencia del cliente.
Algunas integraciones Platform de servicios en JupyterLab están limitadas a núcleos específicos. Consulte la sección sobre núcleos para obtener más detalles.

Funciones clave y operaciones comunes

En las secciones siguientes se proporciona información sobre las características clave JupyterLab y las instrucciones para realizar operaciones comunes:

Acceso JupyterLab

En Adobe Experience Platform , seleccione Equipos portátiles en la columna de navegación izquierda. Deje que transcurra algún tiempo para que se inicialice JupyterLab completamente.

JupyterLab interfaz

La JupyterLab interfaz consta de una barra de menús, una barra lateral izquierda contraíble y el área de trabajo principal que contiene fichas de documentos y actividades.
Barra de menús
La barra de menús situada en la parte superior de la interfaz tiene menús de nivel superior que exponen las acciones disponibles JupyterLab con los métodos abreviados de teclado:
  • Archivo: Acciones relacionadas con archivos y directorios
  • Editar: Acciones relacionadas con la edición de documentos y otras actividades
  • Vista: Acciones que modifican el aspecto de JupyterLab
  • Ejecutar: Acciones para ejecutar código en diferentes actividades, como blocs de notas y consolas de código
  • Núcleo: Acciones para administrar los núcleos
  • Fichas: Una lista de documentos y actividades abiertos
  • Configuración: Configuración común y editor de configuración avanzada
  • Ayuda: Una lista de vínculos de ayuda JupyterLab y del núcleo
Barra lateral izquierda
La barra lateral izquierda contiene fichas en las que se puede hacer clic que proporcionan acceso a las siguientes funciones:
  • Explorador de archivos: Una lista de documentos y directorios de portátiles guardados
  • Explorador de datos: Examinar, acceder y explorar conjuntos de datos y esquemas
  • Kernels de funcionamiento y terminales: Una lista de las sesiones activas del núcleo y de terminal con la capacidad de finalizar
  • Comandos: Una lista de comandos útiles
  • Inspector de celdas: Editor de celdas que proporciona acceso a herramientas y metadatos útiles para configurar un bloc de notas con fines de presentación
  • fichas: Una lista de fichas abiertas
Haga clic en una ficha para exponer sus funciones o haga clic en una ficha expandida para contraer la barra lateral izquierda como se muestra a continuación:
Área de trabajo principal
El área de trabajo principal de JupyterLab permite organizar documentos y otras actividades en paneles de fichas que se pueden cambiar de tamaño o subdividir. Arrastre una ficha al centro de un panel de fichas para migrarla. Para dividir un panel, arrastre una ficha a la izquierda, a la derecha, a la parte superior o a la parte inferior del panel:

Celdas de código

Las celdas de código son el contenido principal de los blocs de notas. Contienen código fuente en el idioma del núcleo asociado al bloc de notas y la salida como resultado de la ejecución de la celda de código. Se muestra un recuento de ejecución a la derecha de cada celda de código que representa su orden de ejecución.
Las acciones comunes de las células se describen a continuación:
  • Añadir una celda: Haga clic en el símbolo más ( + ) del menú del bloc de notas para agregar una celda vacía. Las celdas nuevas se colocan debajo de la celda con la que se está interactuando o al final del bloc de notas si no hay ninguna celda en particular enfocada.
  • Mover una celda: Sitúe el cursor a la derecha de la celda que desee mover y, a continuación, haga clic y arrastre la celda a una nueva ubicación. Además, al mover una celda de un bloc de notas a otro se replica la celda junto con su contenido.
  • Ejecutar una celda: Haga clic en el cuerpo de la celda que desee ejecutar y, a continuación, haga clic en el icono de reproducción ( ) en el menú del bloc de notas. Se muestra un asterisco ( * ) en el contador de ejecución de la celda cuando el núcleo está procesando la ejecución y se reemplaza por un entero al finalizar.
  • Eliminar una celda: Haga clic en el cuerpo de la celda que desee eliminar y, a continuación, haga clic en el icono de la tijera .

Kernels

Los núcleos de los portátiles son los motores informáticos específicos del idioma para procesar las celdas de los portátiles. Además de Python, JupyterLab proporciona compatibilidad con idiomas adicionales en R, PySpark y Spark (Scala). Al abrir un documento portátil, se inicia el núcleo asociado. Cuando se ejecuta una celda portátil, el núcleo realiza el cálculo y produce resultados que pueden consumir recursos significativos de CPU y memoria. Tenga en cuenta que la memoria asignada no se libera hasta que se cierre el núcleo.
Algunas funciones y características se limitan a determinados núcleos, como se describe en la tabla siguiente:
Kernel
Compatibilidad con la instalación de la biblioteca
Platform integraciones
Python
  • Sensei ML Framework
  • Catalog Service
  • Query Service
R
  • Sensei ML Framework
  • Catalog Service
Scala
No
  • Sensei ML Framework
  • Catalog Service

Sesiones de núcleo

Cada portátil o actividad activa en JupyterLab utiliza una sesión del núcleo. Todas las sesiones activas se pueden encontrar expandiendo la ficha Terminales de ejecución y núcleos desde la barra lateral izquierda. El tipo y estado del núcleo para un portátil se puede identificar observando la parte superior derecha de la interfaz del bloc de notas. En el diagrama siguiente, el núcleo asociado al bloc de notas es Python3 y su estado actual está representado por un círculo gris a la derecha. Un círculo hueco implica un núcleo de ralentí y un círculo sólido implica un núcleo ocupado.
Si el núcleo está apagado o inactivo durante un período prolongado, entonces ¡ Sin núcleo! con un círculo sólido. Active un núcleo haciendo clic en el estado del núcleo y seleccionando el tipo de núcleo apropiado como se muestra a continuación:

Iniciador

El iniciador personalizado le proporciona plantillas de bloc de notas útiles para sus núcleos admitidos que le ayudarán a iniciar su tarea, como:
Plantilla
Descripción
En blanco
Un archivo de bloc de notas vacío.
Inicio
Un bloc de notas precargado que muestra la exploración de datos mediante datos de ejemplo.
Ventas minoristas
Un bloc de notas previamente rellenado que presenta la fórmula de venta al por menor utilizando datos de muestra.
Generador de fórmulas
Plantilla de bloc de notas para crear una fórmula en JupyterLab. Se rellena previamente con código y comentarios que muestran y describen el proceso de creación de fórmulas. Consulte el tutorial de fórmula del bloc de notas para obtener un tutorial detallado.
Query Service
Un bloc de notas precargado que muestra el uso de Query Service directamente JupyterLab con flujos de trabajo de muestra proporcionados que analizan los datos a escala.
Eventos XDM
Un bloc de notas precargado que muestra la exploración de datos en datos de Evento de experiencias con valor posterior, centrado en características comunes en la estructura de datos.
Consultas XDM
Un bloc de notas precargado que muestra consultas empresariales de muestra sobre los datos de Experience Evento.
Agregación
Un bloc de notas precargado que muestra flujos de trabajo de muestra a grandes cantidades acumuladas de datos en trozos más pequeños y manejables.
Clustering
Un bloc de notas precargado que muestra el proceso de modelado integral del aprendizaje automático mediante algoritmos de agrupamiento.
Algunas plantillas de bloc de notas están limitadas a ciertos núcleos. La disponibilidad de plantillas para cada núcleo se asigna en la siguiente tabla:
En blanco Inicio Ventas minoristas Generador de fórmulas [!DNL Servicio de Consulta] Eventos XDM Consultas XDM Agregación Clustering
[!DNL Python] no no no
R no no no no no no
PySpark 3 ([!DNL Spark] 2.4) no no no no no no
Scala no no no no no no
Para abrir un nuevo iniciador , haga clic en Archivo > Nuevo iniciador . También puede expandir el navegador de archivos desde la barra lateral izquierda y hacer clic en el símbolo más ( + ):

Configuración de GPU y servidor de memoria en Python/R

En JupyterLab seleccione el icono de engranaje en la esquina superior derecha para abrir la configuración del servidor portátil. Puede activar la GPU y asignar la cantidad de memoria que necesita con el control deslizante. La cantidad de memoria que puede asignar depende de cuánto haya proporcionado su organización. Seleccione Actualizar configuraciones para guardar.
Solo se aprovisiona una GPU por organización para equipos portátiles. Si la GPU está en uso, debe esperar a que el usuario que la haya reservado en ese momento la publique. Esto se puede hacer cerrando la sesión o dejando la GPU en estado inactivo durante cuatro o más horas.

Pasos siguientes

Para obtener más información sobre cada uno de los blocs de notas compatibles y cómo utilizarlos, visite la guía para desarrolladores de acceso a datos de blocs de notas de Jupyterlab. Esta guía se centra en cómo utilizar los blocs de notas de JupyterLab para acceder a sus datos, incluida la lectura, escritura y consulta de datos. La guía de acceso a datos también contiene información sobre la cantidad máxima de datos que puede leer cada bloc de notas compatible.

Bibliotecas admitidas

Python / R

Biblioteca
Versión
portátil
6.0.0
genere
2.22.0
tríptico
4.0.0
folium
0.10.0
ipywidgets
7.5.1
bokeh
1.3.1
gensim
3.7.3
ipyparalelo
0.5.2
jq
1.6
keras
2.2.4
nltk
3.2.5
pandas
0.22.0
pandasql
0.7.3
almohada
6.0.0
scikit-image
0.15.0
scikit-learn
0.21.3
scipy
1.3.0
scrapy
1.3.0
seaborn
0.9.0
modelos de estado
0.10.1
elástico
5.1.0.17
gráfico
0.11.5
py-xgboox
0.90
opencv
3.4.1
pyspark
2.4.3
pytorch
1.0.1
wxpython
4.0.6
colorlover
0.3.0
geopandas
0.5.1
pyshp
2.1.0
de forma
1.6.4
rpy2
2.9.4
r-essentials
3.6
r-arules
1.6_3
r-fpc
2.2_3
r-e1071
1.7_2
r-gam
1.16.1
r-gbm
2.1.5
r-temas
4.2.0
r-ggvis
0.4.4
r-igraph
1.2.4.1
r-saltos
3.0
volver a manipular
1.0.1
r-rocr
1.0_7
r-rmysql
0.10.17
r-rodbc
1.3_15
r-rsqlite
2.1.2
r-rstan
2.19.2
r-sqldf
0.4_11
r-supervivencia
2.44_1.1
r-zoo
1.8_6
r-stringdist
0.9.5.2
r-quadprog
1.5_7
r-rjson
0.2.20
r-previsión
8.7
r-resolnp
1.16
r-reticulate
1.12
r-mlr
2.14.0
r-viridis
0.5.1
r-corplot
0.84
r-fnn
1.1.3
r-lubridate
1.7.4
r-randomforest
4.6_14
r-tidyverse
1.2.1
wora
1.0_39
pymongo
3.8.0
pyarrow
0.14.1
boto3
1.9.199
ipyvolumen
0.5.2
fastparquet
0.3.2
python-sndish
0.5.4
ipywebrtc
0.5.0
jupyter_client
5.3.1
wordcloud
1.5.0
grafviz
2.40.1
python-graphviz
0.11.1
azure-almacenamiento
0.36.0
jupyterlab
1.0.4
pandas_ml
0.6.1
tensorflow-gpu
1.14.0
nodejs
12.3.0
snm
3.0.5
ipympl
0.3.3
fonts-anacond
1.0
psycopg2
2.8.3
nariz
1.3.7
autovizwidget
0.12.9
altair
3.1.0
vega_datasets
0.7.0
papermill
1.0.1
sql_Magic
0.0.4
iso3166
1.0
nbimporter
0.3.1

PySpark

Biblioteca
Versión
solicitudes
2.18.4
gensim
2.3.0
keras
2.0.6
nltk
3.2.4
pandas
0.20.1
pandasql
0.7.3
almohada
5.3.0
scikit-image
0.13.0
scikit-learn
0.19.0
scipy
0.19.1
scrapy
1.3.3
modelos de estado
0.8.0
elástico
4.0.30.44
py-xgboox
0.60
opencv
3.1.0
pyarrow
0.8.0
boto3
1.5.18
azure-almacenamiento-blob
1.4.0
python
3.6.7
mkl-rt
11.1