Documentation Experience Platform Guide de Data Science Workspace

Présentation de l’interface utilisateur de JupyterLab

Last update: Wed May 24 2023 00:00:00 GMT+0000 (Coordinated Universal Time)

Rubriques :
Data Science Workspace

Créé pour :

User
Developer

JupyterLab est une interface utilisateur web pour Project Jupyter et est étroitement intégré à Adobe Experience Platform. Elle fournit un environnement de développement interactif pour que les analystes de données puissent travailler avec les notebooks, le code et les données Jupyter.

Ce document présente JupyterLab et ses fonctionnalités, et fournit des instructions pour effectuer des actions courantes.

JupyterLab sur Experience Platform

L’intégration JupyterLab d’Experience Platform est accompagnée de modifications architecturales, de considérations de conception, d’extensions de notebooks personnalisées, de bibliothèques préinstallées et d’une interface sur le thème Adobe.

La liste suivante présente quelques-unes des fonctionnalités propres à JupyterLab sur Platform :

Fonctionnalité

Description

Noyaux

Les noyaux permettent aux notebooks et aux autres interfaces JupyterLab d’exécuter et d’inspecter le code dans différents langages de programmation. Experience Platform fournit des noyaux supplémentaires pour prendre en charge le développement en Python, R, PySpark et Spark. Pour plus d’informations, consultez la section sur les noyaux.

Accès aux données

Accédez aux jeux de données existants directement depuis JupyterLab avec la prise en charge intégrale des fonctionnalités de lecture et d’écriture.

Intégration du service Platform

Les intégrations vous permettent d’utiliser d’autres services Platform directement depuis JupyterLab. Une liste complète des intégrations prises en charge est fournie dans la section sur l’intégration avec d’autres services Platform.

Authentification

Outre le modèle de sécurité intégré de JupyterLab, chaque interaction entre votre application et Experience Platform, y compris la communication service à service de Platform, est chiffrée et authentifiée à l’aide d’Adobe Identity Management System (IMS).

Bibliothèques de développement

Dans Experience Platform, JupyterLab fournit des bibliothèques préinstallées pour Python, R et PySpark. Consultez l’annexe pour obtenir une liste complète des bibliothèques prises en charge.

Contrôleur de bibliothèque

Lorsque les bibliothèques préinstallées ne répondent pas à vos besoins, vous pouvez installer des bibliothèques supplémentaires pour Python et R. Elles seront temporairement stockées dans des conteneurs isolés afin de préserver l’intégrité de Platform et protéger vos données. Pour plus d’informations, consultez la section sur les noyaux.

NOTE

Les bibliothèques supplémentaires sont uniquement disponibles pour la session dans laquelle elles ont été installées. Vous devez réinstaller les bibliothèques supplémentaires nécessaires lorsque vous démarrez de nouvelles sessions.

Intégration à d’autres services Platform service-integration

La normalisation et l’interopérabilité sont des concepts clés pour Experience Platform. L’intégration de JupyterLab sur Platform en tant qu’IDE intégré lui permet d’interagir avec d’autres services Platform, ce qui vous permet d’utiliser tout le potentiel de Platform. Les services Platform suivants sont disponibles dans JupyterLab :

Catalog Service : Accédez à des jeux de données et explorez-les avec des fonctionnalités de lecture et d’écriture.
Query Service : accédez aux jeux de données et explorez-les à l’aide de SQL, ce qui vous permet de réduire les frais généraux d’accès aux données lorsque vous traitez de grandes quantités de données.
Sensei ML Framework : développement de modèles avec la possibilité de former et de noter des données, ainsi que de créer des recettes en un seul clic.
Experience Data Model (XDM): La normalisation et l’interopérabilité sont les concepts clés d’Adobe Experience Platform. Le modèle de données d’expérience (XDM), optimisé par Adobe vise à normaliser les données d’expérience client et à définir des schémas pour la gestion de l’expérience client.

NOTE

L’intégration de certains services Platform sur JupyterLab est limitée à des noyaux spécifiques. Pour plus d’informations, consultez la section sur les noyaux.

Fonctionnalités clés et opérations courantes

Vous trouverez des informations sur les fonctionnalités clés de JupyterLab et des instructions sur l’exécution d’opérations courantes dans les sections suivantes :

Accéder à JupyterLab
Interface de JupyterLab
Cellules de code
Noyaux
Sessions de noyau
Lanceur

Accéder à JupyterLab access-jupyterlab

Dans Adobe Experience Platform, sélectionnez Notebooks dans la colonne de navigation de gauche. Attendez que JupyterLab soit complètement initialisé.

Interface JupyterLab jupyterlab-interface

L’interface JupyterLab se compose d’une barre de menus, d’une barre latérale gauche réductible et de l’espace de travail principal contenant des onglets pour les documents et les activités.

Barre de menus

La barre de menus en haut de l’interface comporte des menus de niveau supérieur qui affichent les actions disponibles dans JupyterLab ainsi que leurs raccourcis clavier :

Fichier : actions relatives aux fichiers et répertoires
Modifier : actions relatives à la modification des documents et d’autres activités
Afficher : actions qui modifient l’apparence de JupyterLab
Exécuter : actions d’exécution de code dans différentes activités telles que les notebooks et les consoles de code
Noyau : actions de gestion des noyaux
Onglets : une liste des activités et des documents ouverts
Paramètres : paramètres courants et un éditeur de paramètres avancés
Aide : une liste de JupyterLab et des liens d’aide sur les noyaux

Barre latérale gauche

La barre latérale gauche contient des onglets cliquables qui permettent d’accéder aux fonctionnalités suivantes :

Navigateur de fichiers : une liste de documents et de répertoires de notebook enregistrés
Explorateur de données : accédez aux jeux de données et aux schémas, explorez-les et parcourez-les
Noyaux et terminaux en cours d’exécution : une liste des sessions de noyau et de terminal actives pouvant être interrompues
Commandes : une liste de commandes utiles
Inspecteur de cellule : un éditeur de cellules qui donne accès aux outils et aux métadonnées utiles pour configurer un notebook à des fins de présentation
onglets : une liste d’onglets ouverts

Sélectionnez un onglet pour afficher ses fonctionnalités ou cliquez sur un onglet développé pour réduire la barre latérale gauche comme illustré ci-dessous :

Espace de travail principal

L’espace de travail principal de JupyterLab vous permet d’organiser les documents et les autres activités en panneaux d’onglets qui peuvent être redimensionnés ou subdivisés. Faites glisser un onglet au centre d’un panneau à onglets pour le faire migrer. Divisez un panneau en faisant glisser un onglet vers la gauche, la droite, le haut ou le bas du panneau :

Configuration du GPU et du serveur de mémoire en Python/R

Dans JupyterLab, sélectionnez l’icône d’engrenage dans le coin supérieur droit pour ouvrir la configuration du serveur Notebook. Vous pouvez activer le GPU et allouer la quantité de mémoire dont vous avez besoin à l’aide du curseur. La quantité de mémoire que vous pouvez allouer dépend de la quantité de mémoire configurée par votre organisation. Sélectionnez Mettre à jour les configurations pour enregistrer.

NOTE

Un seul GPU est configuré par organisation pour Notebooks. Si le GPU est en cours d’utilisation, vous devez attendre que l’utilisateur ou l’utilisatrice qui a réservé le GPU le libère. Pour ce faire, déconnectez-vous ou laissez le GPU inactif pendant quatre heures ou plus.

Mettre fin à JupyterLab et redémarrer

Dans JupyterLab, vous pouvez mettre fin à votre session pour empêcher l’utilisation d’autres ressources. Commencez par sélectionner l’icône d’alimentation , puis sélectionnez Arrêter dans la fenêtre contextuelle qui s’affiche pour mettre fin à votre session. Les sessions Notebook se terminent automatiquement après 12 heures d’absence d’activité.

Pour redémarrer JupyterLab, sélectionnez l’icône de redémarrage située directement à gauche de l’icône d’alimentation, puis sélectionnez Redémarrer dans la fenêtre contextuelle qui s’affiche.

mettre fin à jupyterlab

Cellules de code code-cells

Les cellules de code constituent le contenu principal des notebooks. Elles contiennent le code source dans le langage du noyau associé au notebook et la sortie résultant de l’exécution de la cellule de code. Le nombre d’exécutions est affiché à droite de chaque cellule de code qui représente son ordre d’exécution.

Les actions de cellule courantes sont décrites ci-dessous :

Ajouter une cellule : cliquez sur le symbole plus (+) dans le menu du notebook pour ajouter une cellule vide. Les nouvelles cellules sont placées sous la cellule en cours d’interaction ou à la fin du notebook si aucune cellule particulière n’est concernée.
Déplacer une cellule : placez votre curseur à droite de la cellule que vous souhaitez déplacer, puis cliquez sur la cellule et faites-la glisser vers un nouvel emplacement. De plus, le déplacement d’une cellule d’un notebook vers un autre réplique la cellule et son contenu.
Exécuter une cellule : cliquez sur le corps de la cellule que vous souhaitez exécuter, puis sur l’icône lecture (▶) dans le menu du notebook. Un astérisque (*) est affiché dans le compteur d’exécution de la cellule lorsque le noyau traite l’exécution, et est remplacé par un nombre entier une fois l’exécution terminée.
Supprimer une cellule : cliquez sur le corps de la cellule que vous souhaitez supprimer, puis sur l’icône ciseaux.

Noyaux kernels

Les noyaux des notebooks sont les moteurs informatiques spécifiques au langage pour le traitement des cellules des notebooks. En plus de Python, JupyterLab fournit une prise en charge supplémentaire pour les langages R, PySpark et Spark (Scala). Lorsque vous ouvrez un document de notebook, le noyau associé est lancé. Lorsqu’une cellule de notebook est exécutée, le noyau effectue le calcul et produit des résultats qui peuvent consommer d’importantes ressources de processeur et de mémoire. Notez que la mémoire allouée n’est pas libérée tant que le noyau n’est pas arrêté.

Certaines fonctionnalités sont limitées à des noyaux particuliers, comme décrit dans le tableau ci-dessous :

Noyau

Prise en charge de l’installation de la bibliothèque

Intégrations à Platform

Python

Oui

Sensei ML Framework
Catalog Service
Query Service

Oui

Sensei ML Framework
Catalog Service

Scala

Non

Sensei ML Framework
Catalog Service

Sessions de noyau kernel-sessions

Chaque notebook actif ou activité sur JupyterLab utilise une session de noyau. Vous trouverez toutes les sessions actives en développant l’onglet Noyaux et terminaux en cours d’exécution de la barre latérale gauche. Vous pouvez identifier le type et l’état du noyau d’un notebook en observant le coin supérieur droit de l’interface du notebook. Dans le diagramme ci-dessous, le noyau associé au notebook est Python 3 et son état actuel est représenté par un cercle gris à droite. Un cercle creux implique un noyau inactif et un cercle plein implique un noyau occupé.

Si le noyau est arrêté ou inactif pendant une longue période, alors aucun noyau ! avec un cercle plein n’est affiché. Activez un noyau en cliquant sur l’état du noyau et en sélectionnant le type de noyau approprié, comme illustré ci-dessous :

Lanceur launcher

Le Lanceur personnalisé fournit des modèles de notebook utiles pour les noyaux pris en charge afin de vous aider à démarrer rapidement vos tâches, notamment :

Modèle

Description

Vide

Un fichier de notebook vide.

Démarrage

Un notebook prérempli présentant l’exploration des données à l’aide de données d’exemple.

Ventes au détail

Un notebook prérempli présentant la recette des ventes au détail à l’aide de données d’exemple.

Créateur de recettes

Un modèle de notebook pour la création d’une recette dans JupyterLab. Il est prérempli de code et de commentaires qui présentent et décrivent le processus de création de la recette. Consultez le tutoriel notebook vers recette pour une présentation détaillée.

Query Service

Un notebook prérempli présentant l’utilisation de Query Service directement dans JupyterLab avec des exemples de workflows qui analysent les données à grande échelle.

Événements XDM

Un notebook prérempli qui présente l’exploration des données sur les données d’événement d’expérience de valeur post, en mettant l’accent sur les fonctionnalités communes à l’ensemble de la structure de données.

Requêtes XDM

Un notebook prérempli présentant des exemples de requêtes d’entreprise sur les données d’événement d’expérience.

Agrégation

Un notebook prérempli présentant des exemples de processus pour agréger de grandes quantités de données en petits blocs gérables.

Mise en cluster

Un notebook prérempli présentant le processus de modélisation de machine learning de bout en bout à l’aide d’algorithmes de mise en cluster.

Certains modèles de notebook sont limités à des noyaux spécifiques. La disponibilité des modèles pour chaque noyau est mappée dans le tableau suivant :

Vide

Démarrage

Ventes au détail

Créateur de recettes

Query Service

Événements XDM

Requêtes XDM

Agrégation

Mise en cluster

Python

oui

non

oui

non

PySpark 3 (Spark 2.4)

non

oui

non

oui

non

Scala

oui

non

oui

Pour ouvrir un nouveau lanceur, cliquez sur Fichier > Nouveau lanceur. Vous pouvez également développer le navigateur de fichiers depuis la barre latérale gauche et cliquer sur le symbole plus (+) :

Étapes suivantes

Pour en savoir plus sur chacun des notebooks pris en charge et sur leur utilisation, consultez le guide de développement Accès aux données des notebooks JupyterLab. Ce guide explique comment utiliser les notebooks JupyterLab pour accéder à vos données, y compris la lecture, l’écriture et l’interrogation de données. Le guide d’accès aux données contient également des informations sur la quantité maximale de données pouvant être lues par chaque notebook pris en charge.

Bibliothèques prises en charge supported-libraries

Pour obtenir la liste des packages pris en charge en Python, R et PySpark, copiez et collez !conda list dans une nouvelle cellule, puis exécutez la cellule. Une liste des packages pris en charge est renseignée par ordre alphabétique.

exemple

En outre, les dépendances suivantes sont utilisées, mais ne sont pas répertoriées :

CUDA 11.2
CUDNN 8.1

recommendation-more-help

cc79fe26-64da-411e-a6b9-5b650f53e4e9