Dokumentation Experience Platform Handbuch zum Datenwissenschafts-Arbeitsbereich

JupyterLab Benutzeroberfläche – Übersicht

Last update: Tue Mar 14 2023 00:00:00 GMT+0000 (Coordinated Universal Time)

Themen:
Data Science Workspace

Erstellt für:

User
Developer

JupyterLab ist eine Web-basierte Benutzeroberfläche für Project Jupyter und ist eng in Adobe Experience Platform integriert. Sie bietet eine interaktive Entwicklungsumgebung für Datenwissenschaftlerinnen und Datenwissenschaftler, die mit Jupyter-Notebooks, -Code und -Daten arbeiten möchten.

In diesem Dokument erhalten Sie einen Überblick über JupyterLab und seine Funktionen sowie Anweisungen zum Durchführen häufiger Aktionen.

JupyterLab auf Experience Platform

Die JupyterLab-Integration mit Experience Platform wird von Architekturänderungen, Designüberlegungen, benutzerdefinierten Notebook-Erweiterungen, vorinstallierten Bibliotheken und einer Oberfläche im Stil von Adobe begleitet.

In der folgenden Liste werden einige der Funktionen vorgestellt, die bei JupyterLab auf Platform einzigartig sind:

Funktion

Beschreibung

Kernels

Kernels bieten Notebook und anderen JupyterLab-Frontends die Möglichkeit, Code in verschiedenen Programmiersprachen auszuführen und zu prüfen. Experience Platform bietet zusätzliche Kernels zur Unterstützung der Entwicklung in Python, R, PySpark und Spark. Weiterführende Informationen finden Sie im Abschnitt Kernels.

Datenzugriff

Auf vorhandene Datensätze kann direkt in JupyterLab zugegriffen werden, bei voller Unterstützung der Lese- und Schreibfunktionen.

Platform-Service-Integration

Mit nativen Integrationen können Sie andere Platform-Services direkt von JupyterLab aus nutzen. Eine vollständige Liste der unterstützten Integrationen finden Sie im Abschnitt zur Integration mit anderen Platform-Diensten.

Authentifizierung

Zusätzlich zum nativen Sicherheitsmodell von JupyterLab wird jede Interaktion zwischen Ihrer Anwendung und Experience Platform, einschließlich der Kommunikation zwischen Platform-Diensten, über das Adobe Identity Management System (IMS) verschlüsselt und authentifiziert.

Entwicklungsbibliotheken

In Experience Platform stellt JupyterLab vorinstallierte Bibliotheken für Python, R und PySpark zur Verfügung. Eine vollständige Liste der unterstützten Bibliotheken finden Sie im Anhang.

Bibliotheks-Controller

Wenn die vorinstallierten Bibliotheken Ihren Anforderungen nicht entsprechen, können Sie zusätzliche Bibliotheken für Python und R installieren und vorübergehend in isolierten Containern speichern, um die Integrität von Platform sowie die Sicherheit Ihrer Daten zu wahren. Weiterführende Informationen finden Sie im Abschnitt Kernels.

NOTE

Zusätzliche Bibliotheken sind nur für die Sitzung verfügbar, in der sie installiert werden. Wenn Sie neue Sitzungen starten, müssen Sie alle zusätzlichen Bibliotheken, die Sie benötigen, neu installieren.

Integration in andere Platform-Services service-integration

Standardisierung und Interoperabilität sind Schlüsselkonzepte von Experience Platform. Die Integration von JupyterLab auf Platform als eingebettete IDE ermöglicht es, mit anderen Platform-Services zu interagieren, sodass Sie Platform optimal nutzen können. Folgende Platform-Services sind in JupyterLab verfügbar:

Catalog Service: Aufrufen und Erkunden von Datensätzen mit Lese- und Schreibfunktionen.
Query Service: Greifen Sie auf Datensätze zu und untersuchen Sie sie mithilfe von SQL, was bei großen Datenmengen zu einem geringeren Overhead beim Datenzugriff führt.
Sensei ML Framework: Modellentwicklung mit der Möglichkeit, Daten zu trainieren und zu bewerten, sowie Rezepterstellung mit einem Klick.
Experience Data Model (XDM): Standardisierung und Interoperabilität sind Schlüsselkonzepte von Adobe Experience Platform. Das von Adobe unterstützte Experience-Datenmodell (XDM) ermöglicht die Standardisierung von Kundenerlebnisdaten und die Definition von Schemata für das Customer Experience Management.

NOTE

Einige Platform-Service-Integrationen in JupyterLab sind auf bestimmte Kernels beschränkt. Weiterführende Informationen finden Sie im Abschnitt Kernels.

Wichtigste Funktionen und allgemeine Vorgänge

Informationen zu den wichtigsten Funktionen von JupyterLab und Anweisungen zur Durchführung allgemeiner Vorgänge finden Sie in den folgenden Abschnitten:

Zugriff auf JupyterLab
Oberfläche von JupyterLab
Code-Zellen
Kernels
Kernel-Sitzungen
Starter

Zugriff auf JupyterLab access-jupyterlab

Wählen Sie in Adobe Experience Platform in der linken Navigationsspalte die Option Notebooks aus. Warten Sie etwas, bis JupyterLab vollständig initialisiert wurde.

JupyterLab-Benutzeroberfläche jupyterlab-interface

Die Benutzeroberfläche von JupyterLab besteht aus einer Menüleiste, einer reduzierbaren linken Seitenleiste und dem Hauptarbeitsbereich mit Registerkarten für Dokumente und Aktivitäten.

Menüleiste

Die Menüleiste oben in der Benutzeroberfläche verfügt über Menüs auf oberster Ebene, die die in JupyterLab verfügbaren Aktionen mit ihren Tastaturbefehlen anzeigen:

Datei: Aktionen im Zusammenhang mit Dateien und Ordnern
Bearbeiten: Aktionen im Zusammenhang mit der Bearbeitung von Dokumenten und anderen Aktivitäten
Ansicht: Aktionen, die das Erscheinungsbild von JupyterLab ändern
Ausführen: Aktionen zum Ausführen von Code in verschiedenen Aktivitäten, wie z. B. Notebooks und Code-Konsolen
Kernel: Aktionen zum Verwalten von Kerneln
Registerkarten: Eine Liste offener Dokumente und Aktivitäten
Einstellungen: Allgemeine Einstellungen und ein Editor für erweiterte Einstellungen
Hilfe: Eine Liste von JupyterLab- und Kernel-Hilfe-Links

Linke Seitenleiste

Die linke Seitenleiste enthält klickbare Registerkarten, die Zugriff auf folgende Funktionen bieten:

Datei-Browser: Eine Liste gespeicherter Notebook-Dokumente und -Verzeichnisse
Data Explorer: Durchsuchen, Aufrufen und Erforschen von Datensätzen und Schemas
Laufende Kernel und Terminals: Eine Liste von aktiven Kernel- und Terminal-Sitzungen mit der Möglichkeit zum Beenden
Befehle: Eine Liste mit hilfreichen Befehlen
Zellinspektor: Ein Zelleneditor, der Zugriff auf Tools und Metadaten bietet, die für die Einrichtung eines Notebooks zu Präsentationszwecken nützlich sind
Registerkarten: Eine Liste offener Registerkarten

Wählen Sie eine Registerkarte aus, um deren Funktionen anzuzeigen, oder wählen Sie eine erweiterte Registerkarte aus, um die linke Seitenleiste wie unten gezeigt zu reduzieren:

Hauptarbeitsbereich

Der Hauptarbeitsbereich in JupyterLab ermöglicht es Ihnen, Dokumente und andere Aktivitäten in Registerkarten-Panels anzuordnen, die in der Größe angepasst oder unterteilt werden können. Ziehen Sie eine Registerkarte in die Mitte eines Registerkarten-Panels, um die Registerkarte zu verschieben. Unterteilen Sie ein Panel durch Ziehen einer Registerkarte nach links, rechts, oben oder unten im Panel:

GPU- und Speicher-Server-Konfiguration in Python/R

Wählen Sie in JupyterLab oben rechts das Zahnradsymbol aus, um Notebook-Server-Konfiguration zu öffnen. Sie können die GPU-Option umschalten und die benötigte Speichermenge mithilfe des Reglers zuweisen. Wie viel Arbeitsspeicher Sie zuweisen können, hängt davon ab, wie viel Ihre Organisation bereitgestellt hat. Wählen Sie Konfigurationen aktualisieren aus, um zu speichern.

NOTE

Pro Organisation wird nur eine GPU für Notebooks bereitgestellt. Wenn die GPU verwendet wird, müssen Sie warten, bis die Person, die die GPU derzeit reserviert hat, sie freigibt. Dies ist durch Abmelden möglich oder dadurch, dass die GPU vier oder mehr Stunden lang im Leerlauf belassen wird.

Beenden und Neustarten von JupyterLab

In JupyterLab können Sie Ihre Sitzung beenden, um die Verwendung weiterer Ressourcen zu verhindern. Wählen Sie zunächst das Ein/Aus-Symbol und dann im angezeigten Popup die Option Herunterfahren aus, um Ihre Sitzung zu beenden. Notebook-Sitzungen enden nach 12 Stunden ohne Aktivität automatisch.

Um JupyterLab neu zu starten, wählen Sie das Neustart-Symbol direkt links neben dem Ein/Aus-Symbol und dann im angezeigten Popup die Option Neu starten aus.

Beenden von JupyterLab

Code-Zellen code-cells

Code-Zellen sind der Hauptinhalt von Notebooks. Sie enthalten Quell-Code in der Sprache des Kernels vom Notebook und die Ausgabe als Ergebnis der Ausführung der Code-Zelle. Rechts neben jeder Code-Zelle, die die Ausführungsreihenfolge darstellt, wird ein Ausführungszähler angezeigt.

Häufige Zellaktionen werden nachfolgend beschrieben:

Zelle hinzufügen: Klicken Sie im Notebook-Menü auf das Pluszeichen (+), um eine leere Zelle hinzuzufügen. Neue Zellen werden unter der Zelle platziert, mit der derzeit interagiert wird, oder am Ende des Notebooks, wenn keine bestimmte Zelle im Fokus ist.
Zelle verschieben: Platzieren Sie den Cursor rechts neben der Zelle, die Sie verschieben möchten, und ziehen Sie die Zelle dann an eine neue Position. Wenn Sie eine Zelle von einem Notebook in ein anderes verschieben, wird die Zelle zusammen mit ihrem Inhalt repliziert.
Zelle ausführen: Klicken Sie auf den Text der Zelle, die Sie ausführen möchten, und klicken Sie dann auf das Wiedergabesymbol (▶) im Notebook-Menü. Im Ausführungszähler der Zelle wird ein Sternchen (*) angezeigt, wenn der Kernel die Ausführung verarbeitet, und nach Abschluss durch eine Ganzzahl ersetzt.
Zelle löschen: Klicken Sie auf den Text der Zelle, die Sie löschen möchten, und klicken Sie dann auf das Symbol Schere.

Kernels kernels

Notebook-Kernels sind sprachspezifische Rechen-Engines zur Verarbeitung von Notebook-Zellen. Zusätzlich zu Python bietet JupyterLab Sprachunterstützung für R, PySpark und Spark (Scala). Wenn Sie ein Notebook-Dokument öffnen, wird der zugehörige Kernel gestartet. Wenn eine Notebook-Zelle ausgeführt wird, führt der Kernel die Berechnung durch und erzeugt Ergebnisse, die erhebliche CPU- und Arbeitsspeicherressourcen beanspruchen können. Beachten Sie, dass zugewiesener Arbeitsspeicher erst freigegeben wird, wenn der Kernel heruntergefahren wird.

Bestimmte Funktionen und Funktionen sind auf bestimmte Kernels beschränkt, wie in der folgenden Tabelle beschrieben:

Kernel

Installationsunterstützung für Bibliotheken

Platform-Integrationen

Python

Sensei ML Framework
Catalog Service
Query Service

Sensei ML Framework
Catalog Service

Scala

Nein

Sensei ML Framework
Catalog Service

Kernel-Sitzungen kernel-sessions

Jedes aktive Notebook oder jede Aktivität in JupyterLab verwendet eine Kernel-Sitzung. Alle aktiven Sitzungen finden Sie, indem Sie auf der linken Seitenleiste die Registerkarte Laufende Terminals und Kernel erweitern. Typ und Zustand des Kernels eines Notebooks finden Sie in der oberen rechten Ecke der Notebook-Oberfläche. In der Abbildung unten ist der zugehörige Kernel des Notebooks Python3, und der aktuelle Status wird durch einen grauen Kreis rechts dargestellt. Ein leerer Kreis impliziert einen Kernel im Leerlauf, während ein ausgefüllter Kreis einen aktiven Kernel darstellt.

Wenn der Kernel heruntergefahren wurde oder über einen längeren Zeitraum inaktiv war, dann erscheint Kein Kernel! mit einem ausgefüllten Kreis angezeigt. Aktivieren Sie einen Kernel, indem Sie auf den Kernel-Status klicken und den entsprechenden Kernel-Typ auswählen, wie unten gezeigt:

Starter launcher

Der angepasste Starter bietet nützliche Notebook-Vorlagen für die unterstützten Kernels, die Ihnen helfen, mit Ihrer Aufgabe zu beginnen, darunter:

Vorlage

Beschreibung

Leer

Eine leere Notebook-Datei.

Starter

Ein vorausgefülltes Notebook, das die Datenerfassung anhand von Musterdaten demonstriert.

Einzelhandelsumsätze

Ein vorausgefülltes Notebook mit dem Rezept für Einzelhandelsumsätze, inklusive Beispieldaten.

Recipe Builder

Eine Notebook-Vorlage zum Erstellen eines Rezepts in JupyterLab. Sie ist mit Code und Kommentaren vorausgefüllt, die die Erstellung von Rezepten demonstrieren und beschreiben. Eine ausführliche Vorgehensweise finden Sie im Tutorial Notebook an Rezept.

Query Service

Ein vorausgefülltes Notebook, das die Verwendung von Query Service direkt in JupyterLab demonstriert, mit Beispiel-Workflows, die Daten im großen Maßstab analysieren.

ExperienceEvents

Ein vorausgefülltes Notebook, das die Datenerkundung bei Nachwertdaten von Erlebnisereignissen demonstriert und sich auf Funktionen konzentriert, die in der ganzen Datenstruktur einheitlich sind.

XDM Queries

Ein vorausgefülltes Notebook, das geschäftliche Beispielabfragen zu Erlebnisereignisdaten veranschaulicht.

Aggregation

Ein vorausgefülltes Notebook, das Beispiel-Workflows zur Aggregation großer Datenmengen in kleineren, besser handhabbaren Blöcken veranschaulicht.

Clustering

Ein vorausgefülltes Notebook, das die durchgängige Modellierung für maschinellen Lernen mithilfe von Clustering-Algorithmen demonstriert.

Einige Notebook-Vorlagen sind auf bestimmte Kernels beschränkt. Die Vorlagenverfügbarkeit für jeden Kernel wird in der folgenden Tabelle dargestellt:

Leer

Starter

Einzelhandelsumsätze

Recipe Builder

Query Service

ExperienceEvents

XDM Queries

Aggregation

Clustering

Python

nein

PySpark 3 (Spark 2.4)

nein

Scala

nein

Um einen neuen Starter zu öffnen, klicken Sie auf Datei > Neuer Starter. Alternativ können Sie den Datei-Browser in der linken Seitenleiste erweitern und auf das Pluszeichen (+) klicken:

Nächste Schritte

Weitere Informationen zu den einzelnen unterstützten Notebooks und deren Verwendung finden Sie im Entwicklerhandbuch für den Datenzugriff über JupyterLab-Notebooks. In diesem Handbuch wird beschrieben, wie Sie mit JupyterLab-Notebooks auf Ihre Daten zugreifen können, einschließlich Lesen, Schreiben und Abfragen von Daten. Das Handbuch zum Datenzugriff enthält außerdem Informationen zur maximalen Datenmenge, die von jedem unterstützten Notebook gelesen werden kann.

Unterstützte Bibliotheken supported-libraries

Für eine Liste der unterstützten Pakete in Python, R und PySpark kopieren Sie !conda list und fügen dies in eine neue Zelle ein. Führen Sie dann die Zelle aus. Eine Liste der unterstützten Pakete wird in alphabetischer Reihenfolge aufgefüllt.

Beispiel

Darüber hinaus werden die folgenden Abhängigkeiten verwendet, aber nicht aufgelistet:

CUDA 11.2
CUDNN 8.1

recommendation-more-help

cc79fe26-64da-411e-a6b9-5b650f53e4e9