Show Menu
ARGOMENTI×

Creazione e pubblicazione di un modello di machine learning

Fingi di possedere un sito web di vendita online. Quando i clienti effettuano acquisti sul sito Web del cliente, è necessario presentare loro raccomandazioni personalizzate per presentare una serie di altri prodotti offerti dal cliente. Nel corso dell'esistenza del sito Web, hai raccolto continuamente i dati dei clienti e vuoi in qualche modo utilizzare questi dati per generare raccomandazioni di prodotto personalizzate.
Adobe Experience Platform Data Science Workspace fornisce i mezzi per raggiungere il vostro obiettivo utilizzando la Product Recommendations Recipe precostruita. Segui questa esercitazione per scoprire come accedere e comprendere i dati di vendita al dettaglio, creare e ottimizzare un modello di apprendimento automatico e generare informazioni approfondite in Data Science Workspace.
Questa esercitazione riflette il flusso di lavoro di Data Science Workspacee illustra i seguenti passaggi per la creazione di un modello di apprendimento automatico:

Introduzione

Prima di iniziare questa esercitazione, è necessario disporre dei seguenti prerequisiti:
  • Accesso a Adobe Experience Platform. Se non disponete dell'accesso a un'organizzazione IMS in Experience Platform, rivolgetevi all'amministratore di sistema prima di procedere.
  • Risorse di abilitazione. Rivolgetevi al rappresentante commerciale di riferimento per richiedere il provisioning dei seguenti elementi.
    • Recommendations Recipe
    • Set di dati di input Recommendations
    • Schema di input Recommendations
    • Set di dati di output Recommendations
    • Schema di output Recommendations
    • Golden Data Set postValues
    • Schema set di dati dorati
  • Scaricate i tre Jupyter Notebook file richiesti dall'archivio Git pubblico del Adobe, che verranno utilizzati per illustrare il JupyterLab flusso di lavoro in Data Science Workspace.
  • Una conoscenza approfondita dei seguenti concetti chiave utilizzati in questa esercitazione:
    • Experience Data Model : Lo sforzo di standardizzazione condotto da Adobe per definire schemi standard come Profile e ExperienceEvent per la gestione dell'esperienza cliente.
    • Set di dati: Un costrutto di storage e gestione per i dati effettivi. Un'istanza fisica istanziata di uno schema Experience Data Model Dizionario campo (XDM) XDM.
    • Batch: I set di dati sono costituiti da batch. Un batch è un insieme di dati raccolti in un periodo di tempo ed elaborati insieme come un'unica unità.
    • JupyterLab: JupyterLab è un'interfaccia web open-source per Project Jupyter ed è strettamente integrata in Experience Platform.

Prepare your data

Per creare un modello di machine learning che fornisca ai clienti raccomandazioni personalizzate sui prodotti, è necessario analizzare i precedenti acquisti sul sito Web. In questa sezione viene spiegato in che modo questi dati vengono assimilati Platform attraverso Adobe Analyticse come vengono trasformati in un set di dati delle feature da utilizzare nel modello di apprendimento automatico.

Esplorare i dati e comprendere gli schemi

  1. Accedete ad Adobe Experience Platform e fate clic Datasets per elencare tutti i set di dati esistenti e selezionate il set di dati da esplorare. In questo caso, il Analytics set di dati Golden Data Set postValues .
  2. Seleziona Preview Dataset vicino alla parte superiore destra per esaminare i record di esempio, quindi fai clic su Close .
  3. Selezionare il collegamento in Schema nella barra a destra per visualizzare lo schema per il dataset, quindi tornare alla pagina dei dettagli del dataset."
Gli altri set di dati sono stati precompilati con batch per la visualizzazione dell'anteprima. È possibile visualizzare questi set di dati ripetendo i passaggi descritti sopra.
Nome set di dati
Schema
Descrizione
Golden Data Set postValues
Golden Data Set, schema
Analytics i dati di origine del sito Web
Set di dati di input Recommendations
Schema di input Recommendations
I Analytics dati vengono trasformati in un set di dati per la formazione utilizzando una pipeline delle funzioni. Questi dati vengono utilizzati per formare il Modello di apprendimento automatico Recommendations prodotto. itemid e userid corrispondono a un prodotto acquistato da tale cliente.
Set di dati di output Recommendations
Schema di output Recommendations
Il dataset per il quale sono memorizzati i risultati del punteggio, conterrà l'elenco dei prodotti consigliati per ogni cliente.

Creazione del modello

Il secondo componente del Data Science Workspace ciclo di vita prevede l’authoring di remix e modelli. Il prodotto Recommendations Recipe è progettato per generare raccomandazioni sui prodotti su larga scala utilizzando i dati di acquisto passati e l'apprendimento automatico.
Le entrate sono la base per un modello in quanto contengono algoritmi di machine learning e logica progettati per risolvere problemi specifici. Ancora più importante, le entrate consentono di democratizzare l'apprendimento automatico all'interno dell'organizzazione, consentendo ad altri utenti di accedere a un Modello per diversi casi di utilizzo senza scrivere alcun codice.

Esplora il prodotto Recommendations Recipe

  1. In Adobe Experience Platform, andate Models dalla colonna di navigazione a sinistra, quindi fate clic Recipes in alto per visualizzare un elenco delle entrate disponibili per la vostra organizzazione.
  2. Individuate e aprite il file fornito Recommendations Recipe facendo clic sul suo nome.
  3. Nella barra a destra, fate clic Recommendations Input Schema per visualizzare lo schema che dà origine alla ricetta. I campi dello schema itemId e userId corrispondono a un prodotto acquistato ( interactionType ) dal cliente in un momento ( timestamp ) specifico. Seguire gli stessi passaggi per esaminare i campi per l' Recommendations Output Schema .
Sono stati revisionati gli schemi di input e output richiesti da Product Recommendations Recipe. È ora possibile continuare la sezione successiva per scoprire come creare, formare e valutare un modello Recommendations di prodotto.

Formazione e valutazione del modello

Ora che i dati sono preparati e la Ricetta è pronta per essere utilizzata, è possibile creare, formare e valutare il modello di apprendimento della macchina.

Creare un modello

Un modello è un'istanza di una ricetta, che consente di addestrare e segnare con i dati in scala.
  1. In Adobe Experience Platform, andate Models dalla colonna di navigazione a sinistra, quindi fate clic Recipes nella parte superiore della pagina per visualizzare un elenco di tutte le entrate disponibili per la vostra organizzazione.
  2. Individuate e aprite il file fornito Recommendations Recipe facendo clic sul suo nome, entrando nella pagina di panoramica della ricetta. Fate clic Create a Model dal centro (se non sono presenti modelli) o dall'alto a destra della pagina Panoramica ricetta.
  3. Viene visualizzato un elenco dei set di dati di input disponibili per la formazione, selezionarli Recommendations Input Dataset e fare clic su Next .
  4. Specificare un nome per il modello, ad esempio "Modello Recommendations prodotto". Sono elencate le configurazioni disponibili per il modello, che contengono le impostazioni per i comportamenti di formazione e valutazione predefiniti del modello. Non sono necessarie modifiche in quanto queste configurazioni sono specifiche per la vostra organizzazione. Esaminate le configurazioni e fate clic su Finish .
  5. Il modello è stato creato e la pagina Panoramica del modello viene visualizzata all'interno di un'esecuzione di formazione appena generata. Per impostazione predefinita, durante la creazione di un modello viene generata un'esecuzione di formazione.
Potete scegliere di attendere il termine dell’esecuzione della formazione oppure continuare a creare una nuova esecuzione della formazione nella sezione seguente.

Formazione del modello utilizzando i parametri ipertestuali personalizzati

  1. Nella pagina Panoramica modello, fate clic​ Train ​in alto a destra per creare una nuova esecuzione della formazione. Selezionare lo stesso set di dati di input utilizzato per creare il modello e fare clic su​ Next**.
  2. Viene visualizzata la pagina Configurazione . Qui puoi configurare il num_recommendations valore dell’esecuzione della formazione, noto anche come Hyperparameter. Un modello qualificato e ottimizzato utilizzerà i parametri Hyperparameters più performanti in base ai risultati dell'esecuzione di formazione.
    I parametri ipertestuali non possono essere appresi, pertanto devono essere assegnati prima dell'esecuzione della formazione. La regolazione dei parametri Hyperparameters può modificare la precisione del modello Tradotto. Poiché l'ottimizzazione di un modello è un processo iterativo, prima di ottenere una valutazione soddisfacente possono essere necessarie più esecuzioni di formazione.
    Set num_recommendations to 10.
  3. Una volta completata la nuova esecuzione della formazione, nel grafico di valutazione dei modelli verrà visualizzato un punto dati aggiuntivo. L'operazione potrebbe richiedere fino a diversi minuti.

Valutazione del modello

Ogni volta che un'esecuzione di formazione viene completata, potete visualizzare le metriche di valutazione risultanti per determinare il livello di esecuzione del modello.
  1. Esaminare le metriche di valutazione (precisione e recupero) per ogni esecuzione di formazione completata facendo clic sull’esecuzione della formazione.
  2. Esplora le informazioni fornite per ogni metrica di valutazione. Più alte sono queste metriche, migliore sarà l'esecuzione del modello.
  3. Potete visualizzare i parametri di set di dati, schema e configurazione utilizzati per ogni formazione sulla barra a destra.
  4. Tornate alla pagina Modello e individuate l’esecuzione di formazione con le prestazioni migliori osservando le relative metriche di valutazione.

Operazionalizzare il modello

Il passaggio finale del flusso di lavoro di Data Science consiste nell'operazionalizzare il modello per ottenere un punteggio e acquisire informazioni dall'archivio dati.

Punteggio e generazione di approfondimenti

  1. Nella pagina Panoramica modello di raccomandazioni prodotto, fate clic sul nome dell'esecuzione di formazione con le prestazioni migliori, con i valori di richiamo e precisione più elevati.
  2. In alto a destra della pagina dei dettagli dell’esecuzione della formazione, fate clic su Score .
  3. Selezionare Recommendations Input Dataset come set di dati di input per il punteggio, che è lo stesso set di dati utilizzato al momento della creazione del modello ed esecuzione delle relative esecuzioni di formazione. Then, click Next .
  4. Selezionare il set Recommendations Output Dataset di dati di output per il punteggio. I risultati del punteggio verranno memorizzati in questo dataset come batch.
  5. Esaminare le configurazioni di punteggio. Questi parametri contengono i set di dati di input e output selezionati in precedenza insieme agli schemi appropriati. Fare clic Finish per iniziare l'esecuzione del punteggio. L'esecuzione potrebbe richiedere alcuni minuti.

Visualizzazione delle informazioni relative al punteggio

Una volta completata l'esecuzione del punteggio, potrai visualizzare in anteprima i risultati e le informazioni generate.
  1. Nella pagina delle esecuzioni del punteggio fare clic sull'esecuzione del punteggio completato, quindi fare clic Preview Scoring Results Dataset sulla barra a destra.
  2. Nella tabella di anteprima, ogni riga contiene raccomandazioni sui prodotti per un cliente specifico, etichettate rispettivamente come recommendations e userId . Poiché il parametro num_recommendations Hyperparameter è stato impostato su 10 nelle schermate di esempio, ciascuna riga di raccomandazioni può contenere fino a 10 identità di prodotto delimitate da un numero (#).

Passaggi successivi

Ben fatto, avete generato con successo le raccomandazioni sui prodotti!
Questa esercitazione illustra il flusso di lavoro di Data Science Workspace, in cui viene illustrato come i dati non elaborati possono essere trasformati in informazioni utili grazie all'apprendimento automatico. Per saperne di più sull'utilizzo di Data Science Workspace, continuare con la guida successiva sulla creazione dello schema di vendita al dettaglio e del dataset .