Show Menu
ARGOMENTI×

Creare un Apache Spark sul connettore Azure HDInsights utilizzando l'API del servizio di flusso

Flow Service è utilizzato per raccogliere e centralizzare i dati dei clienti da varie origini diverse all'interno di Adobe Experience Platform. Il servizio fornisce un'interfaccia utente e RESTful API da cui sono collegate tutte le origini supportate.
Questa esercitazione utilizza l'API del servizio di flusso per seguire i passaggi necessari per connettere Apache Spark in Azure HDInsights (di seguito "Spark") alla piattaforma di esperienze.

Introduzione

Questa guida richiede una buona conoscenza dei seguenti componenti di Adobe Experience Platform:
  • Origini : Experience Platform consente di acquisire dati da varie fonti, fornendo al contempo la possibilità di strutturare, etichettare e migliorare i dati in arrivo tramite i servizi della piattaforma.
  • Sandbox : Experience Platform fornisce sandbox virtuali che dividono una singola istanza della piattaforma in ambienti virtuali separati per sviluppare e sviluppare applicazioni per esperienze digitali.
Le sezioni seguenti forniscono informazioni aggiuntive che sarà necessario conoscere per collegarsi correttamente a Spark tramite l'API del servizio di flusso.

Raccogli credenziali richieste

Affinché il servizio di flusso possa connettersi a Spark, è necessario fornire i valori per le seguenti proprietà di connessione:
Credenziali
Descrizione
host
Indirizzo IP o nome host del server Spark.
username
Il nome utente utilizzato per accedere a Spark Server.
password
La password corrispondente all'utente.
connectionSpec.id
Identificatore univoco necessario per creare una connessione. L'ID della specifica di connessione per Spark è: 6a8d82bc-1caf-45d1-908d-cadabc9d63a6
Per ulteriori informazioni su come iniziare, consulta questo documento Spark.

Lettura di chiamate API di esempio

Questa esercitazione fornisce esempi di chiamate API per dimostrare come formattare le richieste. Questi includono percorsi, intestazioni richieste e payload di richieste formattati correttamente. Viene inoltre fornito un JSON di esempio restituito nelle risposte API. Per informazioni sulle convenzioni utilizzate nella documentazione per le chiamate API di esempio, consulta la sezione come leggere le chiamate API di esempio nella guida alla risoluzione dei problemi della piattaforma Experience.

Raccogli valori per le intestazioni richieste

Per effettuare chiamate alle API della piattaforma, dovete prima completare l'esercitazione di autenticazione. Completando l'esercitazione sull'autenticazione, vengono forniti i valori per ciascuna delle intestazioni richieste in tutte le chiamate API di Experience Platform, come illustrato di seguito:
  • Autorizzazione: Portatore {ACCESS_TOKEN}
  • x-api-key: {API_KEY}
  • x-gw-ims-org-id: {IMS_ORG}
Tutte le risorse in Experience Platform, incluse quelle appartenenti al servizio di flusso, sono isolate in sandbox virtuali specifiche. Tutte le richieste alle API della piattaforma richiedono un'intestazione che specifica il nome della sandbox in cui avrà luogo l'operazione:
  • x-sandbox-name: {SANDBOX_NAME}
Tutte le richieste che contengono un payload (POST, PUT, PATCH) richiedono un'intestazione aggiuntiva per il tipo di supporto:
  • Content-Type: application/json

Creazione di una connessione

Una connessione specifica un'origine e contiene le credenziali per tale origine. Per ogni account Spark è necessaria una sola connessione, in quanto può essere utilizzata per creare più connettori sorgente per inserire dati diversi.
Formato API
POST /connections

Richiesta
Per creare una connessione Spark, è necessario fornire il relativo ID univoco della specifica di connessione come parte della richiesta POST. L'ID della specifica di connessione per Spark è 6a8d82bc-1caf-45d1-908d-cadabc9d63a6 .
curl -X POST \
    'https://platform.adobe.io/data/foundation/flowservice/connections' \
    -H 'Authorization: Bearer {ACCESS_TOKEN}' \
    -H 'x-api-key: {API_KEY}' \
    -H 'x-gw-ims-org-id: {IMS_ORG}' \
    -H 'x-sandbox-name: {SANDBOX_NAME}' \
    -H 'Content-Type: application/json' \
    -d '{
        "name": "Spark test connection",
        "description": "A Spark test connection",
        "auth": {
            "specName": "HDInsights Basic Authentication",
        "params": {
            "host" :  "{HOST}",
            "username" : "{USERNAME}",
            "password" :"{PASSWORD}"
            }
        },
        "connectionSpec": {
            "id": "6a8d82bc-1caf-45d1-908d-cadabc9d63a6",
            "version": "1.0"
        }
    }'

Parametro
Descrizione
auth.params.host
Host del server Spark.
auth.params.username
Nome utente associato alla connessione Spark.
auth.params.password
La password associata alla connessione Spark.
connectionSpec.id
ID specifica connessione Spark: 6a8d82bc-1caf-45d1-908d-cadabc9d63a6 .
Risposta
Una risposta corretta restituisce i dettagli della nuova connessione creata, incluso il relativo identificatore univoco ( id ). Questo ID è necessario per esplorare i dati nell'esercitazione successiva.
{
    "id": "a45f2f58-e3a2-46ba-9f2f-58e3a2b6baf2",
    "etag": "\"900009d6-0000-0200-0000-5e8500010000\""
}

Passaggi successivi

Seguendo questa esercitazione, hai creato una connessione Spark utilizzando l'API del servizio di flusso e hai ottenuto il valore ID univoco della connessione. Puoi usare questo ID nell’esercitazione successiva per imparare a esplorare i database utilizzando l’API del servizio di flusso.