Show Menu
主题×

使用 Apache API创建HDFS连 Flow Service 接器

Apache HDFS连接器处于测试状态。 有关使用 测试版标记 的连接器的更多信息,请参阅源概述。
Flow Service 用于收集和集中来自不同来源的客户数据,以引入Adobe Experience Platform。 该服务提供用户界面和RESTful API,所有支持的源都可从中连接。
本教程使 Flow Service 用API指导您完成将Apache Hadoop分布式文件系统(以下简称“HDFS”)连接到的步 Experience Platform骤。

入门指南

本指南要求对Adobe Experience Platform的下列部分有工作上的理解:
  • 来源 : Experience Platform 允许从各种来源摄取数据,同时使您能够使用服务来构建、标记和增强传入数 Platform 据。
  • 沙箱 : Experience Platform 提供将单个实例分为单独的虚 Platform 拟环境的虚拟沙箱,以帮助开发和发展数字体验应用程序。
以下各节提供了使用API成功连接到HDFS所需了解的其他信 Flow Service 息。

收集所需的凭据

凭据
描述
url
URL定义匿名连接到HDFS所需的身份验证参数。 有关如何获取此值的详细信息,请参 阅此HDFS文档
connectionSpec.id
创建连接所需的标识符。 HDFS的固定连接规范ID为 54e221aa-d342-4707-bcff-7a4bceef0001

读取示例API调用

本教程提供示例API调用,以演示如何设置请求的格式。 这包括路径、必需的标头和格式正确的请求负载。 还提供API响应中返回的示例JSON。 有关示例API调用文档中使用的惯例的信息,请参阅疑难解答 指南中有关如何阅读示例API调 用 Experience Platform 一节。

收集所需标题的值

要调用API,您必 Platform 须先完成身份验证 教程 。 完成身份验证教程可为所有API调用中的每个所需 Experience Platform 标头提供值,如下所示:
  • 授权:承载者 {ACCESS_TOKEN}
  • x-api-key: {API_KEY}
  • x-gw-ims-org-id: {IMS_ORG}
中的所有资 Experience Platform源(包括属于这些资 Flow Service源)都与特定虚拟沙箱隔离。 对API的 Platform 所有请求都需要一个标头,它指定操作将在中进行的沙箱的名称:
  • x-sandbox-name: {SANDBOX_NAME}
所有包含有效负荷(POST、PUT、PATCH)的请求都需要额外的媒体类型标头:
  • 内容类型: application/json

创建连接

连接指定源并包含该源的凭据。 每个HDFS帐户只需要一个连接,因为它可用于创建多个源连接器以导入不同的数据。
API格式
POST /connections

请求
以下请求创建新的HDFS连接,该连接由负载中提供的属性进行配置:
curl -X POST \
    'https://platform.adobe.io/data/foundation/flowservice/connections' \
    -H 'Authorization: Bearer {ACCESS_TOKEN}' \
    -H 'x-api-key: {API_KEY}' \
    -H 'x-gw-ims-org-id: {IMS_ORG}' \
    -H 'x-sandbox-name: {SANDBOX_NAME}' \
    -H 'Content-Type: application/json' \
    -d '{
        "name": "HDFS test connection",
        "description": "A test connection for an HDFS source",
        "auth": {
            "specName": "Anonymous Authentication",
            "params": {
                "url": "{URL}"
                }
        },
        "connectionSpec": {
            "id": "54e221aa-d342-4707-bcff-7a4bceef0001",
            "version": "1.0"
        }
    }'

属性
描述
auth.params.url
定义匿名连接HDFS所需的身份验证参数的URL
connectionSpec.id
HDFS连接规范ID: 54e221aa-d342-4707-bcff-7a4bceef0001 .
响应
成功的响应会返回新创建的连接的详细信息,包括其唯一标识符( id )。 在下一个教程中浏览数据时需要此ID。
{
    "id": "6a6a880a-2b15-4051-aa88-0a2b1570516d",
    "etag": "\"1801bb7d-0000-0200-0000-5ed6ad580000\""
}

后续步骤

通过本教程,您已使用API创建了HDFS Flow Service 连接,并已获得该连接的唯一ID值。 在下一个教程中,您可以使用此ID,因为您将 了解如何使用流服务API探索第三方云存储