설명서 Experience Platform Catalog and Datasets 안내서

API를 사용하여 데이터 세트 만들기

Last update: Tue Nov 14 2023 00:00:00 GMT+0000 (Coordinated Universal Time)

주제:
Catalog

작성 대상:

Developer

이 문서에서는 Adobe Experience Platform API를 사용하여 데이터 세트를 만들고 파일을 사용하여 데이터 세트를 채우는 일반적인 단계를 제공합니다.

시작하기

이 안내서를 사용하려면 Adobe Experience Platform의 다음 구성 요소에 대해 이해하고 있어야 합니다.

일괄 처리 수집: Experience Platform 데이터를 배치 파일로 수집할 수 있습니다.
Experience Data Model (XDM) System: Experience Platform이 고객 경험 데이터를 구성하는 표준화된 프레임워크입니다.
Sandboxes: Experience Platform 단일 파티션을 만드는 가상 샌드박스를 제공합니다. Platform 인스턴스를 별도의 가상 환경으로 전환하여 디지털 경험 애플리케이션을 개발하고 발전시킵니다.

다음 섹션에서는 를 성공적으로 호출하기 위해 알아야 하는 추가 정보를 제공합니다. Platform API.

샘플 API 호출 읽기

이 튜토리얼에서는 요청 형식을 지정하는 방법을 보여 주는 예제 API 호출을 제공합니다. 여기에는 경로, 필수 헤더 및 적절한 형식의 요청 페이로드가 포함됩니다. API 응답에서 반환되는 샘플 JSON도 제공됩니다. 샘플 API 호출에 대한 문서에 사용된 규칙에 대한 자세한 내용은 문제 해결 안내서의예제 API 호출을 읽는 방법Experience Platform 섹션을 참조하세요.

필수 헤더에 대한 값 수집

Platform API를 호출하려면 먼저 인증 튜토리얼을 완료해야 합니다. 인증 튜토리얼을 완료하면 아래와 같이 모든 Experience Platform API 호출의 필수 헤더 각각에 대한 값이 제공됩니다.

Authorization: Bearer {ACCESS_TOKEN}
x-api-key: {API_KEY}
x-gw-ims-org-id: {ORG_ID}

의 모든 리소스 Experience Platform 특정 가상 샌드박스로 격리됩니다. 에 대한 모든 요청 Platform API에는 작업이 수행될 샌드박스의 이름을 지정하는 헤더가 필요합니다.

x-sandbox-name: {SANDBOX_NAME}

NOTE

의 샌드박스에 대한 자세한 내용 Platform, 다음을 참조하십시오. 샌드박스 개요 설명서.

페이로드가 포함된 모든 요청(POST, PUT, PATCH)에는 추가 항목이 필요합니다 Content-Type: application/json 머리글입니다. JSON+PATCH 요청의 경우 Content-Type 다음이어야 함: application/json-patch+json.

튜토리얼

데이터 세트를 만들려면 먼저 스키마를 정의해야 합니다. 스키마는 데이터를 표시하는 데 도움이 되는 규칙 세트입니다. 데이터 구조를 설명하는 것 외에도 스키마는 시스템 간에 데이터가 이동할 때 데이터의 유효성을 검사하는 데 적용 및 사용할 수 있는 제약 조건과 기대를 제공합니다.

이러한 표준 정의를 사용하면 출처에 관계없이 데이터를 일관되게 해석할 수 있으며 애플리케이션 간에 번역할 필요가 없습니다. 스키마 작성에 대한 자세한 내용은 스키마 컴포지션 기본 사항

데이터 세트 스키마 조회

이 튜토리얼은 스키마 레지스트리 API 튜토리얼 은 해당 자습서 중에 생성된 충성도 멤버 스키마를 사용하여 를 종료합니다.

다음을 완료하지 않은 경우 Schema Registry 자습서에서 필요한 스키마를 구성한 후에만 이 데이터 세트 자습서를 시작하고 계속하십시오.

다음 호출을 사용하여 작업 중에 생성한 충성도 멤버 스키마를 볼 수 있습니다. Schema Registry API 튜토리얼:

API 형식

GET /tenant/schemas/{schema meta:altId or URL encoded $id URI}

요청

curl -X GET \
  https://platform.adobe.io/data/foundation/schemaregistry/tenant/schemas/_{TENANT_ID}.schemas.533ca5da28087c44344810891b0f03d9 \
  -H 'Accept: application/vnd.adobe.xed-full+json; version=1' \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'x-api-key: {API_KEY}' \
  -H 'x-gw-ims-org-id: {ORG_ID}' \
  -H 'x-sandbox-name: {SANDBOX_NAME}'

응답

응답 개체의 형식은 요청에서 보낸 Accept 헤더에 따라 다릅니다. 이 응답의 개별 속성은 공간에 대해 최소화되었습니다.

{
    "type": "object",
    "title": "Loyalty Members",
    "description": "Information for all members of the loyalty program",
    "meta:class": "https://ns.adobe.com/xdm/context/profile",
    "meta:abstract": false,
    "meta:extensible": false,
    "meta:extends": [
        "https://ns.adobe.com/xdm/context/profile",
        "https://ns.adobe.com/xdm/data/record",
        "https://ns.adobe.com/xdm/context/identitymap",
        "https://ns.adobe.com/xdm/common/extensible",
        "https://ns.adobe.com/xdm/common/auditable",
        "https://ns.adobe.com/xdm/context/profile-person-details",
        "https://ns.adobe.com/xdm/context/profile-personal-details",
        "https://ns.adobe.com/{TENANT_ID}/mixins/bb118e507bb848fd85df68fedea70c62"
    ],
    "meta:containerId": "tenant",
    "imsOrg": "{ORG_ID}",
    "meta:immutableTags": [
        "union"
    ],
    "meta:altId": "_{TENANT_ID}.schemas.533ca5da28087c44344810891b0f03d9",
    "meta:xdmType": "object",
    "properties": {
        "repositoryCreatedBy": {},
        "repositoryLastModifiedBy": {},
        "createdByBatchID": {},
        "modifiedByBatchID": {},
        "_repo": {},
        "identityMap": {},
        "_id": {},
        "timeSeriesEvents": {},
        "person": {},
        "homeAddress": {},
        "personalEmail": {},
        "homePhone": {},
        "mobilePhone": {},
        "faxPhone": {},
        "_{TENANT_ID}": {
            "type": "object",
            "meta:xdmType": "object",
            "properties": {
                "loyalty": {
                    "title": "Loyalty",
                    "description": "Loyalty Info",
                    "type": "object",
                    "meta:xdmType": "object",
                    "meta:referencedFrom": "https://ns.adobe.com/{TENANT_ID}/datatypes/49b594dabe6bec545c8a6d1a0991a4dd",
                    "properties": {
                        "loyaltyId": {
                            "title": "Loyalty Identifier",
                            "type": "string",
                            "description": "Loyalty Identifier.",
                            "meta:xdmType": "string"
                        },
                        "loyaltyLevel": {
                            "title": "Loyalty Level",
                            "type": "string",
                            "meta:xdmType": "string"
                        },
                        "loyaltyPoints": {
                            "title": "Loyalty Points",
                            "type": "integer",
                            "description": "Loyalty points total.",
                            "meta:xdmType": "int"
                        },
                        "memberSince": {
                            "title": "Member Since",
                            "type": "string",
                            "format": "date-time",
                            "description": "Date the member joined the Loyalty Program.",
                            "meta:xdmType": "date-time"
                        }
                    }
                }
            }
        }
    },
    "$id": "https://ns.adobe.com/{TENANT_ID}/schemas/533ca5da28087c44344810891b0f03d9",
    "version": "1.4",
    "meta:resourceType": "schemas",
    "meta:registryMetadata": {
        "repo:createDate": 1551836845496,
        "repo:lastModifiedDate": 1551843052271,
        "xdm:createdClientId": "{CREATED_CLIENT}",
        "xdm:repositoryCreatedBy": "{CREATED_BY}"
    }
}

데이터 세트 만들기

충성도 멤버 스키마가 준비되면 이제 스키마를 참조하는 데이터 세트를 만들 수 있습니다.

API 형식

POST /dataSets

요청

curl -X POST \
  'https://platform.adobe.io/data/foundation/catalog/dataSets?requestDataSource=true' \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'Content-Type: application/json' \
  -H 'x-api-key: {API_KEY}' \
  -H 'x-gw-ims-org-id: {ORG_ID}' \
  -H 'x-sandbox-name: {SANDBOX_NAME}' \
  -d '{
    "name":"LoyaltyMembersDataset",
    "schemaRef": {
        "id": "https://ns.adobe.com/{TENANT_ID}/schemas/719c4e19184402c27595e65b931a142b",
        "contentType": "application/vnd.adobe.xed+json;version=1"
    }
}'

속성

설명

schemaRef.id

URI $id 데이터 세트가 기반으로 삼을 XDM 스키마 값.

schemaRef.contentType

스키마의 형식 및 버전을 나타냅니다. 의 섹션을 참조하십시오. 스키마 버전 관리 자세한 내용은 XDM API 안내서 를 참조하십시오.

NOTE

이 튜토리얼에서는 Apache Parquet 모든 예제에 대한 파일 형식입니다. JSON 파일 형식을 사용하는 예제는 일괄 처리 수집 개발자 안내서

응답

성공적인 응답은 HTTP 상태 201(생성됨)과, 형식으로 새로 생성된 데이터 세트의 ID가 포함된 배열로 구성된 응답 개체를 반환합니다 "@/datasets/{DATASET_ID}". 데이터 세트 ID는 API 호출에서 데이터 세트를 참조하는 데 사용되는 읽기 전용 시스템 생성 문자열입니다.

[
    "@/dataSets/5c8c3c555033b814b69f947f"
]

일괄 처리 만들기

데이터 세트에 데이터를 추가하려면 먼저 데이터 세트에 연결된 일괄 처리를 만들어야 합니다. 그런 다음 배치를 업로드하는 데 사용합니다.

API 형식

POST /batches

요청

요청 본문에는 "datasetId" 필드가 포함되어 있으며 이 필드의 값은 {DATASET_ID} 이전 단계에서 생성되었습니다.

curl -X POST 'https://platform.adobe.io/data/foundation/import/batches' \
  -H 'accept: application/json' \
  -H 'x-gw-ims-org-id: {ORG_ID}' \
  -H 'x-sandbox-name: {SANDBOX_NAME}' \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'x-api-key: {API_KEY}' \
  -H 'content-type: application/json' \
  -d '{
        "datasetId":"5c8c3c555033b814b69f947f"
      }'

응답

성공적인 응답은 HTTP 상태 201(생성됨) 및 응답 개체를 반환합니다. 응답 개체는 형식으로 새로 생성된 배치의 ID가 포함된 배열로 구성됩니다 "@/batches/{BATCH_ID}". 배치 ID는 API 호출에서 배치를 참조하는 데 사용되는 읽기 전용의 시스템 생성 문자열입니다.

{
    "id": "5d01230fc78a4e4f8c0c6b387b4b8d1c",
    "imsOrg": "{ORG_ID}",
    "updated": 1552694873602,
    "status": "loading",
    "created": 1552694873602,
    "relatedObjects": [
        {
            "type": "dataSet",
            "id": "5c8c3c555033b814b69f947f"
        }
    ],
    "version": "1.0.0",
    "tags": {
        "acp_producer": [
            "{CREATED_CLIENT}"
        ],
        "acp_stagePath": [
            "{CREATED_CLIENT}/stage/5d01230fc78a4e4f8c0c6b387b4b8d1c"
        ],
        "use_plan_b_batch_status": [
            "false"
        ]
    },
    "createdUser": "{CREATED_BY}",
    "updatedUser": "{CREATED_BY}",
    "externalId": "5d01230fc78a4e4f8c0c6b387b4b8d1c",
    "createdClient": "{CREATED_CLIENT}",
    "inputFormat": {
        "format": "parquet"
    }
}

파일을 일괄 처리에 업로드

업로드할 새 배치를 생성하면 이제 파일을 특정 데이터 세트에 업로드할 수 있습니다. 데이터 세트를 정의할 때 파일 형식을 Parquet로 지정했음을 기억해야 합니다. 따라서 업로드하는 파일은 해당 형식이어야 합니다.

NOTE

지원되는 최대 데이터 업로드 파일은 512MB입니다. 데이터 파일이 이보다 큰 경우 한 번에 하나씩 업로드하려면 512MB 이하의 청크로 분할해야 합니다. 동일한 배치 ID를 사용하여 각 파일에 대해 이 단계를 반복하여 각 파일을 동일한 배치로 업로드할 수 있습니다. 일괄 처리의 일부로 업로드할 수 있는 파일의 수에는 제한이 없습니다.

API 형식

PUT /batches/{BATCH_ID}/datasets/{DATASET_ID}/files/{FILE_NAME}

매개변수

설명

{BATCH_ID}

다음 id 을(를) 업로드하려는 배치의 일부입니다.

{DATASET_ID}

다음 id / 데이터 세트에서 배치가 지속됩니다.

{FILE_NAME}

업로드할 파일의 이름입니다.

요청

curl -X PUT 'https://platform.adobe.io/data/foundation/import/batches/5d01230fc78a4e4f8c0c6b387b4b8d1c/datasets/5c8c3c555033b814b69f947f/files/loyaltyData.parquet' \
  -H 'content-type: application/octet-stream' \
  -H 'x-api-key: {API_KEY}' \
  -H 'x-gw-ims-org-id: {IMG_ORG}' \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  --data-binary '@{FILE_PATH_AND_NAME}.parquet'

응답

성공적으로 업로드한 파일이 빈 응답 본문과 HTTP 상태 200(OK)을 반환합니다.

신호 일괄 처리 완료

모든 데이터 파일을 일괄 처리에 업로드한 후에는 일괄 처리가 완료되었음을 알릴 수 있습니다. 신호 완료 시 서비스가 다음을 생성합니다. Catalog DataSetFile 업로드한 파일에 대한 항목을 나열하고 이전에 생성된 배치와 연결합니다. 다음 Catalog 배치가 성공으로 표시되어 이제 사용할 수 있는 데이터에 대해 작업할 수 있는 모든 다운스트림 흐름을 트리거합니다.

API 형식

POST /batches/{BATCH_ID}?action=COMPLETE

매개변수

설명

{BATCH_ID}

다음 id 완료된 것으로 표시하는 배치.

요청

curl -X POST "https://platform.adobe.io/data/foundation/import/batches/5d01230fc78a4e4f8c0c6b387b4b8d1c?action=COMPLETE" \
  -H 'x-api-key: {API_KEY}' \
  -H 'x-gw-ims-org-id: {IMG_ORG}' \
  -H 'Authorization: Bearer {ACCESS_TOKEN}'

응답

성공적으로 완료된 배치는 빈 응답 본문과 HTTP 상태 200(OK)을 반환합니다.

수집 모니터링

데이터 크기에 따라 일괄 처리에 다양한 시간이 소요됩니다. 배치의 ID를에 추가하여 배치 상태를 모니터링할 수 있습니다. GET /batches 요청.

API 형식

GET /batches/{BATCH_ID}

매개변수

설명

{BATCH_ID}

다음 id 모니터링할 일괄 처리 중

요청

curl -X GET \
  'https://platform.adobe.io/data/foundation/catalog/batches?batch=5d01230fc78a4e4f8c0c6b387b4b8d1c' \
  -H 'x-api-key: {API_KEY}' \
  -H 'x-gw-ims-org-id: {IMG_ORG}' \
  -H 'x-sandbox-name: {SANDBOX_NAME}' \
  -H 'Authorization: Bearer {ACCESS_TOKEN}'

응답

양수 응답은 개체를 다음과 함께 반환합니다. status 다음 값을 포함하는 속성: success:

{
    "5b7129a879323401ef2a6486": {
        "imsOrg": "{ORG_ID}",
        "created": 1534142888068,
        "createdClient": "{CREATED_CLIENT}",
        "createdUser": "{CREATED_BY}",
        "updatedUser": "{CREATED_BY}",
        "updated": 1534142955152,
        "replay": {},
        "status": "success",
        "errors": [],
        "version": "1.0.3",
        "availableDates": {},
        "relatedObjects": [
            {
                "type": "batch",
                "id": "29285e08378f4a41827e7e70fb7cb8f0"
            }
        ],
        "metrics": {
            "startTime": 1534142943819,
            "endTime": 1534142951760,
            "recordsRead": 108,
            "recordsWritten": 108
        }
    }
}

음수 응답은 값이 인 개체를 반환합니다. "failed" 의 "status" 속성 및 에는 관련 오류 메시지가 모두 포함됩니다.

{
    "5b96ce65badcf701e51f075d": {
        "imsOrg": "{ORG_ID}",
        "status": "failed",
        "relatedObjects": [
            {
                "type": "batch",
                "id": "29285e08378f4a41827e7e70fb7cb8f0"
            }
        ],
        "replay": {},
        "availableDates": {},
        "metrics": {
            "startTime": 1536610322329,
            "endTime": 1536610438083,
            "recordsRead": 4004,
            "recordsWritten": 4004,
            "failureReason": "Job aborted due to stage failure: Task 0 in stage 1.0 failed 4 times,:"
        },
        "errors": [
            {
                "code": "0070000017",
                "description": "Unknown error occurred."
            },
            {
                "code": "unknown",
                "description": "Job aborted."
            }
        ],
        "created": 1536609893629,
        "createdClient": "{CREATED_CLIENT}",
        "createdUser": "{CREATED_BY}",
        "updatedUser": "{CREATED_BY}",
        "updated": 1536610442814,
        "version": "1.0.5"
    }
}

NOTE

권장 폴링 간격은 2분입니다.

데이터 세트에서 데이터 읽기

배치 ID를 사용하면 데이터 액세스 API를 사용하여 배치에 업로드된 모든 파일을 다시 읽고 확인할 수 있습니다. 응답은 파일 ID 목록이 포함된 배열을 반환하며, 각 ID는 배치에 있는 파일을 참조합니다.

또한 Data Access API를 사용하여 이름, 크기(바이트) 및 파일 또는 폴더를 다운로드할 수 있는 링크를 반환할 수도 있습니다.

데이터 액세스 API 작업에 대한 자세한 단계는 Data Access 개발자 안내서.

데이터 세트 스키마 업데이트

필드를 추가하고 만든 데이터 세트에 추가 데이터를 수집할 수 있습니다. 이렇게 하려면 먼저 새 데이터를 정의하는 속성을 추가하여 스키마를 업데이트해야 합니다. 이 작업은 기존 스키마를 업데이트하기 위해 PATCH 및/또는 PUT 작업을 사용하여 수행할 수 있습니다.

스키마 업데이트에 대한 자세한 내용은 스키마 레지스트리 API 개발자 안내서.

스키마를 업데이트한 후에는 이 자습서의 단계에 따라 수정된 스키마를 준수하는 새 데이터를 수집할 수 있습니다.

스키마가 레지스트리에 저장되고 데이터 수집에 사용된 후에는 스키마에 심각한 변경 내용을 적용할 수 없음을 의미하는 스키마 진화는 순전히 부가적인 것임을 기억해야 합니다. Adobe Experience Platform에서 사용할 스키마를 작성하는 모범 사례에 대한 자세한 내용은 스키마 컴포지션 기본 사항.

recommendation-more-help

c5c02be6-79a3-4a2f-b766-136bffe8b676