Customer Data Feeds customer-data-feeds

다음에 대한 기본 정보: Customer Data Feed (CDF) 파일 및 시작 방법에 대한 지침을 제공합니다. 수신에 관심이 있는 경우 여기에서 시작하십시오. CDF 파일 또는 추가 정보만 필요합니다.

파일 내용 및 목적 file-contents-purpose

CDF 파일에는 Audience Manager 이벤트 호출(/event)이 서버에 보내는 것과 동일한 데이터가 포함되어 있습니다. 여기에는 사용자 ID, trait IDs, segment IDs및 이벤트 호출로 캡처된 다른 모든 매개 변수. 내부 Audience Manager 시스템은 이벤트 데이터를 CDF 콘텐츠가 설정된 순서로 표시되는 필드로 구성된 파일입니다. Audience Manager 생성 시도 CDF 는 시간별로 파일을 만들어 의 안전한 고객별 버킷에 저장합니다 Amazon S3 서버입니다. 다음 작업을 수행할 수 있도록 이 파일을 제공합니다. Audience Manager 사용자 인터페이스가 부과한 제한을 벗어난 데이터입니다.

IMPORTANT
CDF 파일을 사용할 때는 다음 제한 사항에 유의하십시오.
  • CDF 파일 전달을 설정하기 전에 타사 데이터 공급자의 타사 트레이트 내보내기에 대한 적절한 권한이 있는지 확인하십시오. Audience Manager은 현재 서드파티 데이터 공급자로부터 CDF 파일 게재 내보내기 권한을 요청하는 기능을 사용자 인터페이스에서 지원하지 않으므로 독립적으로 문의하십시오.
  • 를 사용하면 안 됩니다. CDF 페이지 트래픽을 모니터링하거나, 보고서 불일치를 조정하거나, 대금 청구를 위해 파일을 프록시로 사용합니다.

시작하기 getting-started

시작할 셀프 서비스 프로세스가 없습니다. CDF 파일 전달. 다음으로 연락 Audience Manager 시작하려면 컨설턴트 또는 고객 지원 팀에서 확인하십시오. 구현 중에 Audience Manager 담당자는 다음을 수행합니다.

  • 설정 Amazon S3 저장소 버킷.
  • 읽기 전용 제공 S3 파일 저장소 버킷에 대한 인증 자격 증명입니다. 다른 고객에 속한 디렉토리와 파일은 보거나 액세스할 수 없습니다.

파일 알림 및 CDF 에 파일이 표시됩니다. S3 다운로드 준비가 되면 버킷으로 이동합니다. 할당된 파일을 모니터링하고 다운로드할 책임이 있습니다. S3 디렉토리. 고객 데이터 피드 파일 처리 알림을 참조하십시오.

다음 단계 next-steps

아래 섹션 및 고객 데이터 피드 FAQ 이 서비스에 대해 더 잘 알게 될 수 있습니다.

Customer Data Feed 정의된 콘텐츠 cdf-defined

의 데이터 요소와 배열을 나열하고 정의합니다. CDF 파일(모양 순서대로). 정의에는 데이터 유형이 포함되지만 이 정보는 CDF 파일.

IMPORTANT
CDF 구성에서는 기본적으로 이벤트 픽셀이 제외됩니다. 이벤트 픽셀을 CDF 파일에 포함하려면 클라이언트 관리에 요청에서 를 지정해야 합니다. 각 이벤트 픽셀은 CDF 파일에서 고유한 행으로 채워집니다.

정의 definitions

A CDF 파일에는 아래에 정의된 일부 또는 모든 필드가 포함되어 있습니다. 내부 파일 조직에 대한 자세한 내용은 고객 데이터 피드 파일 구조.

필드
데이터 유형
설명
Event Time
타임스탬프

CDF 파일이 처리된 시간 데이터 수집 서버 (DCS) 타임스탬프에서는 yyyy-mm-dd hhss 및 는 UTC 시간대로 설정됩니다.

참고: 이벤트 시간 은(는) 아님:

Device
문자열
다음 은 고유 사용자 ID (UUID) : 사이트 방문자의 38자리 장치 ID입니다. Audience Manager의 ID 색인을 참조하십시오.
Container ID
숫자
ID 동기화를 실행하는 컨테이너의 ID입니다. 이 필드는 컨테이너 ID를에서 설정한 경우에만 d_nsid 사이트 구현 내의 필드입니다. 그렇지 않으면 기본값 0이 CDF 파일에 포함되지 않습니다.
Realized Traits
숫자 배열

방문자가 이벤트 호출에서 실현(적격)한 모든 트레이트를 포함하는 트레이트 ID의 배열입니다.

이 배열에는 방문자가 이전에 자격을 부여받은 트레이트와 이 이벤트 호출을 통해 자격을 다시 부여받은 트레이트가 포함될 수 있습니다.

Realized Segments
숫자 배열
방문자가 이벤트 호출에서 실현(적격)한 모든 세그먼트를 포함하는 세그먼트 ID 배열입니다.
Request Parameters
문자열

모든 매개 변수(변수, ID, 키-값 쌍, 장치 광고 ID 등)를 캡처하는 문자열 이벤트 호출 시 전달되었습니다.

축약된 예:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
문자열
참조 페이지의 인코딩이 해제된 URL(있는 경우)입니다.
IP Data Type
문자열
이벤트 호출에서 캡처된 방문자의 IP 주소입니다.
MCDevice
문자열
다음 Experience Cloud 사이트 방문자에게 할당된 ID(MID)입니다. 다음을 참조하십시오. 쿠키 및 Adobe Experience Platform ID 서비스.
All Segments
숫자 배열
방문자가 자격을 갖는 이전에 실현된 세그먼트 및 새 세그먼트를 포함하는 세그먼트 ID 배열입니다.
All Traits
숫자 배열
마지막으로 생성된 데이터 피드 이후 방문자가 자격을 부여한 이전에 실현된 트레이트 및 새 트레이트를 포함하는 자사 및 서드파티 트레이트 ID의 배열입니다.

Customer Data Feed 파일 구조 cdf-file-structure

의 데이터 구조를 나열하고 정의합니다. CDF 파일. 여기에는 데이터 시퀀스, 필드 구분 기호 및 구분 기호, 데이터 파일 맵 및 샘플 파일이 포함됩니다.

데이터 필드 식별자 및 시퀀스 identifiers-and-sequence

CDF 파일에 레이블이 지정된 열 또는 필드 헤더가 포함되어 있지 않습니다. 대신, CDF 파일은 인쇄되지 않는 필드 및 배열을 정의합니다. ASCII 자. 또한 CDF 파일은 각 필드와 배열을 특정 순서로 나열합니다. 필드 식별자 및 순서를 이해하면 파일을 올바르게 구문 분석하는 데 도움이 됩니다.

CDF 파일 요소
설명
필드 구분 기호 및 구분 기호

인쇄되지 않는 이러한 문자는 CDF 파일의 요소 및 구조를 정의합니다.

  • Ctrl + a (ASCII) 001 또는 ^A)는 인쇄되지 않는 공간 표시기를 사용하여 개별 필드의 데이터를 구분합니다.
  • Ctrl + b(ASCII) 002 또는 ^B)는 데이터와 배열 및 요청 매개 변수를 구분합니다.
  • Ctrl + c(ASCII) 003 또는 ^C)는 키-값 쌍을 정의합니다.
필드 시퀀스

중요 사항: Audience Manager 는 향후 릴리스에서 CDF 파일의 끝에 새 필드를 추가할 수 있는 권한을 보유합니다. 즉, 파일 구문 분석 시스템의 기술 설계에서 고정된 수의 열을 가정해서는 안 됩니다(기존 열의 순서가 고정되어 있을 수도 있음).

CDF 파일의 데이터는 아래에 표시된 순서로 표시됩니다. 이러한 필드 대신 /N이 표시되어 null 값을 나타낼 수 있습니다.

  1. 이벤트 시간
  2. 장치
  3. 컨테이너 ID
  4. 실현된 트레이트
  5. 실현된 세그먼트
  6. 요청 매개 변수
  7. Referer
  8. IP 주소
  9. Experience Cloud 장치 ID(또는 MID). 다음을 참조하십시오. 쿠키 및 Adobe Experience Platform Identity 서비스
  10. 모든 세그먼트
  11. 모든 트레이트

필드 설명은 을 참조하십시오. 고객 데이터 피드 콘텐츠 정의됨.

CDF 파일 맵 cdf-file-map

CDF 파일 데이터는 아래 표시된 순서로 표시됩니다.

배열 식별

의 배열 CDF 파일 시작 및 종료 Ctrl + a 필드 구분 기호입니다. 이렇게 하면 배열의 첫 번째 요소가 독립 실행형 데이터 필드처럼 표시됩니다. 예를 들어 는 traits 배열 시작 문자 ^A1234. 배열 구분 기호 및 ID ^B5678 이 항목을 따릅니다. 그 결과, 실현된 첫 번째 요소라고 생각하고 싶은 유혹을 느낄 수 있다 traits 배열은 ID 5678입니다(다음으로 시작하므로). ^B). 그렇지 않으므로 데이터 파일의 시퀀스 및 구조에 익숙해야 합니다. 비록 첫 번째 요소가 실현되었을지라도 trait 배열(또는 의 다른 배열) CDF 파일) 시작 문자 ^A파일의 모양 또는 위치 순서는 배열의 시작을 정의합니다. 그리고 배열의 첫 번째 요소는 항상 다음 방법으로 이전 항목과 분리됩니다. ^A.

샘플 CDF 파일 sample-file

샘플 CDF 파일은 다음과 비슷합니다. 페이지에 맞게 하기 위해 이 예제에 줄바꿈을 삽입했습니다.

Customer Data Feed 파일 이름 지정 규칙 cdf-naming-conventions

아래 섹션에서는 의 요소를 나열하고 정의합니다 CDF 파일 이름.

CDF 파일 이름: 구문 및 예제 cdf-file-name

일반 CDF 파일 이름에는 아래 나열된 요소가 포함되어 있습니다. 참고, 기울임체 변수 자리 표시자를 나타냅니다.

구문

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

내 S3 저장소 버킷, 파일은 파트너 ID( )별로 오름차순으로 정렬됩니다.PID), 일 및 시간.

CDF 정의된 파일 이름 요소 cdf-file-name-elements

다음 표는 의 요소를 나열하고 정의합니다. CDF 파일 이름.

파일 이름 요소
설명
s3://aam-cdf/
Amazon S3 서버에서 CDF 파일의 기본 루트 스토리지 버킷입니다.
your S3 bucket name
CDF 파일을 저장하는 읽기 전용 S3 버킷의 이름입니다.
day=yyyy-mm-dd
파일이 처리된 날짜입니다.
hour=hh
24시간 표기법으로 표현되고 UTC 시간대로 설정된 시간 값입니다. 다음을 참조하십시오. 고객 데이터 피드 파일 이름 시간 및 파일 컨텐츠 시간....
partner ID
파트너 ID입니다.
File Sequence_0
파일 시퀀스를 식별하는 값입니다. 순서는 0_0_0 , 0_1_0, 0_2_0....1_0_0과 같이 증가합니다.
.gz
gzip 파일 확장명. CDF 파일은 gzip으로 압축됩니다.

Customer Data Feed 파일 처리 알림 cdf-file-processing-notifications

Audience Manager 쓰기: .info 파일을 S3 다음 경우에 알려 주는 디렉토리 Customer Data File (CDF)을(를) 다운로드할 준비가 되었습니다. 다음 .info 파일에는 다음 항목도 포함됩니다 JSON 의 콘텐츠에 대한 서식 있는 메타데이터 CDF 파일. 이 알림 파일에서 사용하는 구문과 필드에 대한 정보는 이 섹션을 검토하십시오.

샘플 정보 파일 sample-info-file

.info 파일에 FilesTotals 섹션. 다음 Files 섹션에는 각 시간별 파일에 대한 특정 지표를 저장하는 배열이 포함되어 있습니다. 다음 Totals 섹션에는 모든 항목에서 집계된 지표가 포함됩니다. CDF 특정 날짜의 파일입니다. 의 콘텐츠 .info 파일은 다음 예제와 유사할 수 있습니다.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

정의된 정보 파일 필드 info-file-fields-defined

다음 표는 의 요소를 나열하고 정의합니다 CDF .info 파일.

Files 개체

필드
설명
Files
CDF 파일에 대한 메타데이터가 포함된 배열을 시작합니다.
FileByteSize
파일 크기(바이트)입니다.
FileChecksumMD5
Amazon S3 ETag. 하이픈 다음에 나오는 숫자는 다중 부분 업로드 중에 파일을 작성하는 데 사용된 부분 수를 보여줍니다. 다음 ETag 는 파일의 MD5 체크섬과 동일하지 않습니다.
FileName
파일 이름입니다. 다음을 참조하십시오 고객 데이터 피드 파일 이름 지정 규칙.
FileSequenceNumber
각 파일에 대한 색인 번호입니다.

Totals 객체

필드
설명
Totals
모든 CDF 파일에 대한 집계된 데이터가 포함된 객체를 시작합니다.
Day
데이터를 사용할 수 있는 날짜입니다. 사용 yyyy-mm-dd 포맷.
Hour
데이터를 사용할 수 있는 시간입니다. UTC 시간대로 설정된 24시간 형식을 사용합니다.
TotalByteSize
해당 날짜에 대한 모든 CDF 파일의 총 크기(바이트)입니다.
TotalNumberFiles
S3 디렉토리에 업로드된 총 파일 수입니다.

Customer Data Feed 파일 이름 시간과 파일 컨텐츠 시간이 다릅니다. different-processing-times

사용자 CDF 파일에는 파일 이름과 파일 내용에 타임스탬프가 들어 있습니다. 이러한 타임스탬프는 동일한 이벤트에 대해 서로 다른 이벤트 프로세스를 기록합니다 CDF 파일. 동일한 파일의 이름과 내용에서 서로 다른 타임스탬프를 보는 것은 드문 일이 아닙니다. 각 타임스탬프를 이해하면 이 데이터로 작업하거나 시간별로 정렬하려고 할 때 발생하는 일반적인 실수를 방지하는 데 도움이 됩니다.

찾기 CDF 파일 타임스탬프 locating-timestamps

CDF 파일은 두 개의 서로 다른 위치에 시간을 다르게 기록합니다.

타임스탬프 간 차이점 이해 understanding-timestamps

다음 표는 다음에 대한 추가 세부 정보를 제공합니다. CDF 타임스탬프를 적절하게 사용하는 방법에 대한 정보와 함께 파일입니다.

타임스탬프 위치
설명
파일 이름

의 타임스탬프 CDF 파일 이름은 다음의 시간을 표시합니다. Audience Manager 게재를 위한 파일 준비를 시작했습니다. 이 타임스탬프는 UTC 시간대. 다음을 사용합니다. hour= 24시간 표기법으로 2자리 시간 형식의 시간이 있는 매개 변수. 이 시간은 파일 콘텐츠에 기록된 이벤트 시간과 다를 수 있습니다. 로 작업할 때 CDF 파일, 때로는 S3 버킷이 특정 시간 동안 비어 있습니다. 빈 버킷 수단은 다음 중 하나를 의미할 수 있습니다.

  • 해당 시간에 대한 데이터가 없습니다.
  • 서버에 부하가 심해서 특정 시간 동안 파일을 처리할 수 없습니다. 서버가 작업을 완료하면 이전 시간 버킷 파일에 있어야 하는 파일을 이후 시간 값이 있는 버킷에 넣습니다. 예를 들어 17시간 버킷에 있어야 하는 파일이 18시간 버킷에 표시되면(와 함께) 이 메시지가 표시됩니다 hour=18 을 입력합니다. 이 경우 서버에서 17시간 내에 파일 처리를 시작했지만 해당 시간 간격 내에 완료할 수 없을 수 있습니다. 대신 파일이 다음 시간 버킷으로 푸시됩니다.

중요 사항: 파일 이름 타임스탬프를 사용하여 이벤트를 시간별로 그룹화하지 마십시오. 시간별로 그룹화해야 하는 경우 EventTime 파일 콘텐츠의 타임스탬프.

파일 내용
의 타임스탬프 CDF 파일 콘텐츠는 다음을 나타내는 시간을 Data Collection Servers 파일 처리를 시작했습니다. 이 타임스탬프는 UTC 시간대. 다음을 사용합니다. EventTime 다음 형식의 시간이 있는 필드 yyyy-mm-dd hh:mm:ss. 이 시간은 페이지에서 이벤트의 실제 시간에 가깝지만 파일 이름의 시간 표시기와 다를 수 있습니다.
: 와 달리 hour= 파일 이름에 있는 타임스탬프에서 EventTime 시간별로 데이터를 그룹화합니다.
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695