Show Menu
화제×

고객 데이터 피드

( Customer Data Feed ) 파일에 대한 기본 정보CDF및 시작하는 방법에 대한 지침 파일 수수에 관심이 있거나 더 많은 정보를 원하는 경우 여기에서 CDF 시작하십시오.

파일 내용 및 목적

파일 CDF 은 이벤트 호출()이 Adobe 서버에 전송하는 것과 동일한 데이터 Audience Manager /event 를 포함합니다. 여기에는 사용자 ID, 특성 ID, 세그먼트 ID 및 이벤트 호출에서 캡처한 기타 모든 매개 변수와 같은 데이터가 포함됩니다. 내부 Audience Manager 시스템은 이벤트 데이터를 CDF 파일로 처리하며 컨텐츠는 설정된 순서로 표시되는 필드로 구성됩니다. Audience Manager 시마다 CDF 파일을 생성하여 Amazon S3 서버의 안전한 고객별 버킷에 저장합니다. Adobe는 이러한 파일을 제공하므로 사용자 인터페이스가 설정한 제한 사항 이외의 Audience Manager 데이터를 사용하여 작업할 수 있습니다.
페이지 트래픽을 모니터링하고, 보고서 불일치를 조정하거나, 청구하기 위해 CDF 파일을 프록시로 사용해서는 안됩니다.

시작하기

파일 전달을 시작하는 셀프 서비스 프로세스는 CDF 없습니다. Contact your Audience Manager consultant or Customer Care to get started. 구현 중에 Audience Manager 담당자가 다음을 수행합니다.
  • 저장소 버킷을 Amazon S3 설정합니다.
  • 파일 저장소 버킷에 읽기 전용 S3 인증 자격 증명을 제공합니다. 다른 고객에 속한 디렉토리와 파일은 보거나 액세스할 수 없습니다.
파일 알림 및 CDF 파일은 다운로드할 준비가 되면 버킷에 S3 표시됩니다. 할당된 S3 디렉토리에서 파일을 모니터링하고 다운로드하는 책임이 있습니다. 고객 데이터 피드 파일 처리 알림을 참조하십시오 .

다음 단계

아래 섹션 및 고객 데이터 피드 FAQ를 통해 본 서비스에 더욱 익숙해질 수 있습니다.

정의된 고객 데이터 피드 컨텐츠

모양에 따라 파일의 데이터 요소 및 배열을 CDF 나열하고 정의합니다. 정의는 데이터 유형을 포함하지만 이 정보는 CDF 파일의 일부가 아닙니다.

정의

파일에는 아래에 정의된 일부 또는 전체 필드가 포함되어 있습니다. CDF 내부 파일 조직에 대한 자세한 내용은 고객 데이터 피드 파일 구조를 참조하십시오 .
필드 데이터 유형 설명
Event Time
타임스탬프
DCS(데이터 수집 서버 )에서 CDF 파일을 처리한 시간입니다. 타임스탬프는 yyyy-mm-dd hh:mm:ss 형식을 사용하며 UTC 표준 시간대로 설정됩니다.
참고: 이벤트 시간 은 다음과 같습니다 .
  • 페이지 이벤트 또는 이벤트가 해당 시간에 가까울 수 있지만 페이지 이벤트의 시간 자체를 호출합니다.
  • 파일 이름의 DCS 시간과 관련되어 있습니다. 고객 데이터 피드 파일 이름 시간 및 파일 컨텐츠 시간을 참조하십시오. #different-processing-times.
Device
문자열
사이트 방문자의 38자리 장치 ID인 UUID(고유 사용자 ID)입니다. Audience Manager의 ID 색인 을 참조하십시오.
Container ID
숫자
ID를 동기화하는 컨테이너의 ID입니다.
Realized Traits
숫자 배열
이벤트 호출에서 방문자가 인식하는 모든 트레이트를 포함하는 트레이트 ID의 배열.
이 배열에는 방문자가 이전에 자격을 얻었고 이 이벤트 호출을 통해 재평가할 수 있는 트레이트가 포함될 수 있습니다.
Realized Segments
숫자 배열
이벤트 호출에서 방문자가 실현(적격)한 모든 세그먼트를 포함하는 세그먼트 ID의 배열.
Request Parameters
문자열
모든 매개 변수(변수, ID, 키-값 쌍, 장치 광고 ID 등)를 캡처하는 문자열 이벤트 호출에서 전달됩니다.
단축된 예:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
문자열
참조 페이지의 인코딩되지 않은 URL(있는 경우).
IP Data Type
문자열
이벤트 호출에서 캡처된 방문자의 IP 주소입니다.
MCDevice
문자열
사이트 방문자에게 할당된 Experience Cloud ID(MID)입니다. 쿠키 및 Adobe Experience Platform Identity Service도 참조하십시오 .
All Segments
숫자 배열
방문자가 자격이 있는 이전에 실현된 세그먼트와 새 세그먼트를 포함하는 세그먼트 ID의 배열.
All Traits
숫자 배열
마지막으로 생성된 데이터 피드 이후 방문자가 자격을 부여한 트레이트와 새로운 트레이트를 포함하는 자사 및 타사 트레이트 ID의 배열.

고객 데이터 피드 파일 구조

파일의 데이터 구조를 나열하고 CDF 정의합니다. 여기에는 데이터 시퀀스, 필드 구분 기호 및 구분 기호, 데이터 파일 맵 및 샘플 파일이 포함됩니다.

데이터 필드 식별자 및 시퀀스

CDF 파일에는 레이블이 지정된 열 또는 필드 머리글이 포함되어 있지 않습니다. 대신, CDF 파일은 인쇄되지 않는 문자가 포함된 필드 및 배열을 ASCII 정의합니다. 또한 CDF 파일에는 각 필드와 배열을 특정 순서로 나열합니다. 필드 식별자 및 순서를 이해하면 파일을 제대로 분석하는 데 도움이 됩니다.
CDF 파일 요소 설명
필드 구분 기호 및 구분 기호
이러한 인쇄되지 않는 문자는 CDF 파일의 요소 및 구조를 정의합니다.
  • Ctrl + a(ASCII 001 또는 ^A )는 인쇄되지 않는 공간 표시기를 사용하여 개별 필드의 데이터를 구분합니다.
  • Ctrl + b(ASCII 002 또는 ^B )는 데이터 및 배열 및 요청 매개 변수를 구분합니다.
  • Ctrl + c(ASCII 003 또는 ^C )는 키-값 쌍을 정의합니다.
필드 시퀀스
중요: Audience Manager는 향후 릴리스에서 CDF 파일의 끝에 새 필드를 추가할 수 있는 권한을 보유합니다. 즉, 파일 구문 분석 시스템의 기술 설계에서는 고정된 개수의 열을 가정할 수 없습니다(기존 열에 대해 고정된 순서가 있을 수 있음).
CDF 파일의 데이터는 아래에 표시된 순서대로 나타납니다.
  1. 이벤트 시간
  2. 장치
  3. 컨테이너 ID
  4. 실현된 트레이트
  5. 실현 세그먼트
  6. 요청 매개 변수
  7. Referer
  8. IP 주소
  9. Experience Cloud 장치 ID(또는 MID). 쿠키 및 Adobe Experience Platform Identity Service를 참조하십시오.
  10. 모든 세그먼트
  11. 모든 트레이트

CDF 파일 맵

CDF 파일 데이터는 아래에 표시된 순서대로 나타납니다.

스토리지 식별

파일 CDF 시작 및 종료의 배열은 Ctrl + a 필드 구분 기호로 끝납니다. 이렇게 하면 배열의 첫 번째 요소가 독립형 데이터 필드와 같이 표시됩니다. 예를 들어 실현된 트레이트 배열은 다음으로 시작됩니다 ^A1234 . 배열 구분 기호 및 ID는 이 항목 ^B5678 뒤에 옵니다. 그 결과 실현된 트레이트 배열의 첫 번째 요소가 ID 5678(다음으로 시작됨)이라고 생각할 수 ^B 있습니다. 이러한 경우가 아니므로 데이터 파일의 순서와 구조에 익숙해야 합니다. 실현된 특성 배열의 첫 번째 요소(또는 CDF ^A 파일의 다른 배열)가 다음으로 시작되더라도 파일의 모양 또는 위치 순서는 배열 시작을 정의합니다. 그리고 배열의 첫 번째 요소는 항상 이전 항목과 구분됩니다 ^A .

샘플 CDF 파일

샘플 CDF 파일은 다음과 비슷합니다. 이 예제에 줄바꿈을 삽입하여 페이지에 맞출 수 있도록 했습니다.

고객 데이터 피드 파일 이름 지정 규칙

아래 섹션을 참조하여 파일 이름의 요소를 CDF 정의합니다.

CDF 파일 이름: 구문 및 예

일반적인 CDF 파일 이름에는 아래 나열된 요소가 포함됩니다. Note, italics indicates a variable placeholder:

구문

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz

스토리지 S3 버킷에서 파일은 파트너 ID(PID), 일 및 시간별로 오름차순으로 정렬됩니다.

CDF 파일 이름 요소 정의

다음 표에서는 CDF 파일 이름의 요소를 나열하고 정의합니다.
파일 이름 요소 설명
s3://aam-cdf/
Amazon S3 서버에서 CDF 파일에 대한 기본 루트 저장소 버킷입니다.
your S3 bucket name
CDF 파일이 들어 있는 읽기 전용 S3 버킷의 이름입니다.
day= yyyy-mm-dd
파일이 처리된 날짜입니다.
hour= hh
24시간 표기법으로 표현되고 UTC 표준 시간대로 설정되는 시간 값입니다. 고객 데이터 피드 파일 이름 시간 및 파일 컨텐츠 시간을 참조하십시오. #different-processing-times.
partner ID
파트너 ID.
AAM process ID _0
내부 Audience Manager 프로세스 ID.
.gz
gzip 파일 확장자입니다. CDF 파일은 압축됩니다.

고객 데이터 피드 파일 처리 알림

Audience Manager 다운로드 준비가 되면 알 수 있도록 파일 .info 을 S3 디렉토리에 CDF기록합니다. 또한 .info 파일에는 JSON CDF 파일 컨텐츠에 대한 서식이 지정된 메타데이터도 포함되어 있습니다. 이 알림 파일에 사용되는 구문 및 필드에 대한 자세한 내용은 이 섹션을 검토하십시오.

샘플 정보 파일

.info 파일에는 Files Totals 섹션이 포함되어 있습니다. 섹션에는 Files 각 시간별 파일에 대한 특정 지표를 포함하는 배열이 포함되어 있습니다. 이 Totals 섹션에는 특정 날짜에 대해 모든 CDF 파일에서 집계된 지표가 포함되어 있습니다. 파일의 내용은 다음 .info 예와 유사할 수 있습니다.
{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

정의된 정보 파일 필드

다음 표 목록을 작성하고 CDF 파일의 요소를 .info 정의합니다.

파일 개체

필드 설명
Files
CDF 파일에 대한 메타데이터가 포함된 배열을 시작합니다.
FileByteSize
파일 크기(바이트)입니다.
FileChecksumMD5
Amazon S3 ETag. 하이픈 아래의 숫자는 다중 부분 업로드 동안 파일을 작성하는 데 사용되는 부품 수를 보여줍니다. 파일 ETag 의 MD5 체크섬과 동일하지 않습니다.
FileName
FileSequenceNumber
각 파일의 인덱스 번호입니다.

합계 개체

필드 설명
Totals
모든 CDF 파일에 대해 집계된 데이터가 포함된 개체를 시작합니다.
Day
데이터를 사용할 수 있는 날짜입니다. yyyy- mm-dd 형식을 사용합니다.
Hour
데이터를 사용할 수 있는 시간입니다. UTC 표준 시간대에 설정된 24시간 형식을 사용합니다.
TotalByteSize
해당 날짜에 대한 모든 CDF 파일의 총 크기(바이트)입니다.
TotalNumberFiles
S3 디렉토리에 업로드된 총 파일 수입니다.

고객 데이터 피드 파일 이름 시간 및 파일 컨텐츠 시간이 다릅니다.

파일 이름 및 파일 내용에 타임스탬프가 들어 CDF 있습니다. 이러한 타임스탬프는 동일한 CDF 파일에 대해 다른 이벤트 프로세스를 기록합니다. 동일한 파일의 이름과 내용에 서로 다른 타임스탬프가 표시되는 것은 일반적이지 않습니다. 각 타임스탬프를 이해하면 이 데이터를 사용하여 작업하거나 시간별로 정렬하려고 할 때 일반적인 실수를 방지할 수 있습니다.

CDF 파일 타임스탬프 찾기

CDF 파일은 두 개의 분리된 위치에서 시간을 다르게 기록합니다.

타임스탬프 간 차이 이해

다음 표에서는 파일 타임스탬프에 대한 추가 세부 정보와 해당 타임스탬프를 적절히 사용하는 방법에 대한 정보를 제공합니다. CDF
타임스탬프 위치
설명
파일 이름
CDF 파일 이름의 타임스탬프는 파일 배달을 Audience Manager 준비하는 시간을 나타냅니다. 이 타임스탬프는 UTC 시간대에서 설정됩니다. 24시간 표기법으로 2자리 시간으로 서식이 지정된 매개 변수를 사용합니다. hour= 이 시간은 파일 내용에 기록된 이벤트 시간과 다를 수 있습니다. CDF 파일을 사용하여 작업할 때 특정 시간 동안 S3 버킷이 비어 있는 경우가 있습니다. 빈 버킷은 다음 중 하나를 의미할 수 있습니다.
  • 특정 시간에 대한 데이터는 없습니다.
  • 우리 서버는 많은 부하를 겪고 있어서 특정 시간 동안 파일을 처리할 수 없다. 서버가 응답할 때 이전 시간 버킷 파일에 들어가야 하는 파일을 이후 시간 값이 있는 버킷으로 표시합니다. 예를 들어 17시간 버킷에 있어야 하는 파일이 18시간 버킷에 나타나는 경우(파일 이름에 포함 hour=18 )이 표시됩니다. 이 경우 서버가 17시간 내에 파일 처리를 시작했지만 해당 시간 간격 내에 처리할 수 없었습니다. 대신 파일이 다음 시간별 시간 버킷으로 푸시됩니다.
중요​ : 시간별로 이벤트를 그룹화하는 데 파일 이름 타임스탬프를 사용하지 마십시오. 시간별로 그룹화해야 하는 경우 파일 컨텐츠의 EventTime 타임스탬프를 사용합니다.
파일 내용
CDF 파일 내용의 타임스탬프는 데이터 수집 서버가 파일 처리를 시작한 시간을 나타냅니다. 이 타임스탬프는 UTC 시간대에서 설정됩니다. 시간 형식이 지정된 EventTime 필드를 사용합니다 yyyy-mm-dd hh:mm:ss . 이 시간은 페이지의 실제 이벤트 시간에 가깝지만 파일 이름의 시간 표시기와 다를 수 있습니다.
: 파일 이름의 hour= 타임스탬프와 달리 시간 EventTime 에 따라 데이터를 그룹화하는 데 사용할 수 있습니다.