Show Menu
화제×

데이터 피드 콘텐츠 - 개요

이 섹션은 데이터 피드 배달에서 발견되는 파일을 설명합니다.

매니페스트 파일

매니페스트 파일에는 업로드된 데이터 세트의 일부인 각 파일에 대한 다음 정보가 있습니다.
  • 파일 이름
  • 파일 크기
  • MD5 해시
  • 파일에 포함된 레코드 수
매니페스트 파일은 Java JAR 매니페스트 파일과 같은 형식을 따릅니다.
The manifest file is always delivered last as a separate .txt file, so that its existence indicates that the complete data set for that request period has already been delivered. 매니페스트 파일은 다음에 따라 명명됩니다.
[rsid]_[YYYY-mm-dd].txt

일반적인 매니페스트 파일에는 다음과 비슷한 데이터가 포함됩니다.
Datafeed-Manifest-Version: 1.0
 Lookup-Files: 1
 Data-Files: 1
 Total-Records: 611

 Lookup-File: rsid_date-lookup_data.tar.gz
 MD5-Digest: af6de42d8b945d4ec1cf28360085308
 File-Size: 63750

 Data-File: 01-rsid_date.tsv.gz
 MD5-Digest: 9c70bf783cb3d0095a4836904b72c991
 File-Size: 122534
 Record-Count: 611

모든 매니페스트 파일에는 조회 파일, 데이터 파일의 총 수, 모든 데이터 파일의 총 레코드 수를 나타내는 헤더가 있습니다. 이 헤더 뒤에는 데이터 피드 배달에 포함된 각 파일에 대한 정보를 포함하는 여러 개의 섹션이 옵니다.
Some feeds are configured to receive a .fin file instead of a .txt manifest. The .fin indicates that the upload is complete, but it contains no metadata about the upload.

조회 파일

일부 데이터 피드 열은 실제 값에 해당하는 숫자를 출력합니다. 조회 파일은 데이터 피드 열의 숫자를 일치시키고 실제 값과 일치시키는 데 사용됩니다. 예를 들어, 히트 데이터 열의 "497" 값은 browser 조회 시 히트가 "Microsoft Internet Explorer 8"에서 왔음을 browser.tsv 나타냅니다.
Note that the column_headers.tsv and event_list.tsv are specific to the data feed and report suite. browser.tsv 와 같은 다른 파일은 일반적입니다.
조회 파일은 다음에 따라 명명된 zip 압축 파일로 배달됩니다.
[rsid]_[YYYY-mm-dd]-lookup_data.[compression_suffix]

  • column_headers.tsv ((이 데이터 피드에 대해 사용자 정의됨)
  • browser.tsv
  • browser_type.tsv
  • color_depth.tsv
  • connection_type.tsv
  • country.tsv
  • javascript_version.tsv
  • languages.tsv
  • operating_systems.tsv
  • plugins.tsv
  • resolution.tsv
  • referrer_type.tsv
  • search_engines.tsv
  • event_lookup.tsv ((이 데이터 피드에 대해 사용자 정의됨)

히트 데이터 파일

Hit data is provided in a hit_data.tsv file. 이 파일의 데이터 양은 배달 형식(시간별 또는 일별, 단일 파일 또는 여러 파일)에 따라 결정됩니다. 이 파일은 히트 데이터만 포함합니다. 열 헤더는 조회 파일과 별도로 배달됩니다. 이 파일의 각 행은 하나의 서버 호출을 포함합니다.
Adobe에서 제공하는 파일은 사용자가 구성한 데이터 피드 유형에 따라 달라집니다. 모든 파일은 ISO-8859-1을 사용하여 인코딩됩니다.
  • [rsid] 은 데이터 피드의 보고서 세트 ID를 나타냅니다.
  • [index] 는 여러 파일 피드에서만 사용되며 페이지 매김된 파일의 올바른 순서를 나타냅니다.
  • [YYYY-mm-dd] 은 데이터 피드가 시작되는 날을 나타냅니다.
  • [HHMMSS] 는 시간별 피드에서만 사용되며 데이터 피드가 사용되는 시작 시간을 나타냅니다.
  • [compression_suffix] 는 사용된 압축 유형을 나타냅니다. 일반적으로 데이터 피드는 tar.gz 또는 zip 파일로 압축됩니다.

일별, 단일 파일

하루 동안 데이터가 수집되면 하나의 압축 데이터 파일과 매니페스트 파일을 받게 됩니다. 데이터 파일의 이름은 다음과 같습니다.
[rsid]_[YYYY-mm-dd].[compression_suffix]
데이터 파일의 압축을 해제하면 해당 날짜의 모든 데이터가 포함된 단일 hit_data.tsv 파일과 필요한 열에 대한 조회 파일이 포함됩니다.

일별, 여러 파일

하루 동안 데이터가 수집되면 하나 이상의 압축 데이터 파일과 매니페스트 파일을 받게 됩니다. 데이터 파일의 이름은 다음과 같습니다.
[index]-[rsid]_[YYYY-mm-dd].[compression_suffix]
각 데이터 파일의 압축을 해제하면 약 2GB의 압축되지 않은 데이터가 포함된 단일 hit_data.tsv 파일과 필요한 열에 대한 조회 파일이 포함됩니다.

시간별, 단일 파일

한 시간 동안 데이터가 수집되면 단일 압축 데이터 파일과 매니페스트 파일을 받게 됩니다. 데이터 파일의 이름은 다음과 같습니다.
[rsid]_[YYYY-mm-dd]-[HHMMSS].[compression_suffix]
데이터 파일의 압축을 해제하면 해당 시간의 모든 데이터가 포함된 단일 hit_data.tsv 파일과 필요한 열에 대한 조회 파일이 포함됩니다.

시간별, 여러 파일

한 시간 동안 데이터가 수집되면 하나 이상의 압축 데이터 파일과 매니페스트 파일을 받게 됩니다. 데이터 파일의 이름은 다음과 같습니다.
[index]-[rsid]_[YYYY-mm-dd]-[HHMMSS].[compression_suffix]
각 데이터 파일의 압축을 해제하면 약 2GB의 압축되지 않은 데이터가 포함된 단일 hit_data.tsv 파일과 필요한 열에 대한 조회 파일이 포함됩니다.

데이터 파일 크기

히트 데이터 파일 크기는 적극적으로 사용된 변수의 수와 보고서 세트로 전송된 트래픽 양에 따라 크게 달라집니다. 하지만 평균적으로 데이터 행은 500B(압축) 또는 2KB(비압축)입니다. 이 값을 서버 호출 수로 곱하면 데이터 피드 파일의 크기를 대략적으로 예상할 수 있습니다. 조직에서 데이터 피드 파일을 받기 시작하면 행 수를 총 파일 크기로 나누어 더 정확한 숫자를 찾을 hit_data.tsv 수 있습니다.