Show Menu
主题×

入站客户数据摄取常见问题解答

有关将离线数据导入Audience manager的常见问题解答。
 
您能否总结入门过程?
入门过程由2个核心组件组成,这些组件在“批量数据传 输过程”中进行了说明 。 这包括:
  • ID同步
  • 入站数据文件( .sync 文件或 .overwrite 文件)
以下是查看文档后您可能发现有帮助的问题和答案列表。
为了简化演示,本节中的示例被简化或缩短。 有关文件格式和语法的详细规范,请参阅入站数据摄取文档。
 
您能否总结部署过程?
我们建议:
  • 与数据提供者一起根据规范设置每日入站数据文件的格 Adobe 式。
  • 将测试数据文件传输到以进 Adobe 行格式验证。
  • 与顾问一 Adobe 起制作一个适用于解释数据文件内容的分类。
  • 在分阶段/开发环境中,确认ID同步配置为正确获取数据提供者的访客ID并将其实时传输到服 Audience Manager 务器。
  • 将DIL/ID同步部署到生产。 ID同步将由Adobe顾问配置为DIL代码中的模块。
  • 将生产数据文件传输到 Audience Manager。 鉴于ID同步映射的依赖性,在生产代码部署后一周内开始传输数据可能是有意义的,但是,在代码投入生产后,您可以立即开始传输数据文件。
 
我应使用哪种FTP模式传输压缩或加密文件?
 
我能否先上传入站数据文件(.sync或.overwrite文件),然后再将Audience Manager代码部署到生产中?
  • 如果将数据提供者配置为使用配置文件链 接进行跨设备定位 ,则ID同步标识到匹配的访客ID后不久便可用于定位的数 Audience Manager 据。
  • 如果数据提供者未配置为使用该功 Profile Link 能, Audience Manager 则仅处理入站数据文件中访客ID的数据,这些数据之前已同步/匹配回访客 Audience Manager ID。
请考虑以下未配置数据提供者使用的用例 Profile Merge:
用例 描述
用例 1
星期一,在CRM数据库中标识为访客ABC的访客登录,这将启动客户端ID同步。 Audience Manager存储访客ABC到 Audience Manager访客 123的映射。
星期二,CRM数据库将一个数据文件( .sync )传输到Audience Manager服 器,并记录如下:
  • ABC "gender"="male","luxury_shopper"="yes"
在这种情况下, Audience Manager :
  • 通过存储的ID同步映射识别访客ABC。
  • 将特征与访 male 客123 luxury_shopper 个人资料相关联。
用例 2
星期一,CRM数据库将数据文件( .sync )推送到 Audience Manager Server,并记录如下:
  • DEF "gender"="female","wine_enthusiast"="yes"
Audience Manager没有此访客(或关联的访客ID)的记录,因此不会处理此记录。
星期二,访客DEF登录。 此操作将启动该访客的第一个客户端ID同步。 此操作将访客DEF映射到 Audience Manager ID 456。 但是,此访客没有与其个人资料关联的CRM数据。 因此, Audience Manager 不会返回并重新处理旧文件。
星期三,CRM数据库将另一个数据文件推送到 Audience Manager Server,并且记录如下:
  • DEF "gender"="female","wine_enthusiast"="yes","dma"="paris"
在这种情况下, Audience Manager :
  • 从存储的ID同步映射识别访客DEF。
  • 将特征、 female paris wine_enthusiast visitor 456配置文件关联。
案例3
星期一, Audience Manager Server收到两个文件,其中包含以下记录:
.sync 文件包含:
  • GHI 123456789
.overwrite 文件包含:
  • GHI "gender"="male" "wine_enthusiast"="no"
  • JKL "gender"="female" "wine_enthusiast"="yes"
Audience Manager保留访客JKL到ID 789的映射记录,该记录从以前的ID同步开始。
在这种情况下, Audience Manager :
  • 从存储的ID同步映射识别访客JKL。
  • 将特征和 female 访 wine_enthusiast 客ID 789的配置文件关联。
  • 忽略访客GHI的特征关联,因为其ID仅在当前批次中同步。 要将特征与访客GHI关联,您需要在将来的文件中包含这 .overwrite 些特征。
 
我应该在几点钟传输文件?
Audience Manager 一天中多次检查和处理文件。 随时上传数据。
 
上载文件中的数据可用于定位需要多长时间?
48小时后,数据可供定位。 此外,请勿将“成功上传”电子邮件解释为数据可用的声明。 这只表示已 Audience Manager 经选取了文件并完成了第一步处理。
 
我应该多久发送一次文件,这些文件应是完整文件还是增量文件?
作为最佳实践,为新访客和数据已更改的访客每天发送增量文件一次。 许多 Audience Manager 客户每月发送一次完整文件。 但是,这些文件间隔和增量是灵活的。 您应该按增量发送数据,并在有时发送数据,这对您来说是有意义的。
 
Audience Manager在服务器上保存我的文件多长时间?
FTP文件在处理后即被删除。 S3 文件将在30天后删除。 由于格式、语法或其他错误而无法处理的文件将被删除。 另请参阅隐私 和数据保留常见问题解答
 
完整文件和增量文件之间有何区别?
  • 完整:完整文件将覆盖所有现有访客资料,并用文件中的数据替换这些资料。 完整文件由附加到文件 .overwrite 名的标记标识。 您可以使用文 .overwrite 件重置访客特征或删除陈旧的过时特征。
    文件 .overwrite 仅覆盖与此数据 Audience Manager 提供者关联的配置文件数据。 换句话说,与访客关 Adobe Analytics 联的所有数据在文件处理完成后 .overwrite 将保持不变。
  • 增量:增量文件会向现有访客配置文件添加新数据。 增量文件由附加到文件 .sync 名的标记标识。 在增量文件中发送不会擦除或覆盖现有配置文件。
以下用例演示了这些文件类型如何影响存储的访客配置文件。
用例 描述
增量和完整
  • 第1天文 .sync 件内容: visitor123 = a,b,c
  • 第2天 .overwrite 文件内容: visitor123 = c,d,e
  • 第3天访客资料ID 123包含 c,d,e
仅增量
  • 第1天文 .sync 件内容: visitor123 = a,b,c
  • 第2天 .sync 文件内容: visitor123 = c,d,e
  • 第3天访客资料ID 123包含 a,b,c,d,e
有关完整和增量文件类型的详细信息,请参阅:
 
如果我向从未执行页面ID同步的访客发送ID文件,会发生什么情况?
在处理过程 Audience Manager 中,您只需跳过该记录并转到下一个记录。 如果将DPID(数据提供者ID)设置为跨设备DPID,则保存在ID同步之前摄取的数据,并在ID同步发生不久后可供使用。
 
时间戳是什么,它用于什么,您能提供一个示例吗?
时间戳用于记录和记录保存。 格式正确的入站文件名使用的语法需要这些参数。 请参阅:
 
什么是数据提供者ID(DPID),我如何获得它?
您的Adobe顾问将为您的特定数据源分配一个三位数或四位数的DPID。 此ID是唯一的,不会更改。
 
每日数据文件可以有多大?
 
Audience manager是否支持文件压缩?
是的,请参阅:
 
我的数据源数据库中的主键是电子邮件地址。 这是否被视为个人身份识别信息?
能。Audience Manager 不会将电子邮件地址存储在我们的数据库中。 在启动ID同步之前,应为访客分配随机ID或电子邮件地址的单向哈希版本。
 
数据文件内容是否区分大小写? ID同步如何?
数据文件有两个基本组件:用户ID(请参阅“文件变量已定 义”中的用户ID )和配置文件数据,通常以键值对或代码的形式显示。 用户ID区分大小写。 通常,配置文件或键值数据不区分大小写。
 
我应该使用FTP还是Amazon S3传输文件?
作为最佳实践,我们建议 Amazon S3 这样做,因为过程更简单。 Audience Manager 无论如何传输FTP S3 文件,这样,如果您自己放置文件,流程就会更加 Amazon S3 简化。 此外,同时上传到FTP的客户共享FTP的带宽,因此他们预计上传速度会更慢。 Amazon S3 也是复制和分发的,因此它通常比FTP服务器更安全、更可靠。 有关详细信息,请参 阅关于Amazon S3
 
Audience Manger如何处理入站文件?
Audience Manager 用于 Amazon Simple Queue Service (SQS) 入站数据处理。 下面是其工作原理:
  1. Audience Manager 客户将其入站数据上传到 Amazon S3 存储段。
  2. 数据进入队 Amazon SQS 列,等待被处理 Audience Manager。
  3. Audience Manager 从队列中最多读取119000个条目, Amazon SQS 并将它们分成多达3个批。 每批中的文件将同时处理。
 
我需要同时上传多个文件。 文件是否将同时处理?
看情况。 Audience Manager 从队列中最多读取119000个条目, Amazon SQS 并将它们分成多达3个批。 只有在同一批处理您的文件时,才会同时处理这些文件。 但是,由于每天摄取的数据量很大, Audience Manager 无法保证任何文件处理顺序。