Show Menu
主题×

编辑转换配置文件

编辑数据集配置文件的 Transformation.cfg 文件的步骤。
  1. While working in your dataset profile, open the Profile Manager and click Dataset to show its contents.
    For information about opening and working with the Profile Manager, see the Data Workbench User Guide .
    Transformation子目录可能存在于Dataset目录中。 This subdirectory contains the Transformation Dataset Include files that have been created for one or more inherited profiles. 有关文件的 Transformation Dataset Include 信息,请参阅 数据集包含文件
  2. 右键单击旁边的复选标记, Transformation.cfg 然后单击 Make Local 。 A check mark for this file appears in the User column.
  3. 右键单击新创建的复选标记,然后单击 Open > in Workstation 。 The Transformation.cfg window appears.
    您还可以从 Transformation.cfg 打开文件 Transformation Dependency Map。 有关信息,请 transformation dependency maps参阅数 据集配置工具
  4. 参考下表,编辑该配置文件中的参数。
    在 Data Workbench 窗口内编辑 Transformation.cfg 文件时,可以使用快捷键实现基本编辑功能,包括剪切 (Ctrl+x)、复制 (Ctrl+c)、粘贴 (Ctrl+v)、撤消 (Ctrl+z)、恢复 (Ctrl+Shift+z)、选择部分(单击并拖动)以及选择全部 (Ctrl+a)。In addition, you can use the shortcuts to copy and paste text from one configuration file ( .cfg) to another.
    A Transformation Dataset Include files for an inherited profile contains a subset of the parameters described in the following table as well as some additional parameters. 有关文件的信 Transformation Dataset Include 息,请参阅数 据集包含文件
    参数 描述
    End Time(结束时间)
    可选。过滤数据以包含到此时间戳之前的日志条目,但不包含此时的日志条目。Adobe 建议使用以下时间格式之一:
    • January 1 2013 HH:MM:SS EDT
    • Jan 1 2013 HH:MM:SS GMT
    例如,指定“July 29 2013 00:00:00 EDT”作为结束时间,将包含截至 2013 年 7 月 28 日美国东部时间晚上 11:59:59 的数据。
    必须指定时区。如果未指定,时区不会默认为 GMT。有关 Data Workbench Server 支持的时区缩写列表,请参阅 时区代码
    注意:如果为结束时间指定了一个值,则系统会设置一个名为 End Time(结束时间)的参数,并在数据集构建的整个转换阶段应用该参数。有关参数的信息,请参阅在数 据集包含文件中定义参数
    Extended Dimensions(扩展维度) 可选。Adobe 建议在一个或多个 转换数据集包含 文件中定义扩展维度。有关信息,请参阅转 换数据集包含文 件。
    Hash Threshold(哈希阈值)
    可选。对行进行随机二次采样的采样因子。如果设为数字 n,则每 n 个跟踪 ID 中只有一个会进入数据集,使数据集中的总行数按系数 n 减少。若要创建要求 100% 准确度(即包含所有行)的数据集,您需要将 Hash Threshold(哈希阈值)设为 1。
    如果 Log Processing.cfg Transformation.cfg 这两个文件中都指定了 Hash Threshold(哈希阈值),则该参数不会按顺序应用;而是会应用两个配置文件中设置最大的那个值。
    Log Entry Condition(日志条目条件) 可选。定义用于考虑将日志处理过程中输出的日志条目加入数据集配置文件中的规则。请参阅 日志条目条件 .
    New Visitor Condition(新访客条件) 可选。与 Web 数据一起使用。定义用于考虑将访客加入数据中的规则。 New Visitor Condition (新访客条件)为要用在数据集中的访客定义第一个日志条目(按时间排序)。此访客的所有后续日志条目都会包含在数据集中,无论这些条目是否符合此条件。请参阅 新访客条件 .
    Reprocess(重新处理)
    可选。此处可以输入任意字符或字符组合。更改此参数并保存文件会开始重新转换数据。
    有关重新处理数据的信息,请参阅 重新处理和重新转换
    Schema Checking(架构检查) true 或 false。如果为 true,则 Data Workbench Server 会识别数据集损坏问题,并在 Data Workbench Server 的 Trace 目录的日志文件中,记录与这些问题有关的信息。默认值为 true。Adobe 建议始终将此参数设为 true。
    Stages(阶段)
    可选。可以在 转换数据集包含 文件中使用的处理阶段的名称。处理阶段提供了一种对 转换数据集包含 文件中定义的转换进行排序的方式。如果您在多个 转换数据集包含 文件内定义了一个或多个转换,并且您希望特定的转换在转换过程中的特定时间点执行,则此参数非常有用。
    您在此处列出阶段的顺序决定了在转换过程中对 转换数据集包含 文件中的转换执行的顺序。“ 预处理 ”和“ 后处理 ”都是内置阶段;“ 预处理 ”始终是第一个阶段,“ 后处理 ”始终是最后一个阶段。默认情况下,有一个称为“ 默认 ”的指定阶段。
    添加新处理阶段
    • Transformation.cfg 窗口中,右键单击 阶段 ,然后单击 新增 > 阶段
    • 输入新阶段的名称。
    删除现有处理阶段
    • 右键单击要删除的阶段所对应的编号,然后单击 删除 < 阶段编号 >
    注意:当您在 转换数据集包含 文件中指定阶段时,该阶段的名称必须与您在此处输入的名称完全匹配。有关数据集包含文件的详细信息,请参阅 数据集包含文件
    Start Time(开始时间)
    可选。过滤数据以包含具有此时或之后时间戳的日志条目。Adobe 建议使用以下时间格式之一:
    • January 1 2013 HH:MM:SS EDT
    • Jan 1 2013 HH:MM:SS GMT
    例如,指定“July 29 2013 00:00:00 EDT”作为“ 开始时间 ”,将包含从 2013 年 7 月 29 日美国东部时间凌晨 12:00:00 开始的数据。
    必须指定时区。如果未指定,时区不会默认为 GMT。有关 Data Workbench Server 支持的时区缩写列表,请参阅 时区代码
    注意:如果为“开始时间”指定一个值,则系统会设置一个名为“开始时间”的参数,并在数据集构建的整个转换阶段应用该参数。有关参数的信息,请参阅在数 据集包含文件中定义参数
    Transformations(转换) 可选。Adobe 建议在一个或多个 转换数据集包含 文件中为数据集构建的转换阶段定义转换。有关信息,请参阅转 换数据集包含文 件。
    时区
    数据集配置文件的时区。时区用于进行时间转换和创建时间维度。请参阅 时区 .
    注意:在 Log Processing.cfg 文件中定义 Time Zone(时区)参数时,该参数仅用于进行时间转换。
  5. 右键单 (modified) 击窗口顶部,然后单击 Save
  6. 在列 Profile Manager中,右键单击列中的复 Transformation.cfg选 User 标记,然后单击 Save to > * dataset profile name 以使本地所做的更改生效。 在数据集配置文件同步之后,系统便会开始重新转换数据。
    请勿将已修改的配置文件保存到 Adobe 提供的任何内部配置文件中,因为当您安装这些配置文件的更新时,系统会覆盖您所做的更改。
    有关重新处理或重新转换数据的信息,请参阅重新 处理和重新转换