Show Menu
主题×

编辑日志处理配置文件

编辑数据集配置文件的 Log Processing.cfg 文件的步骤。
  1. While working in your dataset profile, open the Profile Manager and click Dataset to show its contents.
    For information about opening and working with the Profile Manager, see the Data Workbench User Guide .
    Log Processing子目录可能位于Dataset目录中。 This subdirectory contains the Log Processing Dataset Include files that have been created for one or more inherited profiles. 请参阅 数据集包含文件
  2. 右键单击旁边的复选标记, Log Processing.cfg 然后单击 Make Local 。 A check mark for this file appears in the User column.
  3. 右键单击新创建的复选标记,然后单击 Open > in Workstation 。 The Log Processing.cfg window appears.
    您还可以从 Log Processing.cfg 打开文件 Transformation Dependency Map。 有关转换依赖关系图的信息,请参阅 数据集配置工具
  4. 参考下表,编辑该配置文件中的参数。
    在 Data Workbench 窗口内编辑 Log Processing.cfg 文件时,可以使用快捷键实现基本编辑功能,包括剪切 (Ctrl+x)、复制 (Ctrl+c)、粘贴 (Ctrl+v)、撤消 (Ctrl+z)、恢复 (Ctrl+Shift+z)、选择部分(单击并拖动)以及选择全部 (Ctrl+a)。You can also use the shortcuts to copy and paste text from one configuration file ( .cfg) to another.
    A Log Processing Dataset Include file for an inherited profile contains a subset of the parameters described in the following table as well as some additional parameters. 请参阅 数据集包含文件
    参数 描述
    Log Sources(日志源) 数据源。请参阅 日志源
    End Time(结束时间)
    可选。过滤数据以包含到此时间戳之前的日志条目,但不包含此时的日志条目。Adobe 建议使用以下时间格式之一:
    • January 1 2013 HH:MM:SS EDT
    • Jan 1 2013 HH:MM:SS GMT
    例如,指定“July 29 2013 00:00:00 EDT”作为结束时间,将包含截至 2013 年 7 月 28 日美国东部时间晚上 11:59:59 的数据。请参阅 数据过滤器
    必须指定时区。如果未指定,时区不会默认为 GMT。有关 Data Workbench Server 支持的时区缩写列表,请参阅 时区代码
    注意: 传感器 、日志文件和 XML 源的 Use Start/End Times(使用开始/结束时间)参数与此参数相关。请参阅“日志源” 中讨论 这些源类型的部分。
    Fields(字段) 可选。Adobe 建议在一个或多个 日志处理数据集包含 文件中定义 Fields (字段)。请参阅 日志处理数据集包含文 件。
    Group Maximum Key Bytes(组最大键字节数)
    服务器可为单个跟踪 ID 处理的最大事件数据量。超过此限制的数据会被数据集构建过程过滤出去。当键拆分处于活动状态时,此值必须设为 2e6;当键拆分处于不活动状态时,此值必须设为 1e6。请参阅 键拆分
    注意:在未咨询 Adobe 的情况下,请勿更改此值。
    Hash Threshold(哈希阈值)
    可选。对行进行随机二次采样的采样因子。如果设置为数字 n,那么每 n 个跟踪 ID 中只有一个会进入数据集,从而将数据集中的总行数减少到原来的 1/n。
    要创建需要 100% 准确度(即包括所有行)的数据集,您需要将 Hash Threshold(哈希阈值)设置为 1。
    值:
    Hash Threshold = 1 (100% 的数据,包含所有行。)
    Hash Threshold = 2 (1/2 的数据,包含一半的行。)
    Hash Threshold = 3 (1/3 的数据,包含三分之一的行,但在“查询完成”中会四舍五入为 34%。)
    Hash Threshold = 4 (1/4 的数据,包含四分之一的行。)
    注意:如果使用 Hash Threshold = 8 ,那么会提供 1/8 的数据,即 12.5%。但 查询完成 值会将此值四舍五入为 13%。其他示例包括 Hash Threshold = 6 ,此值将提供 17% 的查询结果。 Hash Threshold = 13 将提供 8% 的查询结果。
    如果 Log Processing.cfg Transformation.cfg 文件中都指定了 Hash Threshold (哈希阈值),则该参数不会按顺序应用,而是会应用两个配置文件中设置最大的那个值。请参 阅数据过滤 器。
    Log Entry Condition(日志条目条件) 可选。定义用于考虑将日志条目加入数据集中的规则。请参阅 日志条目条件 .
    Reprocess(重新处理)
    可选。此处可以输入任意字符或字符组合。更改此参数并将文件保存到 Data Workbench Server 计算机中,会开始重新处理数据。
    Split Key Bucket Space(拆分键存储段空间)
    键拆分中涉及的参数。当键拆分处于活动状态时,其值应该为 6e6。请参阅 键拆分
    注意:在未咨询 Adobe 的情况下,请勿更改此值。
    Split Key Bytes(拆分键字节数)
    键拆分中涉及的参数。当键拆分处于活动状态时,其值应该为 1e6;当键拆分处于不活动状态时,其值应该为 0。请参阅 键拆分
    注意:在未咨询 Adobe 的情况下,请勿更改此值。
    Split Key Space Ratio(拆分键空间比率)
    键拆分中涉及的参数。当键拆分处于活动状态时,其值应该为 10。请参阅 键拆分
    注意:在未咨询 Adobe 的情况下,请勿更改此值。
    Stages(阶段)
    可选。可以在 日志处理数据集包含 文件中使用的处理阶段的名称。处理阶段提供了一种对 日志处理数据集包含 文件中定义的转换进行排序的方式。如果您在多个 日志处理数据集包含 文件内定义了一个或多个转换,并且您希望特定的转换在日志处理过程中的特定时间点执行,则此参数非常有用。
    您在此处列出阶段的顺序决定了在日志处理过程中对 日志处理数据集包含 文件中的转换执行的顺序。“预处理”和“后处理”都是内置阶段;“预处理”始终是第一个阶段,“后处理”始终是最后一个阶段。默认情况下,有一个称为“默认”的指定阶段。
    添加新处理阶段
    • Log Processing.cfg 窗口中,右键单击 阶段 ,然后单击 新增 > 阶段
    • 输入新阶段的名称。
    删除现有处理阶段
    • 右键单击要删除的阶段所对应的编号,然后单击 删除 < 阶段编号 >
    注意:当您在 日志处理数据集包含 文件中指定 阶段 时,该阶段的名称必须与您在此处输入的名称完全匹配。请参阅 数据集包含文 件。
    Start Time(开始时间)
    可选。过滤数据以包含具有此时或之后时间戳的日志条目。Adobe 建议使用以下时间格式之一:
    • January 1 2013 HH:MM:SS EDT
    • Jan 1 2013 HH:MM:SS GMT
    例如,指定“July 29 2013 00:00:00 EDT”作为开始时间,将包含从 2013 年 7 月 29 日美国东部时间凌晨 12:00:00 开始的数据。请参阅 数据过滤器
    必须指定时区。如果未指定,时区不会默认为 GMT。有关 Data Workbench Server 支持的时区缩写列表,请参阅 时区代码
    注意: 传感器 、日志文件和 XML 源的 Use Start/End Times(使用开始/结束时间)参数与此参数相关。请参阅“日志源” 中讨论 这些源类型的部分。
    时区
    可选。用于日志处理过程中时间转换的Data Workbench Server的时区(如x-local-timestring字段表示的转换)。
    注意:如果您想要在数据集构建的日志处理阶段访问已转换的时间字段,则必须指定时区。否则,Data Workbench Server 会在事件日志中记录一条错误。
    请参阅 时区 .
    Transformations(转换) 可选。Adobe 建议在一个或多个 日志处理数据集包含 文件中为日志处理定义转换。请参阅 日志处理数据集包含文 件。
  5. 右键单 (modified) 击窗口顶部,然后单击 Save
  6. 在列 Profile Manager中,右键单击列中的复 Log Processing.cfg选 User 标记,然后单击 Save to > < dataset profile name > 以使本地所做的更改生效。 在数据集配置文件同步之后,系统便会开始重新处理数据。
    请勿将已修改的配置文件保存到 Adobe 提供的任何内部配置文件中,因为当您安装这些配置文件的更新时,系统会覆盖您所做的更改。
    有关重新处理数据的详细信息,请参阅重新 处理和重新转换