Show Menu
主题×

了解数据集配置

数据集配置是指编辑配置文件(其参数为数据集构建提供规则)的过程。
构建的数据集实际位于 Data Workbench Server 计算机上存储的 temp.db 文件中,而数据集的配置文件则位于配置文件的目录内。配置文件包含一组出于特定分析目的而构建数据集(包括其扩展维度)的配置文件。此外,配置文件还包含一些实体(例如量度、派生维度、工作区、报表和可视化)的定义,以使分析人员能够与数据集交互并从中获取信息。
您正在编辑其数据集配置文件的配置文件就是您的数据集配置文件。数据集配置文件可以引用多个继承配置文件(可以是您创建和维护的任意配置文件),以便您能够完全根据自己的分析需要对 Adobe 应用程序进行配置。数据集配置文件还可以引用随 Adobe 应用程序一起提供的内部配置文件,为应用程序中所有可用的功能提供基础。
有关随 Adobe 应用程序一起提供的各类配置文件的详细信息,请参阅《Data Workbench 用户指南》**。
任何 Adobe 应用程序的数据集配置文件都必须在 Insight Server 计算机上包含以下配置文件:
  • Profile.cfg: ​列出继承配置文件和配置文件的处理服务器。处理服务器是用于处理配置文件数据的 Insight Server DPU。如果您安装了 Insight Server 群集,则可以指定多台 Insight Server 计算机来运行单个配置文件。
    有关将继承配置文件添加到数据集配置文件 Profile.cfg 文件的说明,请参阅《服务器产品安装和管理指南》 。有关安装 Insight Server 群集或将数据集配置文件配置为在 Insight Server 群集上运行的信息,请参阅《服务器产品安装和管理指南》
  • Dataset\Log Processing.cfg: ​控制数据集构建过程中的日志处理阶段。请参阅 日志处理 。 有关该文件的详细信 Log Processing.cfg 息,请参阅 日志处理配置文件
  • Dataset\Transformation.cfg: ​控制数据集构建过程中的转换阶段。请参阅 转换 . Transformation.cfg 文件通常配置数据集以进行特定于配置文件的分析。有关该文件的详细信 Transformation.cfg 息,请参阅 转换配置文件
  • 数据集包含文件: 文 dataset include 件包含数据集配置文件或文件中包含的参数子集, Log Processing.cfg 但 Transformation.cfg 是在继承的配置文件中存储和管理。 Dataset include 文件是主数据集配置文件的补充。 有关详细信息,请参阅 数据集包含文件
The dataset profile provided to you during the implementation of your Adobe application contains a set of dataset configuration files that you can open, edit, and save using the Profile Manager.
For information about the Profile Manager, see the Insight User Guide .
以下文件可让您控制数据集构建过程的其他方面(尽管并非所有数据集都需要):
  • Log Processing Mode.cfgLog Processing Mode.cfg 文件可让您暂停将数据处理到数据集中、指定离线源或指定 Data Workbench Server 保存其状态文件的频率。See Additional Configuration Files .
  • Server.cfgServer.cfg 文件为连接到 Data Workbench Server 的 Data Workbench 计算机指定默认数据缓存大小(以字节为单位)。See Additional Configuration Files .
  • Transform.cfg 和 Transform Mode.cfg: ​仅当您获得在 Adobe 应用程序中使用数据转换功能的许可时,这些文件才可用。Transform.cfg 文件包含为转换功能定义日志源和数据转换的参数。您定义的转换可处理源数据,并将其输出为您指定的格式。Insight Transform Mode.cfg 文件可让您暂停将数据处理到数据集中、指定离线源或指定运行转换功能的 Insight Server 保存其状态文件的频率。请参阅 转换功能
有关特定数据集配置任务的信息,请使用下表找到并阅读您感兴趣的任务:
如果您想要... 请参阅...
定义日志源
确定哪些日志条目会在日志处理过程中进入数据集
对具有大量事件数据的跟踪 ID 启用拆分功能
配置 Insight Server 以作为文件服务器单元运行
配置 Insight Server 以作为集中标准化服务器运行
设置时区以用于创建时间维度和进行时间转换
对 Adobe 提供的内部配置文件所包含的数据集配置文件做出细微更改
指定要从日志处理过程传递到转换过程的新数据字段
定义转换
创建扩展维度
定义要在日志处理过程或转换过程使用的参数
了解可供监控或管理数据集的 Insight 界面
隐藏某些扩展维度以使其不会显示在 Insight 的维度菜单中
覆盖配置文件中某些您无法或不想修改的数据集配置文件
重新处理您的数据集