高基数维度

使用包含许多唯一值的维度时,生成的报表可能包含太多要显示或计算的唯一维度项。 通过删除被认为最不重要的维度项目,截断结果。 这些优化是为了保持项目和产品性能。

当您请求具有过多唯一值的报表时,Analysis Workspace会在维度标题中显示一个指示器,以说明并未包含所有维度项。 例如,“行:超过22,343,156的1-50”。 “大于”关键字表示已对报表应用了一些优化,以返回最重要的维度项目。

工作区中显示“大于”关键字的自由格式表,可显示1-50个大于22,343,156的关键字

确定要显示的维度项目

Customer Journey Analytics在运行报表时对其进行处理,将组合数据集分发到多台服务器。 每个处理服务器的数据按人员ID分组,这意味着单个处理服务器包含给定人员的所有数据。 一旦服务器完成处理,它就会将其处理过的数据的子集交给聚合器服务器。 所有已处理数据的子集都以工作区报表的形式组合并返回。

如果任何单个服务器处理的数据超过唯一阈值,它将先截断结果,然后再返回已处理的数据子集。 已截断的维度项目是根据用于排序的量度确定的。

如果排序量度是计算量度,则服务器使用计算量度中的量度来确定要截断的维度项目。 由于计算量度可以包含多个具有不同重要性的量度,因此结果的准确性可能会降低。 例如,在计算“每人收入”时,会返回总收入金额和人数,并在进行分配前进行汇总。 因此,每个单独的处理服务器都会选择删除哪些项目,而不知道它们的结果如何影响整体排序。

尽管高基数报表中可能缺少某些个别维度项,但列总数是准确的,且并非基于截断的数据。 计算量度中的“非重复计数”函数也不受截断的维度项目的影响。

高基数维度的最佳实践

适应高基数维度的最佳方法是限制报表处理的维度项目数。 由于所有报表在请求时都会进行处理,因此您可以调整报表参数以即时获得结果。 Adobe建议对高基数维度进行以下任何优化:

  • 使用 筛选. 过滤器在每个服务器处理数据子集时应用。
  • 使用搜索。 从搜索词中排除的Dimension项目将从报表结果中删除,这样您更有可能看到所需的维度项目。
  • 使用查找数据集维度。查找数据集维度将事件数据集维度项组合在一起,从而限制返回的唯一值的数量。
  • 使用 包括/排除 数据视图管理器中的组件设置。
  • 缩短请求的日期范围。 如果许多唯一值随时间累积,则缩短工作区报表的日期范围可以限制服务器要处理的唯一值的数量。
  • 考虑使用 完整表导出 以返回表的所有行。
recommendation-more-help
080e5213-7aa2-40d6-9dba-18945e892f79