Show Menu
トピック×

ロングテール分析コード項目

大量の一意の値を含むディメンションを使用する場合、「ロングテール」というラベルの付いたレポートに値が表示されることがあります。 このディメンション項目は、レポートアーキテクチャCJAが使用する一意の値が多すぎて処理できないことを意味します。

CJA処理のアーキテクチャと固有の値

CJAは、レポートの実行時にそのレポートを処理し、組み合わせたデータセットを複数のサーバに配布します。 処理サーバーごとのデータは、個人IDでグループ化されます。つまり、1つの処理サーバーに特定の人のすべてのデータが含まれます。 処理が終了すると、処理済みデータのサブセットがアグリゲータサーバに渡されます。 処理されたデータのサブセットはすべて結合され、ワークスペースレポートの形式で返されます。
データのサブセットを処理する個々のサーバーが500,000個を超える一意のディメンション項目に遭遇した場合、そのサブセットの上位500,000個のディメンション項目を返し、残りの項目を「ロングテール」に返します。 ワークスペースレポートに表示される「ロングテール」ディメンション項目は、500,000個の固有値を超えた個々の処理サーバーの値の合計です。

「ロングテール」と「低トラフィック」の違い

以前のバージョンのアドビAnalyticsでは、異なる処理アーキテクチャが使用されていました。 データは収集時に処理されました。 ディメンションが500,000個の固有値に達し、1M個の固有値でよりアグレッシブなフィルターを適用した後、ディメンション項目が「低トラフィック」の下に配置されました。 各カレンダー月の最初に、一意の値の数がリセットされました。 処理されたデータは永久的でした。 「低トラフィック」から既存のデータを取得する方法はありません。
CJAでは、個々の処理サーバーに500,000個を超える固有値が含まれている場合にのみ、ディメンション項目が「ロングテール」に入力されます。 処理されたデータは永久的ではありません。つまり、レポートを変更することで、「ロングテール」ディメンション項目を減らすことができます。

'ロングテール'ディメンション項目の削減

「ロングテール」ディメンション項目を減らす場合は、次のいずれかを推奨します。
  • セグメントを使用します。 セグメントは、各サーバーがデータのサブセットを処理するたびに適用されます。 返される一意の値の数を制限すると、ディメンション項目「ロングテール」が減少します。
  • ルックアップデータセットディメンションを使用します。 ルックアップデータセットのディメンションは、イベントデータセットのディメンション項目を組み合わせたもので、返される一意の値の数を制限します。
全体として、500,000個を超える個別ディメンション項目を含むレポートを使用するのは困難です。 セグメントまたはルックアップデータセットディメンションを適用する場合、「ロングテール」の存在を減らしながら、レポートで消費しやすくすることができます。 CJAの開発が進むにつれ、アドビではこのエクスペリエンスの向上を計画しています。