Show Menu
トピック×

寸法設定

ここでは、さまざまなタイプの寸法と、DWBでの寸法の設定方法について説明します。

ディメンションとは

最も基本的なレベルでは、ディメンションは、データセット内のデータを分類できるカテゴリです。
ベストプラクティス:データスキーマのディメンションは、任意の名前を指定できます。 このコースで使用および説明するディメンション名は、ベストプラクティスと見なされます。 ディメンションの名前を変更できます。 他のデータセットにアクセスする際に、データセットの違いがわかり始めます。 ディメンションの名前ではなく、ディメンションの目的を理解することが重要です。 例えば、「訪問者」、「顧客」、「個人」、「消費者」、「ユーザー」と呼ばれる場合でも、単一の人物に関する情報を収集する際に使用される最高レベルの可算ディメンションを示す用語であることを理解することが重要です。
詳しくは、『データセット設定ガイド 』を参照してください

DWBの寸法のタイプ

Data Workbenchには、次の2種類のディメンションがあります。拡張ディメンションと派生ディメンションを参照してください。
拡張ディメンションは、「生の」データファイルのフィールドから作成されます。 拡張ディメンションは、「生」データを分類し、データ間の関係を指定するために使用されます。 拡張ディメンションは、Data Workbenchアーキテクトが作成します。
派生ディメンションは、既存の拡張ディメンション定義を使用してデータセットを処理した後、「クライアント側」でユーザーが作成します。 例えば、既存のURIディメンションに基づいて、Page Nameディメンションの派生を作成し、特定のURIの代わりにわかりやすいページ名を表示することができます。 すべてのディメンションは、分類(グループ化)された要素または項目で構成され、ディメンションを形成します。 次に、3つの次元とその要素を示します。
多くの派生ディメンションは、異なるタイプの可視化を実現するために自動的に作成されます。例えば、ユーザーがサイトまたはプロセスマップを作成すると、DWBサーバーはプレフィックスディメンションを作成します。 他にも、レポーティング時間ディメンションのように、プロファイルのディメンションディレクトリ内のファイルによって定義されるものもあります。
任意のディメンションに表示される要素は、データセットに読み込むように選択されたレコードに存在する値のみを反映します。 例えば、「May '12'」のデータがない場合、その月は「Month」ディメンションに表示されません。

拡張ディメンション

拡張ディメンションのタイプ
1)可算ディメンション
最上位レベルには可算ディメンションがあります。 可算ディメンションは、2つの主要な機能を果たします。 まず、要素をカウントするディメンションを指定します。 言い換えると、可算は次のような質問に答えます。
  • 「ホームページを訪問した訪問者は何人か。」
  • 「google.comからの訪問回数は?」
このため、指標を作成する基本的な基本要素として、可算がよく使用されます。
可算の2つ目の主な機能は、それらがデータセットスキーマ構造のバックボーンを形成することです。 データスキーマおよびその他のすべてのディメンションは、可算の下にグループ化され、その下に属するように編成されます。 言い換えると、ディメンションを「カテゴリ」と見なすと、可算は、これらの「カテゴリ」をグループに整理する方法になります。
可算ディメンションの下にグループ化されたディメンションは、可算ディメンションの「レベル」にあると言います。 例えば、「電子メールアドレス」を訪問者レベルに、「ブラウザー」を訪問レベルに設定できます。 「親」と「子」は、可算とその下にグループ化されたディメンションとの関係を指します。 例えば、訪問者は電子メールアドレスの「親」です。 逆に、電子メールアドレスは訪問者の「子」です。
2)シンプルディメンション
すべてのディメンションの中で最も一般的なものは、シンプルディメンションです。 シンプルディメンションは、親の可算ディメンションと1対多の関係を持ち、ビジュアライゼーションで一般的に使用され、その要素を表示できます。 つまり、可算ディメンションは単純ディメンションに対して1つの値を持つことができますが、単純ディメンションは1つ以上の可算ディメンションに属することができます。 例えば、顧客の名前が「John」で、顧客の名は1つだけですが、他の多くの顧客の名前が「John;」であるとします。 別の例として、1つのブラウザー(Firefoxなど)のみがWebサイトへの特定の訪問に使用できますが、そのブラウザーは多くの異なる訪問に使用できます。
可算ディメンションが「いくつ?」と答える場合、単純ディメンションは「どれが?」と答えます。 可算ディメンションセクションで前述と同じ例を使用する。ページ名はシンプルディメンションです。 テーブルとシンプルディメンションのページ名を使用して、次のような質問に答えることができます。
  • 「最もページビュー数の多いページはどれか。」
  • 「最も訪問回数の多い買い物かごページはどれか。」
3)多対多ディメンション
多対多ディメンションは、親の可算ディメンションと多対多の関係を持ちます。 例えば、External Search Termという名前のディメンションが訪問レベルにある場合、特定の外部検索用語は1つまたは複数の訪問で使用でき、特定の訪問には1つまたは複数の外部検索用語が含まれる場合があります。 したがって、外部検索用語は多対多ディメンションです。
4)数値ディメンション
数値ディメンションは、数値を持つ単純ディメンションの一種です。 数値ディメンションは、多くの場合、指標で使用するために作成されます。 数値ディメンションの例としては、「売上高」、「注文件数」、「数量」があります。 上の例では、「顧客の注文件数」は数値ディメンションです。 5)非正規ディメンション 非正規ディメンションは、親の可算ディメンションと1対1の関係を持つディメンションです。 非正規ディメンションは、識別データのような高いカーディナリティ(多くの一意の要素)を持つディメンションでよく使用されます。 例えば、1人の訪問者が持つユーザーIDは1人のみで、1人の訪問者にのみ属するユーザーIDは1人の訪問者です。 したがって、これは1対1の関係であり、非正規ディメンションになる可能性があります。
例えば、Geometrixx WebユーザーIDは、顧客レベルで非正規ディメンションです。 非正規なので、親ディメンションとは1対1の関係を持ちます。つまり、各WebユーザーIDには1つの顧客が含まれ、各顧客には1つのWebユーザーIDしか含まれません。 したがって、「Customers」指標は、Geometrixx WebユーザーIDの各要素に対して「1」のみになります。
6)時間ディメンション
時間ディメンションを使用すると、指定したタイムスタンプフィールドに基づいて、定期的または絶対的なローカル時間ディメンションのセットを作成できます。 時間ディメンションの例としては、「日」、「時間」、「週」、「時間帯」があります。 上の例では、「時間帯」の表に、日の異なる時間帯に受け取った訪問数とページビュー数が示されています。
表示の書式設定に使用する%エスケープは、標準のCライブラリ strftimeと同じです

拡張ディメンションの定義

拡張ディメンションの定義手順:
  1. データセットプロファイル内でプロファイルマネージャーを開き、Dataset をクリックしてその内容を表示します。
  2. 拡張ディメンションの定義先となる Transformation.cfg ファイルまたは変換データセットインクルードファイルを開きます。
  3. Transformationsを右クリックし、新規追加/をクリックしま <Extended dimension type> す。
  4. 拡張ディメンションに必要な情報を入力します。変換のタイプとそのパラメーターに関する情報については、次の節を参照してください。
  5. 独自に定義した拡張ディメンションには、そのディメンションに関する詳しい情報や使用上の注意点をコメント行として Comments パラメーターに追加することができます。To add a comment, right-click the Comments label and click* Add new > Comment Line*.
  6. 設定ファイルで拡張ディメンションを定義したら、ファイルをローカルに保存し、DWBサーバー上のデータセットプロファイルに保存します。

拡張ディメンションの非表示

拡張ディメンションは、DWBのディメンションメニューに表示されないように非表示にできます。 ディメンションを非表示にするには、ディメンション定義のHiddenプロパティを「True」に設定します。