Show Menu
トピック×

機械学習モデルの作成および公開手順

あなたはオンラインの小売サイトを所有しているとします。あなたは顧客が小売 Web サイトで買い物をする際に、自社が提供する他の様々な製品が目に入るよう、パーソナライズされた製品レコメンデーションを提示したいと考えています。Web サイトの存在期間全体にわたって、顧客データを継続的に収集し、このデータを使用してパーソナライズされた商品レコメンデーションを生成しようとします。
Adobe Experience Platform Data Science Workspace 事前に組み込まれた 製品Recommendationsレシピを使用して目標を達成する手段を提供します 。 Follow this tutorial to see how you can access and understand your retail data, create and optimise a machine learning Model, and generate insights in Data Science Workspace.
This tutorial reflects the workflow of Data Science Workspace, and covers the following steps for creating a machine learning Model:

はじめに

このチュートリアルを開始する前に、次の前提条件を満たす必要があります。
  • へのアクセス Adobe Experience Platform。 If you do not have access to an IMS Organization in Experience Platform, please speak to your system administrator before proceeding.
  • イネーブルメントアセット。次のアイテムをプロビジョニングするには、アカウント担当者にお問い合わせください。
    • Recommendations のレシピ
    • Recommendations の入力データセット
    • Recommendations の入力スキーマ
    • Recommendations の出力データセット
    • Recommendations の出力スキーマ
    • ゴールデンデータセット postValues
    • ゴールデンデータセットスキーマ
  • Download the three required Jupyter Notebook files from the Adobe public Git repository , these will be used to demonstrate the JupyterLab workflow in Data Science Workspace.
  • このチュートリアルで使用する次の主要概念に対する十分な理解
    • Experience Data Model :Adobeが導く標準化の取り組み。Customer Experience Managementの標準スキーマ(例:ExperienceEvent) Profile を定義します。
    • データセット:実際のデータ用に構成されたストレージおよび管理。 XDM スキーマ の物理的にインスタンス化されたインスタンス。
    • バッチ:データセットは、バッチで構成されます。バッチとは、一定期間に収集され、1 つの単位としてまとめて処理される一連のデータです。
    • JupyterLab: JupterLab は、Project用のオープンソースWebベースのインターフェイスで、に緊密に統合さ Jupyter れてい Experience Platformます。

データの準備

顧客に合わせてパーソナライズされた商品レコメンデーションを作成する機械学習モデルを作成するには、Web サイトにおける以前の顧客の購入を分析する必要があります。This section explores how this data is ingested into Platform through Adobe Analytics, and how that data is transformed into a Feature dataset to be used by your machine learning Model.

データを調べてスキーマを理解する

  1. Adobe Experience Platform にログインし、「 データセット 」をクリックして既存のデータセットをすべてリストし、調査するデータセットを選択します。In this case, the Analytics dataset Golden Data Set postValues .
  2. 右上近くにある プレビューデータセット ​を選択し、サンプルレコードを確認して、「 閉じる 」をクリックします。
  3. 右側パネルの「スキーマ」の下のリンクを選択してデータセットのスキーマを表示し、データセットの詳細ページに戻ります。
その他のデータセットは、プレビュー用にバッチを使用して事前設定されています。これらのデータセットを表示するには、上記の手順を繰り返します。
データセット名
スキーマ
説明
ゴールデンデータセット postValues
ゴールデンデータセットスキーマ
AnalyticsWeb サイトの ソースデータ
Recommendations の入力データセット
Recommendations の入力スキーマ
The Analytics data is transformed into a training dataset using a feature pipeline. このデータは、製品レコメンデーションの機械学習モデルのトレーニングに使用されます。 itemid および userid は、その顧客が購入した製品に対応しています。
Recommendations の出力データセット
Recommendations の出力スキーマ
スコア付け結果が保存されるデータセットには、各顧客にお勧めする製品のリストが含まれます。

モデルのオーサリング

The second component of the Data Science Workspace lifecycle involves authoring Recipes and Models. 製品 Recommendations レシピは、過去の購入データと機械学習を利用して、製品 Recommendations を大規模に生成できるように作られています。
レシピは、特定の問題を解決するために設計された機械学習アルゴリズムとロジックを含んでおり、モデルの基盤となります。さらに重要な点は、レシピを使用すると、組織全体の機械学習を民主化でき、他のユーザーはコードを書かなくても様々な用途のモデルにアクセスできるようになることです。

製品 Recommendations レシピの参照

  1. In Adobe Experience Platform, navigate to Models from the left navigation column, then click Recipes at the top to view a list of available Recipes for your organization.
  2. 提供された​ Recommendations レシピ ​を探し、名前をクリックして開きます。
  3. 右側パネルで、「 Recommendations 入力スキーマ 」をクリックして、レシピを実行するスキーマを表示します。スキーマフィールド itemId userId は、特定の時間( timestamp )にその顧客が購入した製品( interactionType )に対応します。同じ手順に従って、 Recommendations の出力スキーマ ​のフィールドを確認します。
これで、商品 Recommendations のレシピで必要な入力および出力スキーマを確認しました。次のセクションに進み、製品レコメンデーションモデルの作成、トレーニング、および評価方法を見つけることができます。

モデルのトレーニングと評価

データの準備が完了し、レシピを使用する準備が整ったら、機械学習モデルを作成、トレーニング、および評価できます。

モデルの作成

モデルはレシピのインスタンスで、データを大規模にトレーニングして、スコアを付けることができます。
  1. In Adobe Experience Platform, navigate to Models from the left navigation column, then click Recipes at the top of the page to display a list of all available Recipes for your organization..
  2. 提供された Recommendations レシピ ​を探して、名前をクリックし、レシピの概要ページを入力して開きます。「レシピの概要」ページの中央(既存のモデルがない場合)または右上のいずれかで「 モデルを作成 」をクリックします。
  3. トレーニングに使用できる入力データセットのリストが表示されます。「 Recommendations 入力データセット 」を選択し、「 次へ 」をクリックします。
  4. モデルの名前を指定します(例:「製品レコメンデーションモデル」)。モデルのデフォルトのトレーニング動作やスコア付け動作の設定を含め、モデルで使用可能な設定が表示されます。これらの設定は組織に固有なので、変更する必要はありません。設定を確認し、「 完了 」をクリックします。
  5. モデルが作成され、新しく生成されたトレーニング実行内に、モデルの​ 概要 ページが表示されます。トレーニング実行は、モデルの作成時にデフォルトで生成されます。
トレーニング実行が完了するまで待つか、次のセクションで新しいトレーニング実行の作成を続行するかを選択できます。

カスタムのハイパーパラメータを使用してモデルをトレーニングする

  1. モデルの概要 」ページで、右上付近にある「 トレーニング 」をクリックして新しいトレーニング実行を作成します。モデルの作成時に使用したのと同じ入力データセットを選択し、「 次へ 」をクリックします。
  2. 設定 ​ページが表示されます。ここで、トレーニング実行の num_recommendations (ハイパーパラメーター)値を設定できます。最適化されたトレーニング済みモデルは、トレーニング実行の結果に基づいて、パフォーマンスが最も高いハイパーパラメーターを利用します。
    ハイパーパラメーターは学習できないので、トレーニングを実行する前に割り当てる必要があります。ハイパーパラメーターを調整すると、トレーニングモデルの精度が変わる場合があります。モデルの最適化は反復的なプロセスなので、満足のいく評価を得るには複数のトレーニング実行が必要となる場合があります。
    num_recommendations を 10 に設定します。
  3. 新しいトレーニング実行が完了すると、モデル評価グラフに追加のデータポイントが表示されます。この処理には数分かかる場合があります。

モデルの評価

トレーニング実行が完了するたびに、結果の評価指標を表示して、モデルのパフォーマンスを判断できます。
  1. トレーニング実行をクリックして、完了した各トレーニングの評価指標(精度と再現率)を確認します。
  2. 各評価指標に対して提供された情報を調べます。これらの指標が高いほど、モデルのパフォーマンスが良いということになります。
  3. 各トレーニング実行に使用されるスキーマセット、データセット、設定パラメーターは、右側のパネルで確認できます。
  4. 「モデル」ページに戻り、評価指標を観察して、パフォーマンスが最も高いトレーニングを特定します。

モデルを操作できるようにする

Data Science ワークフローの最後の手順では、モデルを操作できるようにして、データストアからのインサイトにスコアを付けて利用します。

スコアを付けてインサイトを生成する

  1. 商品レコメンデーションの「 モデルの概要 」ページで、リコールと精度の値が最も高く、最もパフォーマンスの高いトレーニング実行の名前をクリックします。
  2. トレーニングの実行の詳細ページの右上にある「 スコア 」をクリックします。
  3. スコア付け入力データセットとして「 Recommendations 入力データセット 」を選択します。これは、モデルの作成時に使用し、そのトレーニング実行時に実施したデータセットと同じものです。次に、「 次へ 」をクリックします。
  4. スコア付け出力データセットとして「 Recommendations 出力データセット 」を選択します。スコア付けの結果は、このデータセットにバッチとして保存されます。
  5. スコア設定を確認します。これらのパラメーターには、前に選択した入力および出力データセットと、適切なスキーマが含まれます。「 完了 」をクリックし、スコア付け実行を開始します。実行が完了するまで数分かかる場合があります。

スコアが付けられたインサイトを表示する

スコア付け実行が正常に完了すると、生成された結果とインサイトの表示をプレビューできます。
  1. スコア付け実行ページで、完了したスコア付け実行をクリックし、右側パネルの「 スコア付けの結果データセットのプレビュー 」をクリックします。
  2. プレビューの表では、各行に特定の顧客に対する製品レコメンデーションが含まれ、それぞれに recommendations および userId というラベルが付けられます。サンプルスクリーンショットでは、 num_recommendations ハイパーパラメーターが「10」に設定されているので、レコメンデーションの各行には、最大 10 個の製品 ID を番号記号(#)で区切って含めることができます。

次の手順

製品のレコメンデーションが正常に生成されました。
This tutorial introduced you to the workflow of Data Science Workspace, demonstrating how raw unprocessed data can be turned into useful information through machine learning. To learn more about using the Data Science Workspace, continue to the next guide on creating the retail sales schema and dataset .