ドキュメント Experience Platform データサイエンスワークスペースガイド

Data Science Workspace の概要

Last update: Tue Nov 14 2023 00:00:00 GMT+0000 (Coordinated Universal Time)

トピック：
Data Science Workspace

作成対象：

User
Developer

NOTE

Experience Leagueに関する機能に関するドキュメントが存在する場合、すべてのお客様に対してその機能が使用できるとは限らないことに注意してください。この機能は、Adobe Experience PlatformまたはAdobe Experience Platform Intelligence ライセンスを購入した既存のお客様のみが使用できます。公式の製品説明を参照して、購入した SKU/製品に関連する機能やその他の詳細を把握してください。

Adobe Experience Platform Data Science Workspace は機械学習と人工知能を使用して、データからインサイトを引き出します。Adobe Experience Platform に統合された Data Science Workspace は、アドビソリューションをまたいでコンテンツやデータアセットを使用し、予測をおこなうのに役立ちます。

あらゆるスキルレベルのデータサイエンティストは、機械学習レシピの迅速な開発、トレーニング、調整をサポートする高度で使いやすいツールを見つけ、複雑な手順なしに、AI テクノロジーのすべてのメリットを享受できます。

データサイエンティストは Data Science Workspace を使用して、機械学習を活用したインテリジェントサービス API を簡単に作成できます。これらのサービスは、Adobe Target や Adobe Analytics Cloud などの他のアドビサービスと連携して、web、デスクトップ、およびモバイルアプリでパーソナライズされたターゲットデジタルエクスペリエンスを自動化することに役立ちます。

このガイドでは、Data Science Workspace に関連する主な概念の概要を説明します。

概要

現在の大規模法人は、顧客体験をパーソナライズし、顧客や法人により多くの価値を提供するのに役立つ予測やインサイトを導き出すために、ビッグデータのマイニングを重要視しています。
同様に重要な点は、データからインサイトを獲得するためのコストが高くなる可能性があることです。通常、インテリジェントなサービスを提供する機械学習モデルまたはレシピを開発するには、集約的で時間のかかるデータ調査をおこなう熟練したデータサイエンティストが必要です。このプロセスは長く、テクノロジーは複雑であり、熟練したデータサイエンティストを見つけるのは容易ではありません。

Adobe Experience Platform の Data Science Workspace を使用すると、エクスペリエンスに焦点を当てた AI を企業全体に提供し、次の機能を通じてデータからインサイトを導き出し、コード化へと至るプロセスを合理化および加速できます。

機械学習フレームワークとランタイム
Adobe Experience Platform に保存されたデータへの統合アクセス
Experience Data Model（XDM）上に構築された統合データスキーマ
機械学習 / AI と大規模なデータセットの管理に不可欠なコンピューティング能力
AI 駆動型のエクスペリエンスへの飛躍を促進する、事前に作成された機械学習レシピ
様々なスキルレベルのデータサイエンティスト向けのレシピの作成、再利用、変更を簡素化
開発者の介入なしに、インテリジェントなサービスの公開と共有を数回のクリックで行い、パーソナライズされた顧客体験の継続的な最適化のために監視と再トレーニングを実行

すべてのスキルレベルのデータサイエンティストは、インサイトと効果的なデジタルエクスペリエンスを迅速に生み出せるようになります。

はじめに

Data Science Workspace の詳細を説明する前に、重要な用語の概要を以下に示します。

用語

定義

Data Science Workspace

Experience Platform 内の Data Science Workspace を使用すると、Experience Platform とアドビソリューションのデータを活用して機械学習モデルを作成し、インテリジェントなインサイトと予測を導き出して、エンドユーザー向けのすばらしいデジタルエクスペリエンスを構築することができます。

人工知能

人工知能とは、視覚、音声認識、意思決定、言語間の翻訳など、通常は人間の知性を必要とするタスクを実行できるコンピュータシステムの理論と開発のことを指します。

機械学習

機械学習とは、コンピューターが明示的にプログラムされることなく学習できるようにする研究分野です。

Sensei ML フレームワーク

Sensei ML フレームワークはアドビ全体の統合機械学習フレームワークであり、上のデータを活用して、機械学習主導型のインテリジェンスサービスを迅速でスケーラブルかつ再利用可能な方法で開発するデータサイエンティストをサポートしますExperience Platform。

Experience Data Model

Experience Data Model（XDM）はアドビが推進する標準化の取り組みであり、顧客体験管理用に Profile や ExperienceEvent などの標準スキーマを定義します。

JupyterLab

JupyterLab は Project Jupyter のオープンソース web ベースのインターフェイスであり、Experience Platform に緊密に統合されています。

レシピ

レシピは、アドビのモデル仕様を表す用語です。トレーニング済みモデルを作成して実行し、ビジネスに関する特定の問題を解決するために必要な特定の機械学習、AI アルゴリズム（またはアルゴリズムのアンサンブル）、処理ロジック、設定を表すトップレベルのコンテナです。

モデル

モデルとは、履歴データと設定を使用してトレーニングされた機械学習レシピのインスタンスであり、ビジネス上の使用例について解決します。

トレーニング

トレーニングとは、ラベル付きのデータからパターンやインサイトを学習するプロセスです。

トレーニング済みモデル

トレーニング済みモデルは、モデルのトレーニングプロセスの実行可能な出力を表します。トレーニングプロセスでは、トレーニングデータのセットがモデルインスタンスに適用されます。トレーニング済みモデルは、そのモデルから作成されたインテリジェント Web サービスへの参照を保持します。トレーニング済みモデルは、インテリジェント Web サービスのスコアリングと作成に適しています。トレーニング済みモデルに対する変更は、新しいバージョンとして追跡できます。

スコアリング

スコアリングは、トレーニング済みモデルを使用して、データからインサイトを生成するプロセスです。

サービス

デプロイされたサービスは、人工知能、機械学習モデル、または高度なアルゴリズムの機能を API 経由で公開し、他のサービスやアプリケーションで利用してインテリジェントなアプリを作成できるようにします。

次の表に、レシピ、モデル、トレーニング実行、スコアリング実行の階層関係の概要を示します。

Data Science Workspaceについて

データサイエンティストは Data Science Workspace を使用して、大規模なデータセットからインサイトを引き出す煩雑なプロセスを合理化できます。共通の機械学習フレームワークとランタイムに基づいて構築された Data Science Workspace は、高度なワークフロー管理、モデル管理、スケーラビリティを提供します。インテリジェントサービスは、機械学習レシピの再利用をサポートし、アドビの製品やソリューションを使用して作成された様々なアプリケーションを強化します。

1 か所でデータアクセス

データは AI と機械学習の基礎です。

Data Science Workspace は、Data Lake、Real-Time Customer Profile、Unified Edge を含む Adobe Experience Platform と完全に統合されています。共通のビッグデータおよび Spark ML や TensorFlow などのディープラーニングライブラリと併せて、Adobe Experience Platform に保存されたすべての組織データを一度に調べることができます。必要なデータが見つからない場合は、XDM 標準スキーマを使用して独自のデータセットを取り込めます。

事前に作成された機械学習レシピ

Data Science Workspace には、小売販売の予測や異常値検出など、一般的なビジネスニーズに対応した事前に作成された機械学習レシピが含まれているため、データサイエンティストや開発者は最初から始める必要はありません。現在、製品購入予測、製品レコメンデーション、小売販売の 3 つのレシピが提供されています。

必要に応じて、事前に作成したレシピをニーズに合わせたり、レシピを読み込んだり、カスタムレシピを最初から作成したりできます。ただし、レシピのトレーニングとハイパーチューニングをおこなうと、カスタムインテリジェントサービスを作成する際に、開発者からのサポートは不要になり、数回クリックするだけで、ターゲットを絞ったパーソナライズされたデジタルエクスペリエンスを構築する準備が整います。

データサイエンティストに焦点を当てたワークフロー

Data Science Workspace は、ユーザーが持っているデータサイエンスの専門知識のレベルに関係なく、データ内でインサイトを見つけてデジタルエクスペリエンスに適用するプロセスを簡素化および迅速化します。

データの調査

適切なデータを見つけ、それらのデータを準備することは、効果的なレシピを作成する上で最も労力のかかる作業です。Data Science Workspace と Adobe Experience Platform は、データからインサイトをよりすばやく獲得できるようにします。

Adobe Experience Platform では、XDM 標準スキーマでクロスチャネルデータが一元化されて保存されるため、データの検出、把握、クリーンアップがより簡単になります。共通のスキーマに基づいて、データを 1 つのストアに保存することでデータの調査と準備に必要な時間を大幅に短縮できます。

ホストされた統合 Jupyter Notebook で R、Python、または Scala を使用して、Platform 上でデータのカタログを参照できます。これらの言語の 1 つを使用して、Spark ML および TensorFlow を利用することもできます。最初から始めるか、特定のビジネス上の問題に対して提供されているノートブックテンプレートの 1 つを使用します。

データ調査ワークフローの一部として、新しいデータを取り込んだり、既存の機能を使用したりしてデータを準備することもできます。

オーサリング

Data Science Workspace を使用して、レシピの作成方法を決定します。

ビジネスニーズに対応した、事前に作成されたレシピを参照し、そのまま使用したり、特定の要件に合わせて設定したりすることで、時間を節約できます。
Jupyter Notebook のオーサリングランタイムを使用して、レシピを最初から作成し、レシピを開発して登録します。
Adobe Experience Platform 以外で作成したレシピを Data Science Workspace にアップロードするか、Git と Data Science Workspace の間で使用できる認証と統合を使用して、Git などのリポジトリーからレシピコードを読み込みます。

実験

Data Science Workspace は、実験プロセスの柔軟性を大幅に高めます。レシピから開始します。次に、ハイパーチューニングパラメーターなどの固有の特性と組み合わされた同じコアアルゴリズムを使用して、別個のインスタンスを作成します。必要な数のインスタンスを作成し、各インスタンスのトレーニングやスコアリングを必要に応じて何回でも行えます。トレーニングの際、インスタンスのトレーニングをおこなう際、Data Science Workspace は評価指標と共に、レシピ、レシピインスタンス、トレーニング済みインスタンスを追跡するため、ユーザーがおこなう必要はありません。

運用

レシピに満足したら、数回クリックするだけで、インテリジェントサービスを作成できます。コーディングは不要であり、開発者やエンジニアに協力を求める必要なしに、自分でサービスを作成できます。最後に、インテリジェントサービスを Adobe IO に公開すると、デジタルエクスペリエンスチームが利用できるようになります。

継続的な改善

Data Science Workspace は、インテリジェントサービスが呼び出される場所とその実行方法を追跡します。データがロールインしたら、インテリジェントサービスの正確性を評価してループを閉じ、必要に応じてレシピを再トレーニングしてパフォーマンスを向上させることができます。その結果、顧客のパーソナライゼーションの精度を継続的に改善することができます。

新機能とデータセットへのアクセス

データサイエンティストは、アドビのサービスを通じて新しいテクノロジーとデータセットの利用が可能になり次第、すぐに活用できます。アドビは頻繁な更新を通じて、データセットとテクノロジーを Platform に統合しているため、ユーザーが統合をおこなう必要はありません。

セキュリティと安全

データの保護は、アドビの最優先事項です。アドビは、業界で認められた標準、規制、および認定に準拠するために開発されたセキュリティプロセスと制御を使用して、ユーザーのデータを保護します。

セキュリティは、Adobe Secure Product Lifecycle の一環としてソフトウェアとサービスに組み込まれています。
アドビのデータおよびソフトウェアのセキュリティやコンプライアンスなどの詳細については、セキュリティページ（https://www.adobe.com/jp/security.html）を参照してください。

実行中の Data Science Workspace

web サイトを訪問したり、コールセンターに連絡したり、他のデジタルエクスペリエンスに関与したりする各顧客に高度にパーソナライズされたエクスペリエンスを配信するには、予測とインサイトから導出される情報が必要です。Data Science Workspace を使用した日常業務の仕組みを次に示します。

問題の定義

すべては、ビジネス上の問題から始まります。例えば、オンラインコールセンターでは、顧客の否定的な意見を肯定的なものに変えるコンテキストが必要となります。

顧客に関するデータはたくさんあります。顧客はサイトを閲覧し、買い物かごに商品を入れ、実際に注文しました。また、以前に電子メールを受信したり、クーポンを使用したり、コールセンターに連絡したりした場合があります。その後、レシピでは、顧客とその行動に関して利用可能なデータを使用して、購入傾向を判断し、顧客が喜んで受け入れる可能性が高いオファーを推奨する必要があります。

顧客はコールセンターに連絡したときに、買い物かごに 2 組の靴を入れたままでしたが、シャツを削除していました。インテリジェントサービスはこの情報に基づいて、顧客からの電話中に、コールセンターエージェントに靴を 20% 引きにするクーポンを提案するように推奨できます。顧客がクーポンを使用すると、その情報がデータセットに追加され、次に顧客が電話かけてきた際の予測がさらに改善されます。

データの調査と準備

レシピでは、定義されたビジネス上の問題に基づいて、サイト訪問、検索、ページ表示、クリックされたリンク、買い物かごの操作、受け取ったオファー、受信した電子メール、コールセンターとのやり取りなど、顧客の web トランザクションをすべて調べる必要があります。

通常、データサイエンティストは、レシピの作成に必要な時間の最大 75% を費やして、データを調査したり、変換したりしています。多くの場合、データは複数のリポジトリーから収集され、様々なスキーマに保存されます。データをレシピの作成に使用する前に、データを組み合わせたり、マッピングしたりする必要があります。

最初から始める場合や、既存のレシピを設定する場合は、組織の一元化および標準化されたデータカタログでデータの検索を開始すると、検索が大幅に簡単になります。組織内の別のデータサイエンティストが同様のデータセットを既に特定している場合もあり、最初から始めるのではなく、そのデータセットを微調整することもできます。
Adobe Experience Platform のすべてのデータは標準化された XDM スキーマに準拠しているため、データを結合するために複雑なモデルを作成したり、データエンジニアにサポートを求めたりする必要はありません。

必要なデータがすぐに見つからず、Adobe Experience Platform の外部に存在する場合でも、追加のデータセットを取り込むのは比較的単純なタスクです。これらのデータも標準化された XDM スキーマに変換されます。
Jupyter Notebook を使用して、データの前処理を簡単に実行できます。場合によっては、ノートブックテンプレートから開始したり、以前に使用したノートブックから開始して購入傾向を特定したりできます。

レシピの作成

すべてのニーズを満たすレシピを既に見つけている場合は、実験に進むことができます。または、Jupyter Notebook で Data Science Workspace のオーサリングランタイムを利用して、レシピを少し変更したり、最初からレシピを作成したりできます。オーサリングランタイムを使用すると、Data Science Workspace のトレーニングワークフローとスコアリングワークフローの両方を活用し、織内の他のユーザーが保存したり再使用したりできるように後からレシピを変換できます。

また、Data Science Workspace にレシピを読み込んだり、インテリジェントサービスを作成する際に実験ワークフローを活用したりすることもできます。

レシピを使用した実験

コア機械学習アルゴリズムを組み込んだレシピを使用すると、1 つのレシピで多くのレシピインスタンスを作成できます。これらのレシピインスタンスはモデルと呼ばれます。モデルには、運用効率と有効性を最適化するためのトレーニングと評価が必要です。このプロセスは、通常、試行錯誤で構成されます。

モデルをトレーニングすると、トレーニング実行と評価が生成されます。Data Science Workspace は、一意の各モデルとそのトレーニング実行の評価指標を追跡します。実験を通じて生成された評価指標を使用すると、最もパフォーマンスの高いトレーニング実行を判別できます。

Data Science Workspace でのモデルのトレーニングと評価の方法については、API または UI のチュートリアルを参照してください。

モデルの運用

ビジネスニーズに対応するために、トレーニング済みの最適なレシピを選択した場合は、開発者のサポートを受けなくても、Data Science Workspace でインテリジェントサービスを作成できます。数回のクリックで作成でき、コーディングは不要です。公開されたインテリジェントサービスは、モデルを再作成する必要なく、組織の他のメンバーがアクセスできます。

公開されたインテリジェントサービスは、利用可能になった新しいデータを使用して、自己トレーニングを自動的に随時実行するように設定できます。これにより、サービスの効率と有効性が継続的に維持されます。

次の手順

Data Science Workspace は、あらゆるスキルレベルのデータサイエンティスト向けに、データ収集からアルゴリズムやインテリジェントサービスに至るまでのデータサイエンスワークフローを合理化および簡素化します。Data Science Workspace が提供する高度なツールを使用すると、データからインサイトを獲得するまでの時間を大幅に短縮できます。

さらに重要なことに、Data Science Workspace は、企業のデータサイエンティストが、アドビの優れたマーケティングプラットフォームのデータサイエンスやアルゴリズムの最適化機能を利用できるようにします。企業は初めて、独自のアルゴリズムを Platform に取り入れ、アドビの強力な機械学習機能と AI 機能を利用して、高度にパーソナライズされた顧客体験を大規模に提供できるようになりました。

ブランドの専門知識とアドビの機械学習および AI の能力が結び付けられているため、企業は、顧客が求める前に、顧客に必要なオファーを提供することにより、より大きなビジネス価値とブランドロイヤルティを促進できます。

日々のワークフローの完了など、その他の情報については、「Data Science Workspace の紹介」のドキュメントを最初に参照してください。

その他のリソース

次のビデオを視聴すると、Data Science Workspace に関する理解を深めることができます。

https://video.tv.adobe.com/v/3412913?quality=12&enable10seconds=on&speedcontrol=on&captions=jpn

recommendation-more-help

cc79fe26-64da-411e-a6b9-5b650f53e4e9