Show Menu
トピック×

Data Science Workspaceの概要

Adobe Experience Platform Data Science Workspaceは、機械学習と人工知能を使用して、データからインサイトを引き出します。 Data Science WorkspaceはAdobe Experience Platformに統合されており、アドビのソリューション全体でコンテンツやデータアセットを使用して予測を行うのに役立ちます。
すべてのスキルレベルのデータ科学者は、機械学習レシピの迅速な開発、トレーニング、調整をサポートする、高度で使いやすいツールを見つけ出します。AIテクノロジーのすべてのメリットを、複雑さを伴わずに実現できます。
Data Science Workspaceを使用すると、データ科学者は、機械学習を利用したインテリジェントなサービスAPIを簡単に作成できます。 これらのサービスは、AdobeターゲットやAdobe Analytics Cloudなどの他のアドビサービスと連携して、Web、デスクトップおよびモバイルアプリで、パーソナライズされたターゲットのデジタルエクスペリエンスを自動化できます。
このガイドでは、Data Science Workspaceに関連する主要な概念の概要を説明します。

はじめに

今日の企業は、ビッグデータを分析し、予測や洞察を行うことを優先しています。これにより、顧客体験をパーソナライズし、顧客やビジネスに対してより多くの価値を提供することができます。 重要な点は、データからインサイトに至るまでのコストが高くなることです。 通常、インテリジェントなサービスを実現する機械学習モデル(レシピ)を開発するために、集中的で時間のかかるデータ調査を行う熟練のデータ科学者が必要です。 プロセスは長く、テクノロジーは複雑で、熟練したデータ科学者は見つけにくい場合があります。
Data Science Workspaceを使用すると、Adobe Experience Platformを使用して、エンタープライズ全体にエクスペリエンス中心のAIを提供し、次の機能を使用して、データからコードへの分析を合理化し、迅速化できます。
  • 機械学習フレームワークとランタイム
  • Adobe Experience Platformに保存されたデータへの統合アクセス
  • Experience Data Model(XDM)に基づく統合データスキーマ
  • 機械学習/AIと大規模なデータセットの管理に不可欠なコンピューティング能力
  • AIに基づくエクスペリエンスへの飛躍を加速する、事前に設計された機械学習レシピ
  • さまざまなスキル・レベルのデータ・サイエンスティスト向けに、レシピの作成、再利用、変更を合理化
  • 数回のクリックでインテリジェントなサービス公開と共有(開発者を除く)、およびパーソナライズされた顧客体験の継続的な最適化の監視と再トレーニング
すべてのスキルレベルのデータ科学者は、インサイトをより迅速かつ効果的に、より早く得ることができます。

はじめに

Data Science Workspaceの詳細を確認する前に、主な用語の概要を簡単に示します。
用語
定義
Data Science Workspace
Data Science Workspace with in Experience Platformを使用すると、顧客はExperience PlatformとAdobe Solutionsのデータを利用して機械学習モデルを作成し、インテリジェントなインサイトと予測を生成して、素晴らしいエンドユーザーのデジタルエクスペリエンスを組み立てることができます。
人工知能
人工知能とは、視覚、音声認識、意思決定、言語間の翻訳など、通常は人間の知性を必要とするタスクを実行できるコンピュータシステムの理論と開発です。
機械学習
機械学習とは、コンピューターが明示的にプログラミングされることなく学習できるようにする研究の分野です。
先生MLフレームワーク
Sensie ML Frameworkは、Experience Platform上のデータを活用し、機械学習に基づくインテリジェンスサービスの開発におけるデータ科学者の能力を高める、アドビの統合された機械学習フレームワークです。
エクスペリエンスデータモデル
エクスペリエンスデータモデル(XDM)は、Customer Experience Managementの標準的なスキーマ(プロファイルやExperienceEventなど)を定義するために、アドビが率いる標準化の取り組みです。
JupyterLab
JupterLabは、Project Jupyter向けのオープンソースのWebベースのインターフェイスで、Experience Platformに緊密に統合されています。
レシピ
レシピは、アドビのモデル仕様を表す用語で、トレーニングを受けたモデルを作成して実行し、特定のビジネス上の問題の解決に役立つ、特定の機械学習、AIアルゴリズム、アルゴリズムのアンサンブル、処理ロジック、設定を表す最上位コンテナです。
モデル
モデルは、機械学習手法のインスタンスで、過去のデータと構成を使用してトレーニングを受け、ビジネスの使用事例に対して解決します。
トレーニング
トレーニングは、ラベル付きのデータからパターンや洞察を学ぶプロセスです。
トレーニングモデル
トレーニングされたモデルは、モデルのトレーニングプロセスの実行可能な出力を表し、この中で、一連のトレーニングデータがモデルインスタンスに適用されました。 トレーニングを受けたモデルは、そのモデルから作成されたインテリジェントWebサービスへの参照を維持します。 トレーニングを受けたモデルは、インテリジェントなWebサービスのスコアリングと作成に適しています。 トレーニングを受けたモデルに対する変更は、新しいバージョンとして追跡できます。
スコア
スコアリングは、トレーニングを受けたモデルを使用して、データからインサイトを生成するプロセスです。
サービス
デプロイされたサービスは、APIを介して人工知能、機械学習モデル、または高度なアルゴリズムの機能を公開するので、他のサービスやアプリケーションで利用してインテリジェントアプリを作成できます。
次の表に、レシピ、モデル、トレーニング実行、スコアリング実行の間の階層関係の概要を示します。

Data Science Workspaceについて

Data Science Workspaceを使用すると、データ科学者は、大規模なデータセット内の洞察を明らかにする煩雑なプロセスを合理化できます。 Data Science Workspaceは、共通の機械学習フレームワークとランタイムを基盤として、高度なワークフロー管理、モデル管理および拡張性を備えています。 インテリジェントサービスは、機械学習レシピの再利用をサポートし、アドビの製品やソリューションを使用して作成された様々なアプリケーションに電力を供給します。

ワンストップのデータアクセス

データは、AIと機械学習の基礎となります。
Data Science Workspaceは、Data Lake、リアルタイム顧客プロファイル、統合エッジを含むAdobe Experience Platformと完全に統合されています。 Adobe Experience Platformに保存されたすべての組織データを、Spark MLやTensorFlowなどの一般的なビッグデータおよびディープラーニングライブラリと共に一度に参照してください。 必要なものが見つからない場合は、XDM標準化スキーマを使用して独自のデータセットを取り込みます。

事前に作成された機械学習レシピ

Data Science Workspaceには、小売売上予測や異常値検出など、一般的なビジネスニーズに対応した事前に作成された機械学習レシピが含まれているので、データ科学者や開発者は一から開始する必要はありません。 現在、 商品購入予測 商品レコメンデーション 小売の販売レシピ 小売売上の3つのレシピが提供されています。
必要に応じて、事前に作成されたレシピをニーズに合わせたり、レシピを読み込んだり、開始を一から読み込んでカスタムレシピを作成することもできます。 しかし、レシピのトレーニングと調整を行った後は、カスタムのインテリジェントサービスを作成する場合、開発者は必要ありません。わずか数回クリックするだけで、ターゲットを絞ったパーソナライズされたデジタルエクスペリエンスを構築できます。

データサイエンティストに焦点を当てたワークフロー

Data Science Workspaceは、データ科学の専門知識レベルに関係なく、データ内のインサイトを見つけ、それらをデジタルエクスペリエンスに適用するプロセスをシンプル化および高速化します。

データ調査

適切なデータを見つけて準備することは、効果的なレシピを作成する上で最も労力を要する部分です。 Data Science WorkspaceとAdobe Experience Platformは、データからインサイトにすばやくアクセスするのに役立ちます。
Adobe Experience Platformでは、クロスチャネルデータは一元化され、XDM標準化スキーマに保存されるので、データを見つけ、理解し、クリーンな状態で保存しやすくなります。 共通のスキーマに基づくデータを1つのストアに保存することで、データの調査と準備に要する時間を数え切れないほど短縮できます。
参照しながら、R、Python、またはScalaを統合されたホストJupyter Notebookと一緒に使用し、プラットフォーム上のデータのカタログを参照します。 これらの言語の1つを使用して、Spark MLとTensorFlowを利用することもできます。 一から開始するか、特定のビジネス上の問題に対応したノートブックのテンプレートの1つを使用します。
データ調査ワークフローの一環として、新しいデータを取り込んだり、既存の機能を使用してデータの準備を行ったりすることもできます。

オーサリング

Data Science Workspaceでは、レシピの作成方法を決定します。
  • ビジネスニーズに対応する事前設計されたレシピを参照し、特定の要件に合わせてそのまま使用したり、設定したりできるので、時間を節約できます。
  • レシピを一から作成し、ジュピター・ノートブックのオーサリング・ランタイムを使用してレシピを作成し、登録します。
  • Adobe Experience Platformの外部で作成したレシピをData Science Workspaceにアップロードするか、GitとData Science Workspaceの間で使用可能な認証と統合を使用して、Gitなどのリポジトリからレシピコードを読み込みます。

実験

Data Science Workspaceは、実験プロセスに大幅な柔軟性をもたらします。 レシピとの開始。 次に、同じコアアルゴリズムと、ハイパーチューニングパラメーターなどの独自の特性を組み合わせて使用し、別のインスタンスを作成します。 各インスタンスに必要な数のインスタンスを作成し、トレーニングやスコアを何回でも作成できます。 トレーニングを行う際、Data Science Workspaceはレシピ、レシピインスタンス、トレーニング済みのインスタンスを評価指標と共に追跡するので、必要ありません。

運用化

レシピに満足したら、インテリジェントなサービスを作成するのは数回のクリックだけです。 コーディングは不要。開発者やエンジニアを登録することなく、自分で行うことができます。 最後に、インテリジェントサービスをAdobe IOに公開し、デジタルエクスペリエンスチームが利用できるようにします。

継続的な改善

Data Science Workspaceは、インテリジェントサービスが呼び出される場所とその実行方法を追跡します。 データがロールインするに従って、インテリジェントなサービスの正確性を評価し、ループを閉じ、必要に応じてレシピを再トレーニングしてパフォーマンスを向上させることができます。 その結果、顧客のパーソナライゼーションの精度を継続的に細分化することができます。

新機能とデータセットへのアクセス

データ科学者は、アドビのサービスを通じて新しいテクノロジーとデータセットを利用できるようになれば、すぐに利用できます。 頻繁な更新を通じて、データセットとテクノロジーをプラットフォームに統合する作業を行うので、お客様は必要ありません。

Data Science Workspaceのアクセス制御

Access control for Experience Platform is administered through the Adobe Admin Console . この機能は、管理コンソールの製品プロファイルを利用して、ユーザーを権限およびサンドボックスにリンクします。 See the access control overview for more information.
Data Science Workspaceを使用するには、「Manage Data Science Workspace」権限を有効にする必要があります。
次の表に、この権限を有効または無効にした場合の影響を示します。
権限
有効
無効
Data Science Workspaceの管理
Data Science Workspaceのすべてのサービスへのアクセスを提供します。
Data Science Workspace内のすべてのサービスへのAPIおよびUIアクセスが無効になります。 無効になっている場合、Data Science Workspace モデル および サービス ページへのルーティングは防げます。

安心と安全

データの保護は、アドビにとって最も優先される作業です。 アドビは、業界で受け入れられた標準、規制、および認定に準拠するために開発されたセキュリティプロセスとコントロールによって、お客様のデータを保護します。
セキュリティは、アドビのセキュア製品のライフサイクルの一部として、ソフトウェアとサービスに組み込まれています。 アドビのデータおよびソフトウェアのセキュリティ、コンプライアンス、その他の詳細については、セキュリティのページ(https://www.adobe.com/security.html)を参照してください。

Sandboxのサポート

サンドボックスは、エクスペリエンスプラットフォームの単一のインスタンス内の仮想パーティションです。 各プラットフォームインスタンスは1つの実稼働用サンドボックスと複数の非実稼働用サンドボックスをサポートし、それぞれが独自のプラットフォームリソースのライブラリを維持します。 実稼動用以外のサンドボックスを使用すると、実稼働用サンドボックスに影響を与えることなく、機能のテスト、実験の実行、カスタム設定を行うことができます。 サンドボックスについて詳しくは、 サンドボックスの概要を参照してください
現在、Data Science Workspaceにはサンドボックスに関するいくつかの制限があります。
  • コンピューティングリソースは、実稼働用サンドボックスと実稼働用以外のサンドボックスで共有されます。 本番用サンドボックスの分離は、将来提供されるように設定されます。
  • ノートブックとレシピの両方のScala/SparkおよびPySparkワークロードは、現在、実稼働用サンドボックスでのみサポートされています。 非実稼働用サンドボックスのサポートは、将来的に提供されるように設定されます。

Data Science Workspaceが実行中

予測とインサイトは、Webサイトの訪問者、コールセンターへの連絡、その他のデジタルエクスペリエンスに関与する各顧客に、パーソナライズ度の高いエクスペリエンスを提供するために必要な情報を提供します。 次に、日々の仕事がData Science Workspaceで起こる様子を示します。

問題の定義

ビジネス上の問題を抱えるすべての開始です。 例えば、オンラインコールセンターで顧客の否定的なセンチメントを肯定的に見せるには、コンテキストが必要です。
お客様に関するデータはたくさんあります。 サイトを閲覧し、買い物かごに商品を入れ、さらに注文を入れた。 以前に電子メールを受信したか、クーポンを使用したか、コールセンターに連絡した可能性があります。 次に、顧客とそのアクティビティに関するデータを使用して購入傾向を判断し、顧客が高く評価し、利用する可能性が高いオファーを推奨する必要があります。
コールセンターの連絡時に、顧客は買い物かごに2組の靴を入れていますが、シャツは取り除いています。 この情報により、インテリジェントサービスは、コールセンターエージェントに対して、コール中の靴の20%オフのクーポンをオファーすることを推奨する場合があります。 顧客がクーポンを使用する場合は、その情報がデータセットに追加され、次に訪問者が電話をかけたときの予測がさらに改善されます。

データの表示と準備

定義したビジネス上の問題に基づいて、レシピはサイト訪問数、検索数、ページ表示数、クリックされたリンク数、買い物かごのアクション、受信オファー数、受信電子メール数、コールセンターでのインタラクション数など、顧客のWebトランザクションをすべて調べる必要があります。
通常、データサイエンティストは、データを調査および変換するレシピの作成に要する時間の最大75%を費やします。 データは多くの場合、複数のリポジトリから収集され、異なるスキーマに保存されます。レシピの作成に使用する前に、組み合わせてマッピングする必要があります。
ゼロから始める場合や、既存のレシピを設定する場合は、組織の一元化された標準化されたデータカタログからデータ検索を開始します。これにより、大量の検索が簡単になります。 また、社内の別のデータサイエンティストが類似したデータセットを既に特定しており、一から開始するのではなく、そのデータセットを微調整することもできます。 Adobe Experience Platformのすべてのデータは標準化されたXDMスキーマに準拠しているので、データを結合する複雑なモデルを作成する必要がなく、データエンジニアからヘルプを取得する必要もありません。
必要なデータがすぐに見つからないが、Adobe Experience Platformの外部に存在する場合は、追加のデータセットを取り込むのは比較的単純なタスクで、標準化されたXDMスキーマにも変換されます。 ジャプター・ノートブックを使用すると、データの前処理を簡単にできます。ノートブック・テンプレートや、以前に購入傾向に使用したノートブックから始める場合もあります。

レシピの作成

すべてのニーズを満たすレシピが既に見つかっている場合は、次に実験に移ります。 または、Jupter NotebookのData Science Workspaceオーサリングランタイムを利用して、レシピを少し変更したり、一から作成したりできます。 オーサリングランタイムを使用すると、Data Science Workspaceのトレーニングとスコアリングワークフローを使用し、後でレシピを変換して、組織内の他のユーザーが保存して再利用できるようにすることができます。
また、Data Science Workspaceにレシピを読み込んで、インテリジェントサービスを作成する際に実験ワークフローを活用することもできます。

レシピを試す

コア機械学習アルゴリズムを組み込んだレシピを使用すると、1つのレシピで多数のレシピインスタンスを作成できます。 これらのレシピインスタンスは、モデルと呼ばれます。 モデルの動作効率と有効性を最適化するために、トレーニングと評価が必要です。これは、通常、試用とエラーから成るプロセスです。
モデルをトレーニングすると、トレーニングの実行と評価が生成されます。 Data Science Workspaceは、一意の各モデルとトレーニングの実行に関する評価指標を追跡します。 実験を通じて生成された評価指標を使用して、最もパフォーマンスの高いトレーニングの実施状況を判断できます。

モデルの操作

ビジネスニーズに対応するために最適なトレーニングを受けたレシピを選択した場合は、開発者の支援を受けずに、Data Science Workspaceでインテリジェントサービスを作成できます。 数回のクリックでコーディングは不要です。 発行済みのインテリジェントサービスは、モデルを再作成する必要なく、組織の他のメンバーがアクセスできます。
公開されたインテリジェントサービスは設定可能で、新しいデータが利用可能になった時点で自動的にトレーニングを行います。 これにより、お客様のサービスは時間の経過とともに効率と有効性を維持できます。

次の手順

Data Science Workspaceは、データ収集からアルゴリズム、インテリジェントサービス、あらゆるスキルレベルのデータ科学者にとって、データ科学のワークフローを合理化およびシンプル化するのに役立ちます。 Data Science Workspaceが提供する高度なツールを使用すると、データからインサイトまでの時間を大幅に短縮できます。
さらに重要なのは、Data Science Workspaceは、アドビの主要マーケティングプラットフォームのデータ科学とアルゴリズムによる最適化機能を企業のデータ科学者の手に委ねることです。 企業は初めて独自のアルゴリズムをプラットフォームに導入でき、アドビの強力な機械学習機能とAI機能を利用して、パーソナライズの高い顧客体験を大規模に提供できます。
ブランドの専門知識とアドビの機械学習機能、AIプロセスが結び付いているため、企業は顧客が求める前に、顧客に何を求めるかを伝えることで、より多くのビジネス価値とブランド忠誠度を高める力を持っています。
日々のワークフロー全体などの詳細については、まず Data Science Workspaceのウォークスルードキュメントを読んでください

その他のリソース

次のビデオは、Data Science Workspaceについて理解を深めるために設計されています。