Show Menu
主題×

建立和發佈機器學習模型逐步說明

假裝您擁有線上零售網站。 當您的客戶在零售網站購物時,您想要向他們提供個人化產品建議,以公開您企業提供的各種其他產品。 在您網站的存在期間,您不斷收集客戶資料,並想以某種方式利用這些資料產生個人化產品建議。
Adobe Experience Platform Data Science Workspace提供使用預先建立的產品建議方式達成目標 的方式 。 請依照本教學課程,瞭解如何存取和瞭解您的零售資料、建立和最佳化機器學習模型,以及在資料科學工作區中產生見解。
本教學課程反映資料科學工作區的工作流程,並涵蓋建立機器學習模型的下列步驟:

快速入門

開始本教學課程之前,您必須具備下列必要條件:
  • 存取權 Adobe Experience Platform。 如果您無法存取Experience Platform中的IMS組織,請在繼續前先與系統管理員聯絡。
  • 啟用資產。 請連絡您的帳戶代表,為您布建下列項目。
    • 建議方式
    • Recommendations輸入資料集
    • Recommendations輸入結構
    • Recommendations輸出資料集
    • Recommendations輸出結構
    • Golden Data Set postValues
    • 金色資料集架構
  • Notebooks-Thurs Adobe public Git儲存庫下載3個必要的Jupyter Notebook檔案,這些檔案將用來示範Data Science Workspace的JupyterLab工作流程。
  • 對本教學課程中使用的下列主要概念有正確認識:
    • 體驗資料模型 : 由Adobe領導的標準化工作,為客戶體驗管理定義標準架構,例如Profile和ExperienceEvent。
    • 資料集: 實際資料的儲存和管理結構。 XDM架構的物理實例 化實例
    • 批: 資料集由批處理組成。 批是一組在一段時間內收集並作為單個單位一起處理的資料。
    • JupyterLab: JupyterLab 是Project Jupyter的開放原始碼網路介面,並與Experience Platform緊密整合。

準備資料

若要建立機器學習模型,向客戶提供個人化產品建議,您必須分析您網站上先前客戶購買的產品。 本節探討如何透過將此資料匯入Platform Adobe Analytics,以及如何將該資料轉換成機器學習模型要使用的功能資料集。

探索資料並瞭解結構

  1. 登入 Adobe Experience Platform ,然後按一下「 Datasets 」以列出所有現有的資料集,並選取您要探索的資料集。 在此例中,Analytics資料集 Golden Data Set postValues
  2. 選取 右上角的「預覽資料集 」以檢查範例記錄,然後按一下「 關閉」
  3. 在右側欄的「架構」下選取連結,以檢視資料集的架構,然後返回資料集詳細資料頁面。」
其他資料集已預先填入批次,以供預覽之用。 您可以重複上述步驟來檢視這些資料集。
資料集名稱
結構
說明
Golden Data Set postValues
Golden Data Set架構
來自您網站的分析來源資料
Recommendations輸入資料集
Recommendations輸入結構
Analytics資料會使用功能管道轉換為訓練資料集。 此資料用於訓練Product Recommendations機器學習模型。 itemid 並對 userid 應該客戶購買的產品。
Recommendations輸出資料集
Recommendations輸出結構
儲存計分結果的資料集,會包含每個客戶的建議產品清單。

製作您的模型

Data Science Workspace生命週期的第二個元件包括編寫配方和模型。 「產品建議方式」旨在利用過去的購買資料和機器學習,大規模產生產品建議。
配方是模型的基礎,因為配方包含機器學習演算法和邏輯,可解決特定問題。 更重要的是,配方可讓您在組織內普及機器學習,讓其他使用者存取不同使用案例的模型,而不需撰寫任何程式碼。

探索產品建議方式

  1. 在中 Adobe Experience Platform,從左側導覽 欄導覽至「模型」,然後按一下頂端的 「方式 ​」,以檢視組織的可用「方式」清單。
  2. 按一下提供的 Recommendations方式 ,尋找並開啟其名稱。
  3. 在右側邊欄中,按一下「 Recommendations輸入結構」 ,以檢視支援方式的結構。 結構欄位 itemId 和userId 對應於該客戶在特定時間(timestampInteraction)購買的產品( Type )。 請依照相同的步驟,檢閱 Recommendations輸出結構的欄位
您現在已檢視「產品建議方式」所需的輸入和輸出結構。 您現在可以繼續下一節,瞭解如何建立、訓練和評估產品建議模型。

培訓並評估您的模型

現在您的資料已備妥,配方已可供使用,您可以建立、訓練和評估機器學習模型。

建立模型

「模型」是「方式」的例項,可讓您以規模來訓練和評分資料。
  1. 在中 Adobe Experience Platform,從左側導覽欄導覽至 Models ,然後按一下頁面頂端的Recipes ​,以顯示您組織的所有可用Recipes清單。
  2. 按一下「方式」的名 ​稱,並輸入「方式」的概述頁面,以尋找並開啟提供的「建議方式」。 從中 ​心(如果沒有現有模型)或從「方式概述」頁面的右上角按一下「建立模型」。
  3. 會顯示可用的訓練輸入資料集清單,選取「 Recommendations輸入資料集」 ,然後按一 下「Next 」。
  4. 提供模型的名稱,例如「產品建議模型」。 列出模型的可用配置,包含模型的預設培訓和計分行為的設定。 由於這些配置是您組織專屬的,因此不需要進行任何更改。 查看配置,然後按一下 完成
  5. 模型現在已建立,而模型的「概 」(Overview)頁面會顯示在新產生的訓練執行中。 在建立模型時,預設情況下會生成培訓運行。
您可以選擇等待培訓執行完成,或在下節中繼續建立新的培訓執行。

使用自訂超參數訓練模型

  1. 在「模 型概述 」頁面上,按一 下右上角的「 Train」(培訓)以建立新的培訓執行。 選取建立模型時使用的相同輸入資料集,然後按一下「下 一步 」。
  2. 此時將 顯示 「配置」頁。 您可以在這裡設定訓練執行的 num_recommendations值 ,也稱為Hyperparameter。 訓練和優化的模型將根據訓練運行的結果利用效能最佳的超參數。
    無法學習超參數,因此必須在訓練執行之前先指派超參數。 調整超參數可能會改變訓練模型的精度。 由於模型最佳化是一個反覆的程式,因此在達到滿意的評估之前可能需要執行多次培訓。
    num_recommendations 設為10。
  3. 新培訓執行完成後,模型評估圖表上會出現額外的資料點,這可能需要數分鐘。

評估模型

每次訓練執行完成時,您都可以檢視產生的評估量度,以判斷模型執行的成效。
  1. 按一下培訓執行,檢視每個已完成培訓執行的評估量度(精確度和召回率)。
  2. 探索每個評估量度的資訊。 這些量度越高,模型的執行效果越好。
  3. 您可以在右側導軌上查看用於每個培訓執行的資料集、結構和組態參數。
  4. 返回「模型」頁面,並透過觀察其評估度量來識別執行成效最佳的培訓。

實施您的模型

Data Science工作流程的最後一步是將您的模型實際運作,以便從資料儲存區獲得分數和使用見解。

分數並產生見解

  1. 在產品建議「模 型概述 」頁面上,按一下效能最佳的培訓執行名稱,其中包含最高召回率和精確度值。
  2. 在訓練執行詳細資訊頁面的右上方,按一下「分 數」
  3. 選取「 Recommendations輸入資料集 」作為計分輸入資料集,此資料集與您建立模型並執行其訓練執行時使用的資料集相同。 然後,按一下「 Next(下一步 )」。
  4. 選取「 Recommendations輸出資料集 」作為計分輸出資料集。 計分結果會以批次形式儲存在此資料集中。
  5. 檢閱計分設定。 這些參數包含先前選取的輸入和輸出資料集以及適當的結構描述。 按一 下「完成 」以開始計分執行。 執行可能需要數分鐘才能完成。

檢視獲得的深入資訊

計分執行成功完成後,您就可以預覽結果並檢視產生的見解。
  1. 在計分執行頁面上,按一下已完成的計分執行,然後按一下右 邊欄上的「預覽計分結果資料集 」。
  2. 在預覽表格中,每一列都包含特定客戶的產品建議,分別標示為 Recommendations 和userId 。 由於范 例螢幕擷取畫面中的 num_recommendations Hyperparameter已設為10,因此每列建議最多可包含10個產品識別碼,由數字元號(#)分隔。

下一步

做得好,您已成功產生產品建議!
本教學課程將您介紹資料科學工作區的工作流程,以示範如何透過機器學習將原始未處理的資料轉換為有用的資訊。 若要進一步瞭解如何使用Data Science Workspace,請繼續下一個建立零售 銷售模式和資料集的指南