설명서 Experience Platform Data Science Workspace 안내서

데이터 과학 작업 공간 UI에서 모델 교육 및 평가

Last update: Wed May 24 2023 00:00:00 GMT+0000 (Coordinated Universal Time)

주제:
Data Science Workspace

작성 대상:

User
Developer

Adobe Experience Platform Data Science Workspace에서는 모델의 의도에 적합한 기존 레시피를 통합하여 머신 러닝 모델이 생성됩니다. 그런 다음 모델은 관련된 하이퍼파라미터를 미세 조정하여 작동 효율 및 효능을 최적화하도록 훈련 및 평가된다. 레시피는 재사용할 수 있습니다. 즉, 단일 레시피로 여러 모델을 만들고 특정 목적에 맞게 맞춤화할 수 있습니다.

이 자습서에서는 모델을 만들고, 교육하고, 평가하는 단계를 안내합니다.

시작하기

이 자습서를 완료하려면 다음에 대한 액세스 권한이 있어야 합니다. Experience Platform. 에서 조직에 대한 액세스 권한이 없는 경우 Experience Platform을(를) 계속하려면 시스템 관리자에게 문의하십시오.

이 자습서에는 기존 레시피가 필요합니다. 레시피가 없는 경우 다음을 따르십시오. UI에서 패키지된 레시피 가져오기 튜토리얼을 참조하십시오.

모델 만들기

Experience Platform에서 모델 왼쪽 탐색에 있는 탭을 선택한 다음 찾아보기 탭을 선택하여 기존 모델을 확인합니다. 선택 모델 만들기 페이지 오른쪽 상단 근처에서 모델 만들기 프로세스를 시작합니다.

기존 레시피 목록을 탐색하여 모델을 만드는 데 사용할 레시피를 찾아 선택하고 다음.

적절한 입력 데이터 세트를 선택하고 다음. 모델에 대한 기본 입력 교육 데이터 세트가 설정됩니다.

모델의 이름을 입력하고 기본 모델 구성을 검토합니다. 기본 구성은 레시피 생성 시 적용되었으며, 값을 두 번 클릭하여 구성 값을 검토하고 수정했습니다.

새 구성 집합을 제공하려면 새 구성 업로드 및 모델 구성이 포함된 JSON 파일을 브라우저 창으로 드래그합니다. 선택 완료 모델을 생성합니다.

NOTE

구성은 고유하며 의도한 레시피에만 적용됩니다. 즉, 소매 판매 레시피에 대한 구성이 제품 Recommendations 레시피에는 작동하지 않습니다. 다음을 참조하십시오. 참조 소매 판매 레서피 구성 목록을 위한 섹션입니다.

교육 실행 만들기

Experience Platform에서 모델 왼쪽 탐색에 있는 탭을 선택한 다음 찾아보기 탭을 선택하여 기존 모델을 확인합니다. 교육하려는 모델의 이름에 첨부된 하이퍼링크를 찾아 선택합니다.

현재 교육 상태의 기존 교육 실행이 모두 나열됩니다. 를 사용하여 생성된 모델의 경우 Data Science Workspace 사용자 인터페이스에서는 기본 구성 및 입력 교육 데이터 세트를 사용하여 교육 실행이 자동으로 생성 및 실행됩니다.

다음을 선택하여 새 교육 실행 만들기 교육 모델 개요 페이지의 오른쪽 상단

교육 실행에 대한 교육 입력 데이터 세트를 선택한 다음 을 선택합니다. 다음.

모델을 생성하는 동안 제공된 기본 구성이 표시되며, 값을 두 번 클릭하여 해당 구성을 적절하게 변경하고 수정합니다. 선택 완료 교육 실행을 만들고 실행합니다.

NOTE

모델 평가

Experience Platform에서 모델 왼쪽 탐색에 있는 탭을 선택한 다음 찾아보기 탭을 선택하여 기존 모델을 확인합니다. 평가하려는 모델 이름에 첨부된 하이퍼링크를 찾아 선택합니다.

모델 선택

현재 교육 상태의 기존 교육 실행이 모두 나열됩니다. 완료된 교육 실행이 여러 개 있는 경우 모델 평가 차트에서 여러 교육 실행 간에 평가 지표를 비교할 수 있습니다. 그래프 위의 드롭다운 목록을 사용하여 평가 지표를 선택합니다.

MAPE(Mean Absolute Percent Error) 지표는 정확도를 오류의 백분율로 표시합니다. 이는 상위 성과 실험을 식별하는 데 사용됩니다. MAPE가 낮을수록 좋습니다.

교육 실행 개요

정밀도 지표는 합계와 비교한 관련 인스턴스의 백분율을 설명합니다 검색됨 인스턴스. 정밀도는 무작위로 선택된 결과가 정확할 확률로 볼 수 있다.

여러 실행 실행

특정 교육 실행을 선택하면 평가 페이지를 열어 해당 실행에 대한 세부 정보를 제공합니다. 실행이 완료되기 전이라도 이 작업을 수행할 수 있습니다. 평가 페이지에서 교육 실행과 관련된 다른 평가 지표, 구성 매개 변수 및 시각화를 확인할 수 있습니다.

로그 미리보기

활동 로그를 다운로드하여 실행의 세부 사항을 볼 수도 있습니다. 로그는 실패한 실행에서 무엇이 잘못되었는지 확인하는 데 특히 유용합니다.

활동 로그

하이퍼매개 변수는 학습할 수 없으며 다양한 하이퍼매개 변수 조합을 테스트하여 모델을 최적화해야 합니다. 최적화된 모델에 도달할 때까지 이 모델 교육 및 평가 프로세스를 반복합니다.

다음 단계

이 튜토리얼은에서 모델을 생성, 교육 및 평가하는 과정을 안내합니다 Data Science Workspace. 최적화된 모델에 도달하면 훈련된 모델을 사용하여 다음을 수행하여 통찰력을 생성할 수 있습니다. UI에서 모델에 점수 매기기 튜토리얼.

참조 reference

소매 판매 레시피 구성

하이퍼매개변수는 모델의 교육 동작을 결정하며, 하이퍼매개변수를 수정하면 모델의 정확도와 정밀도에 영향을 미칩니다.

하이퍼파라미터

설명

권장 범위

learning_rate

학습 비율은 learning_rate를 통해 각 트리의 기여도를 낮춥니다. learning_rate와 n_estimators 사이에는 상충관계가 있습니다.

0.1

n_estimators

수행할 승압 스테이지의 수입니다. 그레이디언트 부스팅은 과적합에 매우 강력하므로 많은 수의 그래디언트 부스팅은 일반적으로 더 나은 성능을 제공합니다.

100

max_depth

개별 회귀 추정기의 최대 깊이입니다. 최대 깊이는 트리의 노드 수를 제한합니다. 최상의 성능을 위해 이 매개 변수를 조정합니다. 최상의 값은 입력 변수의 상호 작용에 따라 달라집니다.

추가 매개변수는 모델의 기술 속성을 결정합니다.

매개 변수 키

유형

설명

ACP_DSW_INPUT_FEATURES

문자열

쉼표로 구분된 입력 스키마 속성 목록입니다.

ACP_DSW_TARGET_FEATURES

문자열

쉼표로 구분된 출력 스키마 속성 목록입니다.

ACP_DSW_FEATURE_UPDATE_SUPPORT

부울

입력 및 출력 기능을 수정할 수 있는지 여부를 결정합니다

tenantId

문자열

이 ID는 사용자가 만드는 리소스의 이름 간격이 제대로 지정되고 조직 내에 포함되어 있는지 확인합니다. 다음 단계를 수행합니다 테넌트 ID를 찾습니다.

ACP_DSW_TRAINING_XDM_SCHEMA

문자열

모델 교육에 사용되는 입력 스키마입니다.

evaluation.labelColumn

문자열

평가 시각화를 위한 열 레이블입니다.

evaluation.metrics

문자열

모델을 평가하는 데 사용할 평가 지표를 쉼표로 구분한 목록입니다.

ACP_DSW_SCORING_RESULTS_XDM_SCHEMA

문자열

모델의 점수를 매기는 데 사용되는 출력 스키마입니다.

recommendation-more-help

cc79fe26-64da-411e-a6b9-5b650f53e4e9