Show Menu
화제×

데이터 과학 작업 공간 개요

Adobe Experience Platform Data Science Workspace는 머신 러닝과 인공 지능을 사용하여 데이터를 통해 얻은 인사이트를 도출합니다. Adobe Experience Platform에 통합된 데이터 과학 작업 공간을 사용하면 Adobe 솔루션 전체에서 콘텐츠와 데이터 자산을 사용하여 예측할 수 있습니다.
모든 기술 수준에 속한 데이터 과학자는 복잡한 AI 기술을 통해 얻을 수 있는 모든 이점을 비롯하여 신속한 머신 러닝 레시피 개발, 트레이닝 및 조정을 지원하는 세련되고 사용하기 쉬운 툴을 찾을 수 있습니다.
데이터 과학자는 데이터 과학 작업 영역을 사용하여 머신 러닝 기반의 지능형 서비스 API를 쉽게 만들 수 있습니다. 이러한 서비스는 Adobe Target 및 Adobe Analytics Cloud를 비롯한 다른 Adobe 서비스와 연동되므로 웹, 데스크탑 및 모바일 앱에서 개인화된 타깃팅된 디지털 경험을 자동화할 수 있습니다.
이 안내서에서는 데이터 과학 작업 공간과 관련된 주요 개념을 간략하게 설명합니다.

소개

오늘날의 기업은 빅데이터를 수집하여 예측 및 인사이트를 도출하는 데 주력함으로써 고객 경험을 개인화하고 고객과 비즈니스에 더 많은 가치를 제공할 수 있습니다. 데이터에서 인사이트로 이어지는 것은 비용이 많이 들 수 있습니다. 일반적으로 지능적인 서비스를 지원하는 머신 러닝 모델 또는 레시피를 개발하려면 시간과 집중적인 데이터 연구를 수행하는 숙련된 데이터 과학자들이 필요합니다. 그 과정은 길고, 기술은 복잡하며, 숙련된 데이터 과학자들은 찾기 어려울 수 있습니다.
Adobe Experience Platform을 사용하면 데이터 과학 작업 영역을 통해 기업 전반에 경험 중심의 AI를 도입하여 데이터를 통찰력으로 빠르게 코드로 변환할 수 있습니다.
  • 머신 러닝 프레임워크 및 런타임
  • Adobe Experience Platform에 저장된 데이터에 대한 통합 액세스
  • XDM(Experience Data Model)을 기반으로 구축된 통합 데이터 스키마
  • 머신 러닝/AI 및 빅데이터 세트 관리에 필요한 컴퓨팅 성능
  • 인공 지능(AI) 기반의 경험으로 신속하게 도약할 수 있는 미리 만들어진 머신 러닝 방법
  • 다양한 기술 수준의 데이터 과학자를 위한 레시피 작성, 재사용 및 수정 간소화
  • 개발자 없이도 몇 번의 클릭만으로 지능적인 서비스 퍼블리싱 및 공유, 개인화된 고객 경험을 지속적으로 최적화하기 위한 모니터링 및 재교육
모든 기술을 보유한 데이터 과학자는 보다 빠르고 효과적인 디지털 경험을 신속하게 얻을 수 있습니다.

시작하기

데이터 과학 작업 공간에 대한 세부 사항을 살펴보기 전에 주요 용어의 간단한 요약을 참조하십시오.
용어
정의
데이터 과학 작업 공간
경험 플랫폼의 데이터 과학 작업 영역을 사용하면 고객 경험 플랫폼과 Adobe 솔루션 간에 데이터를 활용하는 머신 러닝 모델을 작성하여 지능적인 인사이트와 예측을 도출하여 매력적인 최종 사용자 디지털 경험을 만들 수 있습니다.
인공 지능
인공 지능은 시각 인식, 음성 인식, 의사 결정, 언어 간 번역 등과 같이 인간의 지능을 요하는 작업을 수행할 수 있는 컴퓨터 시스템의 이론과 개발입니다.
기계 학습
머신 러닝은 컴퓨터가 명시적으로 프로그래밍되지 않고 배울 수 있는 학습 분야이다.
Sensei ML 프레임워크
Sensei ML Framework는 Adobe의 통합 머신 러닝 프레임워크로, Adobe Experience Platform의 데이터를 활용하여 데이터 과학자들이 머신 러닝 기반의 인텔리전스 서비스를 신속하고 확장 가능하며 재사용 가능한 방식으로 개발할 수 있도록 합니다.
경험 데이터 모델
XDM(Experience Data Model)은 Adobe가 고객 경험 관리를 위해 프로필 및 ExperienceEvent와 같은 표준 스키마를 정의하도록 이끄는 표준화 활동입니다.
JupiterLab
JupiterLab은 Project Jupiter를 위한 오픈 소스 웹 기반 인터페이스로, Experience Platform과 긴밀하게 통합되어 있습니다.
레서피
레서피는 모델 사양에 대한 Adobe의 용어로, 특정 기계 학습, AI 알고리즘 또는 알고리즘, 처리 로직, 구성 등을 나타내는 최상위 컨테이너로서, 숙련된 모델을 구축하고 실행하는 데 필요한 특정 비즈니스 문제를 해결하는 데 도움이 됩니다.
모델
모델은 비즈니스 사용 사례를 해결하기 위해 내역 데이터 및 구성을 사용하여 교육되는 기계 학습 레서피 인스턴스입니다.
트레이닝
트레이닝은 레이블이 지정된 데이터에서 패턴과 인사이트를 배우는 프로세스입니다.
교육된 모델
트레이닝된 모델은 모델 교육 프로세스의 실행 가능한 결과로서, 이 과정에서 일련의 교육 데이터가 모델 인스턴스에 적용되었습니다. 훈련된 모델은 지능형 웹 서비스를 통해 만들어지는 모든 지능형 웹 서비스에 대한 참조를 유지합니다. 트레이닝된 모델은 점수를 매기고 지능적인 웹 서비스를 제작하는 데 적합합니다. 훈련된 모델의 수정 사항은 새로운 버전으로 추적할 수 있습니다.
점수 지정
채점이란 교육된 모델을 사용하여 데이터로부터 통찰력을 생성하는 프로세스입니다.
서비스
배포된 서비스는 API를 통해 인공 지능, 머신 러닝 모델 또는 고급 알고리즘 기능을 노출하므로 다른 서비스 또는 애플리케이션에서 인텔리전트 앱을 사용하여 사용할 수 있습니다.
다음 차트는 레서피, 모델, 트레이닝 실행 및 점수 실행 간의 계층 관계에 대해 설명합니다.

데이터 과학 작업 공간 이해

데이터 과학 작업 영역을 사용하면 데이터 과학자는 대규모 데이터 세트에서 인사이트를 찾는 번거로운 프로세스를 간소화할 수 있습니다. 일반적인 머신 러닝 프레임워크 및 런타임을 기반으로 구축된 Data Science Workspace는 고급 워크플로우 관리, 모델 관리 및 확장성을 제공합니다. 지능형 서비스는 기계 학습 레서피 재사용을 지원하여 Adobe 제품 및 솔루션을 사용하여 만든 다양한 응용 프로그램을 활성화합니다.

원스톱 데이터 액세스

데이터는 AI와 머신 러닝의 토대가 됩니다.
데이터 과학 작업 공간은 데이터 레이크, 실시간 고객 프로필, 통합 에지 등 Adobe Experience Platform과 완벽하게 통합됩니다. Spark ML, TensorFlow와 같은 일반적인 빅데이터 및 딥 러닝 라이브러리와 함께 Adobe Experience Platform에 저장되어 있는 모든 조직 데이터를 한 번에 검색할 수 있습니다. 필요한 항목을 찾지 못하면 XDM 표준화된 스키마를 사용하여 데이터 세트를 인제스트합니다.

미리 만들어진 머신 러닝 방법

데이터 과학 작업 영역에는 소매 판매 예측 및 이상치 탐지와 같은 일반적인 비즈니스 요구 사항에 맞게 미리 만들어진 기계 학습 레서피가 포함되어 있으므로 데이터 과학자와 개발자는 처음부터 시작할 필요가 없습니다. 현재 세 가지 레서피가 제공되며 제품 구매 예측 , 제품 추천 소매 판매도 가능합니다 .
원하는 경우 미리 만들어진 레시피를 요구 사항에 맞게 변경하거나 레서피를 가져오거나 처음부터 새로 시작하여 사용자 정의 레서피를 만들 수 있습니다. 그러나 레서피 트레이닝을 통해 하이퍼링크를 강화하면 개발자는 몇 번의 클릭만으로 지능적인 맞춤형 서비스를 제작할 수 있으므로 개인화된 개인화된 디지털 경험을 제작할 수 있습니다.

데이터 과학자에 초점을 맞춘 워크플로우

데이터 과학 분야의 전문 지식이 무엇이든 데이터 과학 작업 공간을 사용하면 데이터에서 인사이트를 발견하고 이를 디지털 경험에 적용하는 과정을 간소화하고 신속하게 처리할 수 있습니다.

데이터 탐색

적합한 데이터를 찾아 준비하는 것은 효과적인 레시피를 구축하는 데 있어 가장 많은 노력을 기울여야 합니다. 데이터 과학 작업 공간과 Adobe Experience Platform을 사용하면 데이터를 보다 신속하게 통찰력으로 전환할 수 있습니다.
Adobe Experience Platform에서 크로스 채널 데이터는 XDM 표준화된 스키마에 중앙 집중화되고 저장되므로 데이터를 손쉽게 찾아 파악하고 정리할 수 있습니다. 공통 스키마를 기반으로 한 단일 데이터 저장소를 통해 데이터 탐색과 준비 시간을 수십 시간 절약할 수 있습니다.
검색할 때 호스팅되는 통합 Jupiter Notebook과 R, Python 또는 Scala를 사용하여 플랫폼에서 데이터 카탈로그를 찾아볼 수 있습니다. 이러한 언어 중 하나를 사용하면 Spark ML 및 TensorFlow를 활용할 수 있습니다. 처음부터 새로 만들거나 특정 비즈니스 문제에 대해 제공된 노트북 템플릿 중 하나를 사용할 수 있습니다.
데이터 탐색 워크플로우의 일부로 새 데이터를 인제스트하거나 기존 기능을 사용하여 데이터 준비에 도움이 될 수도 있습니다.

작성

Data Science Workspace를 사용하여 레시피 작성 방법을 결정합니다.
  • 기존의 비즈니스 요구 사항을 충족하거나 특정 요구 사항을 충족하도록 구성할 수 있는 미리 만들어진 레서피를 찾아 시간을 절약할 수 있습니다.
  • Jupiter Notebook의 저작 런타임을 사용하여 레서피 개발 및 등록 방법을 처음부터 새로 만듭니다.
  • Adobe Experience Platform 외부에서 작성한 레시피를 데이터 과학 작업 영역으로 업로드하거나 Git과 데이터 과학 작업 공간 간에 사용 가능한 인증 및 통합을 사용하여 Git과 같은 리포지토리에서 레서피 코드를 가져올 수 있습니다.

실험

Data Science Workspace는 실험 프로세스에 엄청난 유연성을 제공합니다. 조리법부터 시작해 보세요. 그런 다음 동일한 코어 알고리즘을 하이퍼튜닝 매개 변수와 같은 고유한 특성과 함께 사용하여 별도의 인스턴스를 만듭니다. 필요한 만큼 인스턴스를 만들고, 각 인스턴스를 원하는 만큼 트레이닝하고 평가할 수 있습니다. Data Science Workspace는 평가 지표와 함께 레서피, 레서피 인스턴스 및 트레이닝된 인스턴스를 추적하므로 이러한 작업을 수행할 필요가 없습니다.

운영

조리법에 만족하면 몇 번의 클릭만으로 인텔리전트 서비스를 만들 수 있습니다. 코딩 작업 없이도 개발자 또는 엔지니어를 등록하지 않고도 직접 코드를 작성할 수 있습니다. 마지막으로 지능형 서비스를 Adobe IO에 게시하면 디지털 경험 팀이 사용할 수 있습니다.

지속적인 개선

Data Science Workspace는 지능형 서비스가 호출되는 위치와 그 성능을 추적합니다. 데이터가 입력될 때 지능적인 서비스 정확도를 평가하여 루프를 닫고 필요에 따라 레서피를 재교육하여 성능을 향상시킬 수 있습니다. 그 결과 고객 개인화의 정확성을 지속적으로 개선할 수 있습니다.

새로운 기능 및 데이터 세트 이용

데이터 과학자는 Adobe 서비스를 통해 새로운 기술과 데이터 세트를 출시와 동시에 이용할 수 있습니다. Adobe는 잦은 업데이트를 통해 데이터 세트와 기술을 플랫폼에 통합함으로써 번거로운 작업을 하지 않아도 됩니다.

데이터 과학 작업 공간의 액세스 제어

경험 플랫폼의 액세스 제어는 Adobe Admin Console을 통해 관리됩니다 . 이 기능은 사용자와 사용 권한 및 샌드박스를 연결하는 관리 콘솔의 제품 프로필을 활용합니다. 자세한 내용은 액세스 제어 개요를 참조하십시오.
데이터 과학 작업 공간을 사용하려면 "데이터 과학 작업 공간 관리" 권한이 활성화되어 있어야 합니다.
다음 표에서는 이 권한을 활성화하거나 비활성화하는 효과에 대해 설명합니다.
사용 권한
활성화됨
비활성화됨
데이터 과학 작업 공간 관리
데이터 과학 작업 공간의 모든 서비스에 대한 액세스를 제공합니다.
데이터 과학 작업 공간 내의 모든 서비스에 대한 API 및 UI 액세스가 비활성화됩니다. 비활성화되어 있는 경우 데이터 과학 작업 공간 모델 및 서비스 페이지로 라우팅할 수 없습니다.

철저한 보안

Adobe는 데이터 보안을 최우선으로 생각합니다. Adobe는 업계에서 인정하는 표준, 규정 및 인증을 준수하는 데 도움이 되는 보안 프로세스와 제어 기능을 통해 데이터를 보호합니다.
Adobe 보안 제품 수명주기의 일부로 소프트웨어 및 서비스에 보안이 기본으로 제공됩니다. Adobe 데이터 및 소프트웨어 보안, 규정 준수 등에 대한 자세한 내용은 https://www.adobe.com/security.html의 보안 페이지를 참조하십시오.

샌드박스 지원

샌드박스는 경험 플랫폼의 단일 인스턴스 내의 가상 파티션입니다. 각 플랫폼 인스턴스는 하나의 프로덕션 샌드박스와 여러 개의 비프로덕션 샌드박스를 지원하며, 각 샌드박스는 자체 플랫폼 리소스 라이브러리를 유지합니다. 비프로덕션 샌드박스를 사용하면 프로덕션 샌드박스에 영향을 주지 않고 기능을 테스트하고 실험을 실행하고 사용자 정의 구성을 만들 수 있습니다. 샌드박스에 대한 자세한 내용은 샌드박스 개요를 참조하십시오 .
현재 데이터 과학 작업 영역에는 몇 가지 샌드박스 제한이 있습니다.
  • 컴퓨팅 리소스는 프로덕션 샌드박스와 비프로덕션 샌드박스 간에 공유됩니다. 프로덕션 샌드박스의 격리 기능이 나중에 제공되도록 설정되어 있습니다.
  • 현재 프로덕션 샌드박스에서 두 노트북과 레서피에 대한 Scala/Spark 및 PySpark 워크로드가 지원됩니다. 비프로덕션 샌드박스에 대한 지원은 나중에 제공되도록 설정되어 있습니다.

데이터 과학 작업 공간 활용

예측 및 통찰력은 웹 사이트를 방문하거나 콜센터에 연락하거나 다른 디지털 경험에 참여하는 각 고객에게 개인화된 경험을 전달하는 데 필요한 정보를 제공합니다. Data Science Workspace에서 일상적인 작업을 수행하는 방법을 살펴봅니다.

문제 정의

모든 것은 비즈니스 문제로 시작됩니다. 예를 들어 온라인 콜센터는 부정적인 고객 센티멘트를 긍정적인 방향으로 전환하기 위해 컨텍스트가 필요합니다.
고객에 대한 많은 데이터가 있습니다. 사이트를 탐색하고, 장바구니에 품목을 싣고, 심지어 주문까지 하기도 했습니다. 그들은 이메일을 받거나, 쿠폰을 사용하거나, 이전에 콜센터에 연락했을 수도 있습니다. 그런 다음, 레서피는 고객과 고객 활동에 대해 사용 가능한 데이터를 사용하여 구매 경향을 결정하고 고객이 감사하고 사용할 가능성이 있는 제안을 추천해야 합니다.
콜센터 연락 시 고객은 여전히 장바구니에 두 쌍의 신발을 가지고 있지만 셔츠를 제거했습니다. 이와 함께 지능형 서비스는 콜센터 에이전트가 통화 중 20% 할인 쿠폰을 제공하는 것을 권장할 수 있습니다. 고객이 쿠폰을 사용하는 경우 해당 정보가 데이터 세트에 추가되고 다음에 고객이 전화를 할 때 예측이 더 개선됩니다.

데이터 살펴보기 및 준비

정의된 비즈니스 문제를 기반으로, 레서피는 사이트 방문, 검색, 페이지 보기, 클릭한 링크, 장바구니 작업, 받은 서비스, 받은 이메일, 콜 센터 상호 작용 등을 포함하여 모든 고객의 웹 거래를 조사해야 한다는 것을 알고 있습니다.
데이터 과학자는 일반적으로 데이터를 탐색하고 변환하는 방법을 만드는 데 필요한 시간의 최대 75%를 소비합니다. 여러 저장소에서 가져온 데이터로서 서로 다른 스키마로 저장되어 있는 경우가 많습니다. 레서피 생성을 위해 데이터를 사용하려면 먼저 데이터를 결합하고 매핑해야 합니다.
처음부터 새로 만들거나 기존 레서피를 구성하는 경우 조직의 중앙 집중식, 표준 데이터 카탈로그에서 데이터 검색을 시작하여 검색을 크게 간소화합니다. 조직에서 다른 데이터 과학자가 이미 유사한 데이터 세트를 식별했으며 처음부터 새로 시작하지 않고 해당 데이터 세트를 미세 조정하도록 선택할 수도 있습니다. Adobe Experience Platform의 모든 데이터는 표준화된 XDM 스키마를 준수하므로 복잡한 모델을 만들어 데이터를 결합하거나 데이터 엔지니어의 도움을 받을 필요가 없습니다.
필요한 데이터를 즉시 찾지 못했지만 Adobe Experience Platform 외부에 존재하는 경우, 추가 데이터 세트를 수집하는 것은 비교적 간단한 작업이며, 이는 또한 표준화된 XDM 스키마로 변환됩니다. Jupiter Notebook을 사용하여 데이터 사전 처리를 간소화할 수 있습니다. 예를 들어 이전에 구입을 위해 사용한 노트북 템플릿이나 노트북부터 시작됩니다.

레시피 작성

이미 모든 요구 사항을 충족시키는 레시피를 발견했다면 실험을 시작할 수 있습니다. 또는 Jupiter Notebook에서 데이터 과학 작업 공간 제작 런타임을 활용하여 레서피를 약간 수정하거나 처음부터 만들 수 있습니다. 제작 런타임을 사용하면 데이터 과학 작업 공간 트레이닝 및 점수 지정 워크플로우를 모두 사용할 수 있고 나중에 레서피를 변환할 수 있으므로 조직의 다른 사용자가 저장하고 다시 사용할 수 있습니다.
또한 데이터 과학 작업 공간으로 레서피를 가져와 지능적인 서비스를 만들 때 실험 워크플로우를 활용할 수 있습니다.

레시피로 실험

핵심 기계 학습 알고리즘을 통합하는 레시피가 있으면 하나의 레시피로 많은 레서피 인스턴스를 만들 수 있습니다. 이러한 레서피 인스턴스를 모델이라고 합니다. 이 모델은 운영 효율성과 효율성을 최적화하기 위해 트레이닝과 평가가 필요하며, 이 프로세스는 일반적으로 시행착오로 구성됩니다.
모델을 교육하면 교육 실행 및 평가가 생성됩니다. 데이터 과학 작업 공간은 각 고유 모델과 해당 교육 실행에 대한 평가 지표를 추적합니다. 실험을 통해 생성된 평가 지표를 사용하면 가장 성과가 좋은 교육 실행을 결정할 수 있습니다.
데이터 과학 작업 공간에서 모델을 교육하고 평가하는 방법에 대한 자습서는 이 섹션을 참조하십시오.

모델 운영

비즈니스 요구 사항을 충족하기 위해 가장 잘 훈련된 레시피를 선택하면 개발자 지원 없이도 데이터 과학 작업 공간에서 지능적인 서비스를 만들 수 있습니다. 코드를 작성하지 않고도 몇 번의 클릭만으로 가능합니다. 게시된 지능형 서비스는 모델을 다시 만들지 않고도 조직의 다른 구성원이 액세스할 수 있습니다.
게시된 지능형 서비스는 새로운 데이터를 사용할 수 있게 되면 수시로 자동으로 트레이닝됩니다. 따라서 시간이 지남에 따라 서비스가 효율성과 효과를 유지할 수 있습니다.

다음 단계

데이터 과학 작업 공간은 데이터 수집에서부터 알고리즘에 이르기까지 모든 기술 수준의 데이터 과학자를 위한 지능형 서비스에 이르기까지 데이터 과학 워크플로우를 간소화하고 단순화합니다. 데이터 과학 작업 영역에서 제공하는 정교한 툴을 사용하면 데이터에서 인사이트로 이동하는 시간을 크게 단축할 수 있습니다.
더욱 중요한 점은 데이터 과학 작업 영역에서는 Adobe의 선도적인 마케팅 플랫폼의 데이터 과학 및 알고리즘 최적화 기능을 기업 데이터 과학자의 손에 넘겨 줍니다. 기업은 Adobe의 강력한 머신 러닝 및 AI 기능을 활용하여 광범위한 규모의 개인화된 고객 경험을 제공할 수 있으므로 처음으로 플랫폼에 독점 알고리즘을 활용할 수 있습니다.
브랜드 전문 지식과 Adobe의 머신 러닝 및 AI 기량이 결합된 기업은 고객이 요구하는 대로 고객을 제공함으로써 비즈니스 가치와 브랜드 충성도를 높일 수 있습니다.
전체 일상적인 작업 과정과 같은 추가 정보를 보려면 데이터 과학 작업 공간 안내 설명서를 읽어 보십시오.

Journey Orchestration용

다음 비디오는 데이터 과학 작업 공간에 대한 이해를 지원하기 위해 만들어졌습니다.