Show Menu
TÓPICOS×

Visão geral da Análise do espaço de trabalho da Data Science

A Adobe Experience Platform Data Science Workspace usa o aprendizado de máquina e a inteligência artificial para liberar insights de seus dados. Integrado ao Adobe Experience Platform, Data Science Workspace ajuda você a fazer previsões usando seu conteúdo e seus ativos de dados nas soluções de Adobe.
Os cientistas de dados de todos os níveis de habilidades encontrarão ferramentas sofisticadas e fáceis de usar que suportam o rápido desenvolvimento, treinamento e ajuste de fórmulas de aprendizado de máquina - todos os benefícios da tecnologia da IA, sem a complexidade.
Com Data Science Workspaceisso, os cientistas de dados podem criar facilmente APIs de serviços inteligentes - impulsionados pelo aprendizado de máquinas. Esses serviços funcionam com outros serviços de Adobe, incluindo Adobe Target e Adobe Analytics Cloud, para ajudar você a automatizar experiências digitais personalizadas e direcionadas em aplicativos da Web, desktop e móveis.
Este guia fornece uma visão geral dos principais conceitos relacionados a Data Science Workspace.

Introdução

A empresa atual coloca uma alta prioridade na mineração de grandes dados para previsões e insights que os ajudarão a personalizar experiências de clientes e fornecer mais valor aos clientes - e aos negócios. Por mais importante que seja, passar dos dados para insights pode ter um custo alto. Normalmente, requer cientistas de dados qualificados que conduzem pesquisas de dados intensivas e demoradas para desenvolver modelos de aprendizado de máquina, ou receitas, que potencializem serviços inteligentes. O processo é longo, a tecnologia é complexa, e dados especializados que os cientistas podem ser difíceis de encontrar.
Com Data Science Workspaceo, a Adobe Experience Platform permite trazer IA voltada para a experiência em toda a empresa, simplificando e acelerando os dados para insights para código com:
  • Uma estrutura de aprendizado de máquina e tempo de execução
  • Acesso integrado aos seus dados armazenados no Adobe Experience Platform
  • Um schema de dados unificado baseado em Experience Data Model (XDM)
  • O poder de computação essencial para o aprendizado da máquina/IA e o gerenciamento de grandes conjuntos de dados
  • Fórmulas de aprendizado de máquina pré-criadas para acelerar o salto em experiências conduzidas pela IA
  • Criação, reutilização e modificação simplificadas de receitas para cientistas de dados de níveis variados de habilidades
  • Publicação e compartilhamento de serviços inteligentes em apenas alguns cliques - sem um desenvolvedor - e monitoramento e treinamento para otimização contínua de experiências personalizadas do cliente
Os cientistas de dados de todos os níveis de habilidades obterão insights mais rapidamente e mais eficazes em experiências digitais.

Introdução

Antes de entrar nos detalhes do Data Science Workspace, veja um breve resumo dos termos principais:
Termo
Definição
Data Science Workspace
Data Science Workspace dentro Experience Platform permite que os clientes criem modelos de aprendizado de máquina utilizando dados nas soluções Experience Platform e Adobe para gerar insights inteligentes e previsões para tecer experiências digitais deliciosas para o usuário final.
Inteligência artificial
A inteligência artificial é uma teoria e desenvolvimento de sistemas computacionais que são capazes de executar tarefas que normalmente exigem inteligência humana, como percepção visual, reconhecimento de voz, tomada de decisão e tradução entre línguas.
Aprendizagem de máquina
O aprendizado de máquina é o campo de estudo que permite aos computadores aprenderem sem serem explicitamente programados.
Sensei Estrutura ML
Sensei O ML Framework é uma estrutura unificada de aprendizagem de máquina através do Adobe que aproveita os dados para capacitar Experience Platform os cientistas de dados no desenvolvimento de serviços de inteligência orientados pelo aprendizado de máquina de modo mais rápido, escalável e reutilizável.
Experience Data Model
Experience Data Model (XDM) é o esforço de padronização que o Adobe leva a definir schemas padrão, como Profile e ExperienceEvent, para o Gerenciamento de experiência do cliente.
JupyterLab
JupyterLab é uma interface baseada na Web de código aberto para o Project Júpitter e está totalmente integrada ao projeto Experience Platform.
Receitas
Uma receita é um termo para uma especificação de modelo e um container de nível superior que representa um aprendizado de máquina específico, algoritmo AI ou conjunto de algoritmos, lógica de processamento e configuração necessários para criar e executar um modelo e, portanto, ajudar a resolver problemas específicos de negócios.
Modelo
Um modelo é uma instância de uma fórmula de aprendizado de máquina treinada usando dados históricos e configurações para solucionar um caso de uso comercial.
Treinamento
Treinamento é o processo de aprendizado de padrões e insights de dados rotulados.
Modelo treinado
Um modelo treinado representa a saída executável de um processo de treinamento modelo, no qual um conjunto de dados de treinamento foi aplicado à instância do modelo. Um modelo treinado manterá uma referência a qualquer serviço inteligente da Web criado a partir dele. O modelo treinado é adequado para pontuação e criação de um serviço Web inteligente. As modificações em um modelo treinado podem ser rastreadas como uma nova versão.
Pontuação
A pontuação é o processo de gerar insights a partir de dados usando um modelo treinado.
Serviço de
Um serviço implantado expõe a funcionalidade de uma inteligência artificial, modelo de aprendizado de máquina ou algoritmo avançado por meio de uma API, para que possa ser consumido por outros serviços ou aplicativos para criar aplicativos inteligentes.
O gráfico a seguir descreve a relação hierárquica entre Recebimentos, Modelos, Execuções de treinamento e Execuções de pontuação.

Noções básicas do Data Science Workspace

Com Data Science Workspaceeles, seus cientistas de dados podem simplificar o complicado processo de descobrir insights em grandes conjuntos de dados. Criado com base em uma estrutura comum de aprendizado de máquina e tempo de execução, Data Science Workspace oferece gerenciamento avançado de fluxo de trabalho, gerenciamento de modelos e escalabilidade. Os serviços inteligentes suportam a reutilização de fórmulas de aprendizado de máquina para potencializar uma variedade de aplicativos criados com produtos e soluções de Adobe.

Acesso único aos dados

Os dados são a pedra angular da IA e do aprendizado da máquina.
Data Science Workspace é totalmente integrado à Adobe Experience Platform, incluindo o Data Lake, Real-time Customer Profilee Unified Edge. Explore todos os seus dados organizacionais armazenados no Adobe Experience Platform ao mesmo tempo, juntamente com grandes bibliotecas de dados e de aprendizado profundo, como o Spark ML e o ML TensorFlow. Se você não encontrar o que precisa, assimile seus próprios conjuntos de dados usando o schema padronizado XDM.

Fórmulas de aprendizado de máquina pré-criadas

Data Science Workspace inclui fórmulas pré-criadas de aprendizado de máquina para necessidades comerciais comuns, como previsão de vendas de varejo e detecção de anomalias, de modo que cientistas e desenvolvedores de dados não precisam start do zero. Atualmente, três fórmulas são oferecidas, previsão de compra de produtos, recomendações de produtos e vendas de varejo.
Se preferir, você pode adaptar uma receita pré-criada às suas necessidades, importar uma receita ou um start do zero para criar uma receita personalizada. Entretanto, quando você treina e hiperajusta uma receita, a criação de um serviço inteligente personalizado não requer um desenvolvedor - apenas alguns cliques e você está pronto para criar uma experiência digital direcionada e personalizada.

Fluxo de trabalho focado no cientista de dados

Qualquer que seja o seu nível de experiência em ciência de dados, Data Science Workspace ajuda a simplificar e acelerar o processo de encontrar insights nos dados e aplicá-los a experiências digitais.

Exploração de dados

Encontrar os dados certos e prepará-los é a parte mais trabalhosa da construção de uma receita eficaz. Data Science Workspace e a Adobe Experience Platform ajudará você a obter dados para insights mais rapidamente.
No Adobe Experience Platform, seus dados entre canais são centralizados e armazenados no schema padronizado XDM, para que os dados sejam mais fáceis de encontrar, entender e limpar. Um único armazenamento de dados baseado em um schema comum pode salvar inúmeras horas de exploração e preparação de dados.
Ao navegar, use R, Pythonou Scala com a página integrada hospedada Jupyter Notebook para navegar no catálogo de dados Platform. Usando um desses idiomas, você também pode aproveitar o Spark ML e o TensorFlow. Start do zero ou use um dos modelos de notebook fornecidos para problemas específicos da empresa.
Como parte do fluxo de trabalho da exploração de dados, você também pode assimilar novos dados ou usar recursos existentes para ajudar na preparação dos dados.

Criação

Com Data Science Workspace, você decide como quer criar receitas.
  • Economize tempo ao procurar uma fórmula pré-criada que atenda às suas necessidades comerciais, que você pode usar como está ou configurar para atender aos seus requisitos específicos.
  • Crie uma receita do zero, usando o tempo de execução de criação no Jupyter Notebook para desenvolver e registrar a receita.
  • Faça upload de uma receita criada fora da Adobe Experience Platform para Data Science Workspace ou importe o código de receita de um repositório, como Git, usando a autenticação e a integração disponíveis entre Git e Data Science Workspace.

Experimentação

A Data Science Workspace proporciona uma grande flexibilidade ao processo de experimentação. Start com a sua receita. Em seguida, crie uma instância separada, usando o mesmo algoritmo principal emparelhado com características exclusivas, como parâmetros de hiperajuste. É possível criar quantas instâncias forem necessárias, treinando e pontuando cada instância quantas vezes desejar. À medida que você os treina, Data Science Workspace rastreia receitas, instâncias de receitas e instâncias treinadas, juntamente com métricas de avaliação, para que você não precise.

Operacionalização

Quando você está feliz com sua receita, é só alguns cliques para criar um serviço inteligente. Não é necessário programação - você pode fazer isso sozinho, sem se inscrever em um desenvolvedor ou engenheiro. Por fim, publique o serviço inteligente em Adobe IO e ele estará pronto para ser consumido pela sua equipe de experiência digital.

Melhoria contínua

Data Science Workspace rastreia onde os serviços inteligentes são chamados e como estão se apresentando. À medida que os dados entram, você pode avaliar a precisão do serviço inteligente para fechar o loop e retreinar as fórmulas conforme necessário para melhorar o desempenho. O resultado é um refinamento contínuo na precisão da personalização do cliente.

Acesso a novos recursos e conjuntos de dados

Os cientistas de dados podem aproveitar as novas tecnologias e conjuntos de dados assim que estiverem disponíveis através dos serviços de Adobe. Através de atualizações frequentes, fazemos o trabalho de integração de conjuntos de dados e tecnologias na plataforma, para que você não precise.

Controle de acesso em Data Science Workspace

O controle de acesso for Experience Platform administrado através do Adobe Admin Console . Essa funcionalidade aproveita perfis de produtos no Admin Console, que vinculam usuários com permissões e caixas de proteção. Consulte a visão geral do controle de acesso para obter mais informações.
Para usar Data Science Workspace, a permissão "Gerenciar a área de trabalho de dados" deve estar ativada .
A tabela a seguir descreve os efeitos da ativação ou desativação dessa permissão:
Permissão
Ativado
Desativado
Manage Data Science Workspace
Fornece acesso a todos os serviços em Data Science Workspace.
O acesso à API e à interface do usuário para todos os serviços dentro Data Science Workspace está desativado. Enquanto estiver desativado, o roteamento para as páginas Data Science Workspace Modelos e Serviços ​será impedido.

Segurança e paz de espírito

A segurança de seus dados é uma prioridade máxima para o Adobe. O Adobe protege seus dados com os processos e controles de segurança desenvolvidos para ajudar a cumprir padrões, regulamentos e certificações aceitos pela indústria.
A segurança é integrada em software e serviços como parte do ciclo de vida seguro do produto Adobe. Para saber mais sobre segurança, conformidade e outros dados do Adobe, visite a página de segurança em https://www.adobe.com/security.html.

Suporte a sandbox

As caixas de proteção são partições virtuais em uma única instância do Experience Platform. Cada Platform instância suporta uma caixa de proteção de produção e várias caixas de proteção de não produção, cada uma mantendo sua própria biblioteca de Platform recursos. As caixas de proteção de não-produção permitem testar recursos, executar experimentos e fazer configurações personalizadas sem afetar sua caixa de proteção de produção. Para obter mais informações sobre caixas de proteção, consulte a visão geral das caixas de proteção.
Atualmente, Data Science Workspace há algumas limitações de sandbox:
  • Os recursos de computação são compartilhados na caixa de proteção de produção e nas caixas de proteção de não produção. O isolamento para caixas de proteção de produção está definido para ser fornecido no futuro.
  • Atualmente, as cargas de trabalho Scala/Spark e PySpark para notebooks e fórmulas são compatíveis apenas na área de segurança de produção. O suporte para caixas de proteção que não sejam de produção está definido para ser fornecido no futuro.

Data Science Workspace em ação

As previsões e insights fornecem as informações necessárias para fornecer uma experiência altamente personalizada a cada cliente que visita seu site, entra em contato com sua central de atendimento ou participa de outras experiências digitais. Aqui está como seu trabalho cotidiano acontece com Data Science Workspace.

Definir o problema

Tudo start com um problema de negócios. Por exemplo, uma central de atendimento on-line precisa de contexto para ajudá-los a tornar positivo o sentimento negativo do cliente.
Há muitos dados sobre o cliente. Eles navegaram pelo site, colocaram itens no carrinho e até fizeram pedidos. Eles podem ter recebido e-mails, usado cupons ou contatado a central de atendimento anteriormente. A receita, portanto, precisa usar os dados disponíveis sobre o cliente e suas atividades para determinar a propensão para comprar e recomendar uma oferta que o cliente provavelmente apreciará e usará.
No momento do contato da central de atendimento, o cliente ainda tem dois pares de sapatos no carrinho, mas removeu uma camisa. Com essas informações, o serviço inteligente pode recomendar que o agente da central de atendimento oferta um cupom por 20% de desconto nos sapatos durante a chamada. Se o cliente usar o cupom, essas informações serão adicionadas ao conjunto de dados e as previsões se tornarão ainda melhores na próxima vez que o cliente fizer uma chamada.

Explore e prepare os dados

Com base no problema de negócios definido, você sabe que a receita deve analisar todas as transações da Web do cliente, incluindo visitas ao site, pesquisas, visualizações de página, links clicados, ações de carrinho, ofertas recebidas, e-mails recebidos, interações de call center e assim por diante.
Um cientista de dados geralmente gasta até 75% do tempo necessário para criar uma receita explorando e transformando os dados. Os dados geralmente vêm de vários repositórios e são salvos em schemas diferentes - eles devem ser combinados e mapeados antes de poderem ser usados para criar uma fórmula.
Se você estiver começando do zero ou configurando uma fórmula existente, você começará a pesquisa de dados em um catálogo de dados centralizado e padronizado para sua organização, o que simplifica consideravelmente a busca. Você pode até descobrir que outro cientista de dados em sua organização já identificou um conjunto de dados semelhante e optar por ajustar esse conjunto de dados em vez de start do zero. Todos os dados da Adobe Experience Platform estão em conformidade com um schema XDM padronizado, eliminando a necessidade de criar um modelo complexo para unir dados ou obter ajuda de um engenheiro de dados.
Se você não encontrar imediatamente os dados necessários, mas eles existem fora da Adobe Experience Platform, é uma tarefa relativamente simples de assimilar conjuntos de dados adicionais, que também se transformarão no schema XDM padronizado. Você pode usar Jupyter Notebook para simplificar o pré-processamento de dados - possivelmente começando com um modelo de notebook ou um notebook usado anteriormente para a propensão a comprar.

Aumentar a receita

Se você já encontrar uma fórmula que atenda a todas as suas necessidades, poderá passar para a experimentação. Ou você pode modificar um pouco a fórmula ou criar uma do zero - aproveitando o tempo de execução de Data Science Workspace criação em Jupyter Notebook. O uso do tempo de execução de criação garante que você possa usar o fluxo de trabalho de treinamento e pontuação e converter a receita posteriormente para que possa ser armazenada e reutilizada por outras pessoas em sua organização. Data Science Workspace
Você também pode importar uma receita para Data Science Workspace e aproveitar os workflows de experimentação ao criar seu serviço inteligente.

Experimente com a receita

Com uma receita que incorpora os algoritmos principais de aprendizado de máquina, muitas instâncias de fórmula podem ser criadas com uma única receita. Essas instâncias de fórmula são chamadas de modelos. Um modelo requer treinamento e avaliação para otimizar sua eficiência e eficácia operacional, um processo normalmente composto de tentativa e erro.
À medida que você treina seus modelos, as execuções de treinamento e as avaliações são geradas. Data Science Workspace acompanha as métricas de avaliação para cada modelo exclusivo e suas execuções de treinamento. As métricas de avaliação geradas por meio de experimentação permitirão determinar a execução de treinamento que tem melhor desempenho.
Visite o tutorial da API ou da interface do usuário sobre como treinar e avaliar modelos no Data Science Workspace.

Operacionalizar o modelo

Quando você seleciona a melhor fórmula treinada para atender às necessidades de sua empresa, é possível criar um serviço inteligente Data Science Workspace sem a ajuda do desenvolvedor. São apenas alguns cliques - sem necessidade de codificação. Um serviço inteligente publicado é acessível a outros membros de sua organização sem a necessidade de recriar o modelo.
Um serviço inteligente publicado é configurável para se treinar automaticamente de vez em quando usando novos dados conforme eles se tornam disponíveis. Isso garante que seu serviço mantenha sua eficiência e eficácia enquanto o tempo continua.

Próximas etapas

Data Science Workspace ajuda a simplificar o fluxo de trabalho da ciência de dados, desde a coleta de dados até os algoritmos até serviços inteligentes para cientistas de dados de todos os níveis de habilidades. Com as ferramentas sofisticadas Data Science Workspace fornecidas, é possível reduzir significativamente o tempo de dados para insights.
Mais importante, Data Science Workspace coloca os recursos de ciência de dados e otimização de algoritmos da plataforma de marketing líder em Adobe nas mãos dos cientistas de dados da empresa. Pela primeira vez, as empresas podem trazer algoritmos proprietários para a plataforma, aproveitando os poderosos recursos de aprendizado de máquina e AI para fornecer experiências altamente personalizadas aos clientes em larga escala.
Com o casamento da experiência com a marca e o aprendizado com a máquina Adobe, as empresas têm o poder de gerar mais valor comercial e fidelidade à marca, dando aos clientes o que eles querem, antes que eles peçam.
Para obter informações adicionais, como um fluxo de trabalho diário completo, comece lendo a documentação de navegação da Data Science Workspace .

Recursos adicionais

O vídeo a seguir foi projetado para oferecer suporte à sua compreensão do Data Science Workspace.