Show Menu
TÓPICOS×

Sobre o menu Rastreamento

Use o menu Rastreamento para definir a data e as máscaras de URL, senhas, tipos de conteúdo, conexões, definições de formulário e pontos de entrada de URL.

Sobre pontos de entrada de URL

A maioria dos sites tem um ponto de entrada ou home page principal que um cliente visita inicialmente. Este ponto de entrada principal é o endereço URL a partir do qual o robô de pesquisa inicia o rastreamento de índice. No entanto, se o site tiver vários domínios ou subdomínios, ou se partes do site não estiverem vinculadas do ponto de entrada principal, você poderá usar os Pontos de entrada do URL para adicionar mais pontos de entrada.
Todas as páginas do site abaixo de cada ponto de entrada de URL especificado são indexadas. Você pode combinar pontos de entrada de URL com máscaras para controlar exatamente quais partes de um site você deseja indexar. É necessário recriar o índice do site antes que os efeitos das configurações de Pontos de entrada do URL fiquem visíveis para os clientes.
O ponto de entrada principal normalmente é o URL do site que você deseja indexar e pesquisar. Você configura esse ponto de entrada principal em Configurações da conta.
Consulte Definição das configurações da sua conta.
Depois de especificar o ponto de entrada principal do URL, você pode especificar outros pontos de entrada que deseja rastrear em ordem. Frequentemente, você especificará pontos de entrada adicionais para páginas da Web que não estão vinculadas de páginas no ponto de entrada principal. Especifique pontos de entrada adicionais quando o site abranger mais de um domínio, como no exemplo a seguir:
https://www.domain.com/
https://www.domain.com/not_linked/but_search_me_too/
https://more.domain.com/
Você qualifica cada ponto de entrada com uma ou mais das seguintes palavras-chave separadas por espaço na tabela abaixo. Essas palavras-chave afetam como a página é indexada.
Importante : Certifique-se de separar uma determinada palavra-chave do ponto de entrada e uma da outra por um espaço; uma vírgula não é um separador válido.
Palavra-chave
Descrição
noindex
Se você não quiser indexar o texto na página do ponto de entrada, mas quiser seguir os links da página, adicione noindex após o ponto de entrada.
Separe a palavra-chave do ponto de entrada por um espaço, como no exemplo a seguir:
https://www.my-additional-domain.com/more_pages/main.html noindex
Essa palavra-chave equivale a uma meta tag de robôs com content="noindex" ) entre <head> ... </head> tags da página do ponto de entrada.
nofollow
Se você quiser indexar o texto na página do ponto de entrada, mas não quiser seguir nenhum dos links da página, adicione nofollow após o ponto de entrada.
Separe a palavra-chave do ponto de entrada por um espaço, como no exemplo a seguir:
https://www.domain.com/not_linked/directory_listing&nbsp;nofollow
Essa palavra-chave equivale a uma meta tag de robôs com content="nofollow" entre <head> ... </head> tag de uma página de ponto de entrada.
formulário
Quando o ponto de entrada for uma página de logon, formulário normalmente é usada para que o robô de pesquisa possa enviar o formulário de logon e receber os cookies apropriados antes de rastrear o site. Quando a palavra-chave "formulário" é usada, a página do ponto de entrada não é indexada e o robô de pesquisa não marca a página do ponto de entrada como rastreada. Use nofollow se você não quiser que o robô de pesquisa siga os links da página.
Consulte também Sobre tipos de conteúdo.
Consulte também Sobre o Conector de índice.

Adicionar vários pontos de entrada de URL que você deseja indexar

Se o site tiver vários domínios ou subdomínios e você quiser que eles sejam rastreados, você poderá usar pontos de entrada de URL para adicionar mais URLs.
Para definir o ponto de entrada principal do URL do site, use Configurações da conta.
Consulte Definição das configurações da sua conta.
Para adicionar vários pontos de entrada de URL que você deseja indexar
  1. No menu do produto, clique em Settings > Crawling > URL Entrypoints .
  2. Na URL Entrypoints página, no Entrypoints campo, insira um endereço de URL por linha.
  3. (Opcional) Na lista Add Index Connector Configurations suspensa, selecione um conector de índice que deseja adicionar como ponto de entrada para indexação.
    A lista suspensa só estará disponível se você tiver adicionado anteriormente uma ou mais definições de conector de índice.
    Consulte Adicionando uma definição de Conector de índice.
  4. Clique em Save Changes .
  5. (Opcional) Execute um dos procedimentos a seguir:

Sobre máscaras de URL

As máscaras de URL são padrões que determinam qual de seu site documentos o robô de pesquisa indexa ou não índices.
Certifique-se de recriar o índice do site para que os resultados das máscaras de URL fiquem visíveis aos clientes.
A seguir estão dois tipos de máscaras de URL que você pode usar:
  • Incluir máscaras de URL
  • Excluir máscaras de URL
Inclua máscaras de URL para informar ao robô de pesquisa qualquer documentos que corresponda ao padrão da máscara.
Excluir máscaras de URL instrui o robô de pesquisa a indexar documentos correspondentes.
À medida que o robô de pesquisa viaja de um link para outro site, ele encontra URLs e procura máscaras que correspondam a esses URLs. A primeira correspondência determina se o URL deve ser incluído ou excluído do índice. Se nenhuma máscara corresponder a um URL encontrado, esse URL será descartado do índice.
Incluir máscaras de URL para URLs de ponto de entrada são geradas automaticamente. Esse comportamento garante que todos os documentos encontrados em seu site sejam indexados. Também elimina convenientemente os links que "deixam" seu site. Por exemplo, se uma página indexada se vincula a https://www.yahoo.com, o robô de pesquisa não indexa esse URL porque não corresponde à máscara de inclusão gerada automaticamente pelo URL do ponto de entrada.
Cada máscara de URL especificada deve estar em uma linha separada.
A máscara pode especificar qualquer um dos seguintes:
  • Um caminho completo como em https://www.mydomain.com/products.html .
  • Um caminho parcial como em https://www.mydomain.com/products .
  • Um URL que usa curingas como em https://www.mydomain.com/*.html .
  • Uma expressão regular (para usuários avançados).
    Para tornar uma máscara uma expressão regular, insira a palavra-chave regexp entre o tipo de máscara ( exclude ou include ) e a máscara de URL.
Este é um exemplo simples de máscara de exclusão de URL:
exclude https://www.mydomain.com/photos

Como este exemplo é uma máscara de URL excluída, qualquer documento que corresponda ao padrão não é indexado. O padrão corresponde a qualquer item encontrado, tanto arquivos quanto pastas, de modo que https://www.mydomain.com/photos.html e https://www.mydomain.com/photos/index.html , ambos correspondentes ao URL excluído, não sejam indexados. Para corresponder somente aos arquivos na /photos/ pasta, a máscara de URL deve conter uma barra à direita, como no exemplo a seguir:
exclude https://www.mydomain.com/photos/

O exemplo de máscara de exclusão a seguir usa um curinga. Ele instrui o robô de pesquisa a ignorar arquivos com a extensão ".pdf". O robô de pesquisa não adiciona esses arquivos ao índice.
exclude *.pdf

Uma máscara de URL simples de inclusão é a seguinte:
include https://www.mydomain.com/news/

Somente documentos vinculados por meio de uma série de links de um ponto de entrada de URL, ou que são usados como um ponto de entrada de URL propriamente dito, são indexados. A listagem exclusiva de um URL de documento como uma máscara de URL de inclusão não indexa um documento desvinculado. Para adicionar documentos não vinculados ao seu índice, você pode usar o recurso de Pontos de entrada de URL.
Consulte Sobre pontos de entrada de URL.
Incluir máscaras e excluir máscaras podem trabalhar em conjunto. Você pode excluir uma grande parte do seu site da indexação ao criar uma máscara de URL excluída e ainda incluir uma ou mais páginas excluídas com uma máscara de URL de inclusão. Por exemplo, suponha que o URL do ponto de entrada seja o seguinte:
https://www.mydomain.com/photos/

O robô de pesquisa rastreia e indexa todas as páginas em /photos/summer/ , /photos/spring/ e /photos/fall/ (supondo que haja links para pelo menos uma página em cada diretório da photos pasta). Esse comportamento ocorre porque os caminhos de link permitem que o robô de pesquisa localize os documentos nas pastas /summer/ , /spring/ e /fall/ , e os URLs das pastas correspondem à máscara de inclusão gerada automaticamente pelo URL do ponto de entrada.
Você pode optar por excluir todas as páginas na /fall/ pasta com uma máscara de URL excluída, como no exemplo a seguir:
exclude https://www.mydomain.com/photos/fall/

Ou, incluir seletivamente apenas /photos/fall/redleaves4.html como parte do índice com a seguinte máscara de URL:
include https://www.mydomain.com/photos/fall/redleaves4.html

Para que os dois exemplos de máscara acima funcionem conforme desejado, a máscara de inclusão é listada primeiro, como a seguir:
include https://www.mydomain.com/photos/fall/redleaves4.html 
exclude https://www.mydomain.com/photos/fall/

Como o robô de pesquisa segue as direções na ordem em que estão listados, o robô de pesquisa primeiro inclui /photos/fall/redleaves4.html e, em seguida, exclui o restante dos arquivos na /fall pasta.
Se as instruções forem especificadas do modo contrário, como a seguir:
exclude https://www.mydomain.com/photos/fall/ 
include https://www.mydomain.com/photos/fall/redleaves4.html

Em seguida, não /photos/fall/redleaves4.html é incluído, mesmo que a máscara especifique que está incluído.
Uma máscara de URL que aparece primeiro sempre tem precedência sobre uma máscara de URL que aparece posteriormente nas configurações de máscara. Além disso, se o robô de pesquisa encontrar uma página que corresponda a uma máscara de URL de inclusão e uma máscara de URL de exclusão, a máscara listada primeiro sempre terá prioridade.

Sobre o uso de palavras-chave com máscaras de URL

Você pode qualificar cada máscara de inclusão com uma ou mais palavras-chave separadas por espaço, que afetam como as páginas correspondentes são indexadas.
Uma vírgula não é válida como separador entre a máscara e a palavra-chave; você só pode usar espaços.
Palavra-chave
Descrição
noindex
Se você não quiser indexar o texto nas páginas que correspondem à máscara de URL, mas quiser seguir os links de páginas correspondentes, adicione noindex após a máscara de inclusão de URL. Certifique-se de separar a palavra-chave da máscara por um espaço, como no exemplo a seguir:
include&nbsp;*.swf&nbsp;noindex
O exemplo acima especifica que o robô de pesquisa segue todos os links dos arquivos com a variável .swf , mas desativa a indexação de todo o texto contido nesses arquivos.
A configuração noindex palavra-chave equivale a uma meta tag de robô com content="noindex" entre <head>...</head> tags de páginas correspondentes.
nofollow
Se você quiser indexar o texto nas páginas que correspondem à máscara de URL, mas não quiser seguir os links da página correspondente, adicione nofollow após a máscara de inclusão de URL. Certifique-se de separar a palavra-chave da máscara por um espaço, como no exemplo a seguir:
include&nbsp;https://www.mydomain.com/photos&nbsp;nofollow
A configuração nofollow palavra-chave equivale a uma meta tag de robô com content="nofollow" entre <head>...</head> tags de páginas correspondentes.
regexp
Usado para incluir e excluir máscaras.
Qualquer máscara de URL precedida por regexp é tratada como uma expressão regular. Se o robô de pesquisa encontrar documentos que correspondam a uma máscara de URL de expressão regular excluída, esses documentos não serão indexados. Se o robô de pesquisa encontrar documentos que correspondam a uma máscara de URL de expressão regular de inclusão, esses documentos serão indexados. Por exemplo, suponha que você tenha a seguinte máscara de URL:
exclude&nbsp;regexp&nbsp;^.*/products/.*\.html$
O robô de pesquisa exclui arquivos correspondentes, como https://www.mydomain.com/products/page1.html
Se você tivesse a seguinte máscara de URL de expressão regular excluída:
exclude&nbsp;regexp&nbsp;^.*\?..*$
O robô de pesquisa não deve incluir nenhum URL que contenha um parâmetro CGI, como https://www.mydomain.com/cgi/prog/?arg1=val1&arg2=val2 .
Se você tivesse a seguinte máscara de URL de expressão regular:
include&nbsp;regexp&nbsp;^.*\.swf$&nbsp;noindex
O robô de pesquisa segue todos os links de arquivos com a extensão ".swf". A configuração noindex a palavra-chave também especifica que o texto dos arquivos correspondentes não são indexados.

Adicionar máscaras de URL para indexar ou não indexar partes do seu site

Você pode usar URL Masks para definir quais partes do site você deseja ou não deseja rastrear e indexar.
Use o campo Testar máscaras de URL para testar se um documento está ou não incluído depois de indexar.
Certifique-se de recriar o índice do site para que os resultados das máscaras de URL fiquem visíveis aos clientes.
Para adicionar máscaras de URL para indexar ou não partes de seu site
  1. No menu do produto, clique em Settings > Crawling > URL Masks .
  2. (Opcional) Na URL Masks página, no Test URL Masks campo, insira uma máscara de URL de teste em seu site e clique em Test .
  3. No URL Masks campo, digite include (para adicionar um site que você deseja rastrear e indexar) ou digite exclude (para impedir que um site seja rastreado e indexado), seguido do endereço da máscara de URL.
    Insira um endereço de máscara de URL por linha. Exemplo:
    include https://www.mycompany.com/summer 
    include https://www.mycompany.com/spring 
    exclude regexp .*\.xml 
    exclude https://www.mycompany.com/fall
    
    
  4. Clique em Save Changes .
  5. (Opcional) Execute um dos procedimentos a seguir:

Sobre máscaras de data

Você pode usar máscaras de data para incluir ou excluir arquivos dos resultados da pesquisa com base na idade do arquivo.
Certifique-se de recriar o índice do site para que os resultados das máscaras de URL fiquem visíveis aos clientes.
A seguir estão dois tipos de máscaras de data que você pode usar:
  • Incluir máscaras de data ("incluir dias" e "incluir data")
    Incluir os arquivos de índice de máscaras de data que estão datados na data especificada ou antes dela.
  • Excluir máscaras de data ("dias excluídos" e "data de exclusão")
    Exclua os arquivos de índice de máscaras de data que estão datados na data especificada ou antes dela.
Por padrão, a data do arquivo é determinada a partir das informações da tag meta. Se nenhuma tag Meta for encontrada, a data de um arquivo será determinada a partir do cabeçalho HTTP recebido do servidor quando o robô de pesquisa baixar um arquivo.
Cada máscara de data especificada deve estar em uma linha separada.
A máscara pode especificar qualquer um dos seguintes:
  • Um caminho completo como em https://www.mydomain.com/products.html
  • Um caminho parcial como em https://www.mydomain.com/products
  • Um URL que usa curingas https://www.mydomain.com/*.html
  • Uma expressão normal. Para tornar uma máscara uma expressão regular, insira a palavra-chave regexp antes do URL.
As máscaras de data de inclusão e exclusão podem especificar uma data de uma das duas maneiras a seguir. As máscaras só serão aplicadas se os arquivos correspondentes tiverem sido criados na data especificada ou antes dela:
  1. Um número de dias. Por exemplo, suponha que sua máscara de data seja a seguinte:
    exclude-days 30 https://www.mydomain.com/docs/archive/)
    
    
    O número de dias especificado é contado de volta. Se o arquivo tiver data igual ou anterior à data de chegada, a máscara será aplicada.
  2. Uma data real usando o formato AAAA-MM-DD. Por exemplo, suponha que sua máscara de data seja a seguinte:
    include-date 2011-02-15 https://www.mydomain.com/docs/archive/)
    
    
    Se o documento correspondente for datado na data especificada ou antes dela, a máscara de data será aplicada.
Este é um exemplo simples de máscara de data de exclusão:
exclude-days 90 https://www.mydomain.com/docs/archive

Como esta é uma máscara de data de exclusão, qualquer arquivo que corresponda ao padrão não é indexado e tem 90 dias ou mais. Quando você exclui um documento, nenhum texto é indexado e nenhum link é seguido desse arquivo. O arquivo é efetivamente ignorado. Neste exemplo, os arquivos e as pastas podem corresponder ao padrão de URL especificado. Observe que ambos https://www.mydomain.com/docs/archive.html e https://www.mydomain.com/docs/archive/index.html correspondem ao padrão e não são indexados se tiverem 90 dias ou mais. Para corresponder somente arquivos na /docs/archive/ pasta, a máscara de data deve conter uma barra à direita, como no seguinte:
exclude-days 90 https://www.mydomain.com/docs/archive/

As máscaras de data também podem ser usadas com curingas. A máscara de exclusão a seguir diz ao robô de pesquisa para ignorar arquivos com a extensão ".pdf" que estão datados de 2011-02-15 até 2011. O robô de pesquisa não adiciona arquivos correspondentes ao índice.
exclude-date 2011-02-15 *.pdf

Incluir máscara de data semelhante, somente os arquivos correspondentes são adicionados ao índice. O exemplo de máscara de data de inclusão a seguir instrui o robô de pesquisa a indexar o texto de quaisquer arquivos com zero dias de idade ou mais antigos na /docs/archive/manual/ área do site.
include-days 0 https://www.mydomain.com/docs/archive/manual/

Incluir máscaras e excluir máscaras podem trabalhar em conjunto. Por exemplo, você pode excluir uma grande parte do seu site da indexação ao criar uma máscara de data de exclusão e ainda incluir uma ou mais páginas excluídas com uma máscara de URL de inclusão. Se o URL do ponto de entrada for o seguinte:
https://www.mydomain.com/archive/

O robô de pesquisa rastreia e indexa todas as páginas abaixo /archive/summer/ , /archive/spring/ e /archive/fall/ (supondo que haja links para pelo menos uma página em cada pasta da archive pasta). Esse comportamento ocorre porque os caminhos de link permitem que o robô de pesquisa "localize" os arquivos nas pastas /summer/ , /spring/ e /fall/ e os URLs das pastas correspondem à máscara de inclusão gerada automaticamente pelo URL do ponto de entrada.
Consulte Sobre pontos de entrada de URL.
Consulte Definição das configurações da sua conta.
Você pode optar por excluir todas as páginas com mais de 90 dias na /fall/ pasta com uma máscara de data de exclusão, como a seguir:
exclude-days 90 https://www.mydomain.com/archive/fall/

Você pode incluir seletivamente somente /archive/fall/index.html (independentemente da idade - qualquer arquivo com 0 dias ou mais corresponde) como parte do índice com a seguinte máscara de data:
include-days 0 https://www.mydomain.com/archive/fall/index.html

Para que os dois exemplos de máscara acima funcionem conforme desejado, é necessário lista a máscara de inclusão primeiro, como a seguir:
include-days 0 https://www.mydomain.com/archive/fall/index.html 
exclude-days 90 https://www.mydomain.com/archive/fall/

Como o robô de pesquisa segue as direções na ordem em que são especificados, o robô de pesquisa primeiro inclui /archive/fall/index.html e exclui o restante dos arquivos na /fall pasta.
Se as instruções forem especificadas do modo contrário, como a seguir:
exclude-days 90 https://www.mydomain.com/archive/fall/ 
include-days 0 https://www.mydomain.com/archive/fall/index.html 

Em seguida, não /archive/fall/index.html é incluído, mesmo que a máscara especifique que deve ser. Uma máscara de data que aparece primeiro sempre tem precedência sobre uma máscara de data que pode aparecer posteriormente nas configurações de máscara. Além disso, se o robô de pesquisa encontrar uma página que corresponda a uma máscara de data de inclusão e uma máscara de data de exclusão, a máscara listada primeiro sempre terá prioridade.

Sobre o uso de palavras-chave com máscaras de data

Você pode qualificar cada máscara de inclusão com uma ou mais palavras-chave separadas por espaço, que afetam como as páginas correspondentes são indexadas.
Uma vírgula não é válida como separador entre a máscara e a palavra-chave; você só pode usar espaços.
Palavra-chave
Descrição
noindex
Se você não quiser indexar o texto nas páginas que estão datadas na data especificada pela máscara de inclusão ou antes dela, adicione noindex após a máscara de data de inclusão, como no seguinte:
include-days&nbsp;10&nbsp;*.swf&nbsp;noindex
Certifique-se de separar a palavra-chave da máscara com um espaço.
O exemplo acima especifica que o robô de pesquisa segue todos os links de arquivos com a extensão ".swf" com 10 dias de idade ou mais. No entanto, desativa a indexação de todo o texto contido nesses arquivos.
Talvez você queira verificar se o texto dos arquivos mais antigos não está indexado, mas segue todos os links desses arquivos. Nesses casos, use uma máscara de data de inclusão com a palavra-chave "noindex" em vez de usar uma máscara de data de exclusão.
nofollow
Se você quiser indexar o texto nas páginas que estão datadas na data especificada pela máscara de inclusão ou antes dela, mas não quiser seguir os links da página correspondente, adicione nofollow após a máscara de data de inclusão, como no seguinte:
include-days&nbsp;8&nbsp;https://www.mydomain.com/photos&nbsp;nofollow
Certifique-se de separar a palavra-chave da máscara com um espaço.
A configuração nofollow palavra-chave equivale a uma meta tag de robô com content="nofollow" entre <head>...</head> tag de páginas correspondentes.
data do servidor
Usado para incluir e excluir máscaras.
O robô de pesquisa geralmente baixa e analisa cada arquivo antes de verificar as máscaras de data. Esse comportamento ocorre porque alguns tipos de arquivo podem especificar uma data dentro do próprio arquivo. Por exemplo, um documento HTML pode incluir tags meta que definem a data do arquivo.
Se você vai excluir muitos arquivos com base na data deles e não quiser colocar uma carga desnecessária nos servidores, você pode usar data do servidor após o URL na máscara de data.
Esta palavra-chave instrui o robô de pesquisa a confiar na data do arquivo que é retornado pelo servidor em vez de analisar cada arquivo. Por exemplo, a máscara de data de exclusão a seguir ignora as páginas que correspondem ao URL se os documentos tiverem 90 dias ou mais, de acordo com a data retornada pelo servidor nos cabeçalhos HTTP:
exclude-days&nbsp;90&nbsp;https://www.mydomain.com/docs/archive&nbsp;server-date
Se a data retornada pelo servidor tiver 90 dias ou mais, data do servidor especifica que os documentos excluídos não serão baixados do servidor. O resultado significa um tempo de indexação mais rápido para seus documentos e uma carga reduzida colocada em seus servidores. Se o status data do servidor não for especificado, o robô de pesquisa ignorará a data retornada pelo servidor nos cabeçalhos HTTP. Em vez disso, cada arquivo é baixado e verificado para ver se a data é especificada. Se nenhuma data for especificada no arquivo, o robô de pesquisa usará a data retornada pelo servidor.
Não deve usar data do servidor se seus arquivos contiverem comandos que substituam a data do servidor.
regexp
Use para incluir e excluir máscaras.
Qualquer máscara de data precedida por regexp é tratada como uma expressão regular.
Se o robô de pesquisa encontrar arquivos que correspondem a uma máscara de data de expressão regular excluída, ele não indexará esses arquivos.
Se o robô de pesquisa encontrar arquivos que correspondem a uma máscara de data de expressão regular de inclusão, ele indexará esses documentos.
Por exemplo, suponha que você tenha a seguinte máscara de data:
exclude-days&nbsp;180&nbsp;regexp&nbsp;.*archive.*
A máscara diz ao robô de pesquisa para excluir arquivos correspondentes com 180 dias ou mais. Ou seja, arquivos que contêm a palavra "arquivar" em seu URL.

Adicionar máscaras de data para indexar ou não partes do seu site

Você pode usar máscaras de data para incluir ou excluir arquivos dos resultados de pesquisa do cliente com base na idade dos arquivos.
Use os campos Test Date e Test URL para testar se um arquivo está ou não incluído depois de indexar.
Certifique-se de recriar o índice do site para que os resultados das máscaras de URL fiquem visíveis aos clientes.
Para adicionar máscaras de data para indexar ou não partes do site
  1. No menu do produto, clique em Settings > Crawling > Date Masks .
  2. (Opcional) Na Date Masks página, no Test Date campo, digite uma data formatada como AAAA-MM-DD (por exemplo, 2011-07-25 ); no Test URL campo, insira uma máscara de URL do seu site e clique em Test .
  3. No Date Masks campo, insira um endereço de máscara de data por linha.
  4. Clique em Save Changes .
  5. (Opcional) Execute um dos procedimentos a seguir:

Sobre senhas

Para acessar partes do seu site protegidas com a Autenticação básica HTTP, você pode adicionar uma ou mais senhas.
Antes que os efeitos das configurações de Senha fiquem visíveis para os clientes, é necessário recriar o índice do site.
Na Passwords página, digite cada senha em uma única linha. A senha consiste em um URL ou realm, um nome de usuário e uma senha, como no exemplo a seguir:
https://www.mydomain.com/ myname mypassword

Em vez de usar um caminho de URL, como acima, você também pode especificar um realm.
Para determinar o realm correto a ser usado, abra uma página da Web protegida por senha com um navegador e observe a caixa de diálogo "Digitar senha de rede".
O nome do território, neste caso, é "My Site Realm".
Usando o nome do realm acima, sua senha pode ser semelhante ao seguinte:
My Site Realm myusername mypassword

Se o site tiver vários domínios, você poderá criar várias senhas inserindo um nome de usuário e senha para cada domínio em uma linha separada, como no exemplo a seguir:
Realm1 name1 password1 
Realm2 name2 password2 
Realm3 name3 password3

Você pode combinar senhas que contêm URLs ou realms para que sua lista de senha tenha a seguinte aparência:
Realm1 name1 password1 
https://www.mysite.com/path1/path2 name2 password2 
Realm3 name3 password3 
Realm4 name4 password4 
https://www.mysite.com/path1/path5 name5 password5 
https://www.mysite.com/path6 name6 password6

Na lista acima, a primeira senha é usada que contém um realm ou URL que corresponde à solicitação de autenticação do servidor. Mesmo que o arquivo em https://www.mysite.com/path1/path2/index.html esteja em Realm3 , por exemplo, name2 e password2 seja usado porque a senha definida com o URL está listada acima da definida com o realm.

Adicionar senhas para acessar áreas de seu site que exigem autenticação

Você pode usar Senhas para acessar áreas protegidas por senha do seu site para fins de rastreamento e indexação.
Antes que os efeitos de sua senha sejam adições visíveis aos clientes, recrie o índice do site
Para adicionar senhas para acessar áreas de seu site que exigem autenticação
  1. No menu do produto, clique em Settings > Crawling > Passwords .
  2. Na Passwords página, no Passwords campo, insira um realm ou URL e o nome de usuário e senha associados, separados por um espaço.
    Exemplo de uma senha de realm e uma senha de URL em linhas separadas:
    Realm1 name1 password1 
    https://www.mysite.com/path1/path2 name2 password2
    
    
    Adicione apenas uma senha por linha.
  3. Clique em Save Changes .
  4. (Opcional) Execute um dos procedimentos a seguir:

Sobre tipos de conteúdo

Você pode usar Content Types para selecionar os tipos de arquivos que deseja rastrear e indexar para esta conta.
Os tipos de conteúdo que você pode escolher rastrear e indexar incluem documentos PDF, documentos de texto, filmes Adobe Flash, arquivos de aplicativos do Microsoft Office como Word, Excel e Powerpoint e texto em arquivos MP3. O texto encontrado nos tipos de conteúdo selecionados é pesquisado junto com todo o outro texto do site.
Antes que os efeitos das configurações de Tipos de conteúdo fiquem visíveis para os clientes, é necessário recriar o índice do site.

Sobre a indexação de arquivos de música MP3

Se você selecionar a opção Text in MP3 Music Files na Content Types página, um arquivo MP3 será rastreado e indexado de uma das duas maneiras. A primeira e mais comum é a partir de uma tag href de âncora em um arquivo HTML, como a seguir:
<a href="MP3-file-URL"></a>

A segunda maneira é digitar o URL do arquivo MP3 como um ponto de entrada de URL.
Consulte Sobre pontos de entrada de URL.
Um arquivo MP3 é reconhecido pelo tipo MIME "audio/mpeg".
Esteja ciente de que os tamanhos de arquivos de música MP3 podem ser bastante grandes, mesmo que geralmente contenham apenas uma pequena quantidade de texto. Por exemplo, arquivos MP3 podem armazenar opcionalmente itens como nome do álbum, nome do artista, título da música, gênero da música, ano de lançamento e um comentário. Estas informações são armazenadas no final do ficheiro no que é chamado TAG. Os arquivos MP3 que contêm informações TAG são indexados da seguinte maneira:
  • O título da música é tratado como o título de uma página HTML.
  • O comentário é tratado como uma descrição definida para uma página HTML.
  • O gênero é tratado como uma palavra-chave definida para uma página HTML.
  • O nome do artista, o nome do álbum e o ano de lançamento são tratados como o corpo de uma página HTML.
Observe que cada arquivo MP3 rastreado e indexado em seu site conta como uma página.
Se seu site contém muitos arquivos MP3 grandes, você pode exceder o limite de bytes de indexação para sua conta. Se isso acontecer, você poderá desmarcar Text in MP3 Music Files na Content Types página para impedir a indexação de todos os arquivos MP3 em seu site.
Se você quiser apenas impedir a indexação de determinados arquivos MP3 em seu site, execute um dos procedimentos a seguir:
  • Coloque as tags de âncora que se vinculam aos arquivos MP3 com <nofollow> e </nofollow> tags. O robô de pesquisa não segue os links entre essas tags.
  • Adicione os URLs dos arquivos MP3 como máscaras de exclusão.
    Consulte Sobre máscaras de URL.

Selecionar tipos de conteúdo para rastrear e indexar

Você pode usar Content Types para selecionar os tipos de arquivos que deseja rastrear e indexar para esta conta.
Os tipos de conteúdo que você pode escolher rastrear e indexar incluem documentos PDF, documentos de texto, filmes Adobe Flash, arquivos de aplicativos do Microsoft Office como Word, Excel e Powerpoint e texto em arquivos MP3. O texto encontrado nos tipos de conteúdo selecionados é pesquisado junto com todo o outro texto do site.
Antes que os efeitos das configurações de Tipos de conteúdo fiquem visíveis para os clientes, é necessário recriar o índice do site.
Para rastrear e indexar arquivos MP3 chineses, japoneses ou coreanos, conclua as etapas abaixo. Em seguida, em Settings > Metadata > Injections , especifique o conjunto de caracteres usado para codificar os arquivos MP3.
Para selecionar tipos de conteúdo para rastrear e indexar
  1. No menu do produto, clique em Settings > Crawling > Content Types .
  2. Na Content Types página, verifique os tipos de arquivos que você deseja rastrear e indexar em seu site.
  3. Clique em Save Changes .
  4. (Opcional) Execute um dos procedimentos a seguir:

Sobre conexões

Você pode usar o Connections para adicionar até dez conexões HTTP que o robô de pesquisa usa para indexar seu site.
Aumentar o número de conexões pode reduzir significativamente a quantidade de tempo que leva para concluir um rastreamento e um índice. No entanto, esteja ciente de que cada conexão adicional aumenta a carga no servidor.

Adicionar conexões para aumentar a velocidade de indexação

Você pode reduzir o tempo necessário para indexar seu site usando o Connections para aumentar o número de conexões HTTP simultâneas que o rastreador usa. Você pode adicionar até dez conexões.
Esteja ciente de que cada conexão adicional aumenta a carga colocada no servidor.
Para adicionar conexões para aumentar a velocidade de indexação
  1. No menu do produto, clique em Settings > Crawling > Connections .
  2. Na Parallel Indexing Connections página, no Number of Connections campo, digite o número de conexões (1-10) que você deseja adicionar.
  3. Clique em Save Changes .
  4. (Opcional) Execute um dos procedimentos a seguir:

Sobre o envio de formulário

Você pode usar o envio de formulário para ajudá-lo a reconhecer e processar formulários em seu site.
Durante o rastreamento e a indexação do site, cada formulário encontrado é comparado às definições de formulário adicionadas. Se um formulário corresponder a uma definição de formulário, ele será enviado para indexação. Se um formulário corresponder a mais de uma definição, ele será enviado uma vez para cada definição correspondente.

Adicionar definições de formulário para indexar formulários em seu site

Você pode usar Form Submission para ajudar a processar formulários reconhecidos em seu site para fins de indexação.
Certifique-se de recriar o índice do site para que os resultados das alterações fiquem visíveis aos clientes.
Para adicionar definições de formulário para indexar formulários em seu site
  1. No menu do produto, clique em Settings > Crawling > Form Submission .
  2. Na Form Submission página, clique em Add New Form .
  3. Na Add Form Definition página, defina as opções Form Recognition e Form Submission .
    As cinco opções na seção Form Recognition da Form Definition página são usadas para identificar formulários nas páginas da Web que podem ser processados.
    As três opções na Form Submission seção são usadas para especificar os parâmetros e valores enviados com um formulário para o servidor da Web.
    Insira um parâmetro de reconhecimento ou submissão por linha. Cada parâmetro deve incluir um nome e um valor.
    Opção
    Descrição
    Reconhecimento de formulário
    Máscara de URL da página
    Identifique a página da Web ou as páginas que contêm o formulário. Para identificar um formulário que aparece em uma única página, insira o URL dessa página como no exemplo a seguir:
    https://www.mydomain.com/login.html
    Para identificar formulários que aparecem em várias páginas, especifique uma máscara de URL que use curingas para descrever as páginas. Para identificar formulários encontrados em qualquer página do ASP em https://www.mydomain.com/register/ , por exemplo, especifique o seguinte:
    https://www.mydomain.com/register/*.asp&nbsp;
    Também é possível usar uma expressão regular para identificar várias páginas. Especifique apenas regexp palavra-chave antes da máscara de URL, como no exemplo a seguir:
    regexp&nbsp;^https://www\.mydomain\.com/.*/login\.html$
    Máscara de URL de ação
    Identifica o atributo action da variável <form> tag.
    Como a máscara de URL da página, a máscara de URL de ação pode assumir a forma de um único URL, um URL com curingas ou uma expressão regular.
    A máscara de URL pode ser qualquer uma das seguintes:
    • Um caminho completo, como no seguinte: https://www.mydomain.com/products.html
    • Um caminho parcial, como no seguinte: https://www.mydomain.com/products
    • Um URL que usa curingas como no seguinte: https://www.mydomain.com/*.html
    • Uma expressão regular como a seguinte: regexp&nbsp^https://www\.mydomain\.com/.*/login\.html$
    Se você não quiser indexar o texto nas páginas identificadas por uma máscara de URL ou por uma máscara de URL de ação, ou se não quiser que os links sejam seguidos nessas páginas, use a variável noindex e nofollow palavras-chave. É possível adicionar essas palavras-chave às suas máscaras usando máscaras de URL ou pontos de entrada.
    Máscara de nome do formulário
    Identifica formulários se a variável <form> as tags em suas páginas da Web contêm um atributo de nome.
    Você pode usar um nome simples ( login_form ), um nome com um caractere curinga ( formulário* ), ou uma expressão regular ( regexp ^.*autorizar.*$ ).
    Geralmente, esse campo pode ser deixado em branco, pois os formulários normalmente não têm um atributo name.
    Máscara de ID de formulário
    Identifica formulários se a variável <form> as tags em suas páginas da Web contêm um atributo de id.
    Você pode usar um nome simples ( login_form ), um nome com um caractere curinga ( formulário* ), ou uma expressão regular ( regexp ^.*autorizar.*$ ).
    Geralmente, esse campo pode ser deixado em branco, pois os formulários normalmente não têm um atributo name.
    Parâmetros
    Identifique formulários que contêm ou não contêm um parâmetro nomeado ou um parâmetro nomeado com um valor específico.
    Por exemplo, para identificar um formulário que contém um parâmetro de email predefinido para rick_brough@mydomain.com, um parâmetro de senha, mas não um parâmetro de nome, você deve especificar as seguintes configurações de parâmetro, uma por linha:
    email=rick_brough@mydomain.com password not first-name
    Envio de formulário
    Substituir URL de ação
    Especifique quando o público alvo do envio do formulário é diferente do especificado no atributo action do formulário.
    Por exemplo, você pode usar essa opção quando o formulário for enviado por meio de uma função JavaScript que constrói um valor de URL diferente do encontrado no formulário.
    Método de substituição
    Especifique quando o público alvo do envio do formulário é diferente do que é usado no atributo action do formulário e quando o JavaScript enviado alterou o método.
    Os valores padrão para todos os parâmetros de formulário ( <input> tags, incluindo campos ocultos), o padrão <opção> de um <selecionar> e o texto padrão entre <textarea>...</textarea> tags) são lidas da página da Web. No entanto, qualquer parâmetro listado na seção Submissão de formulário , no campo Parâmetros , é substituído pelos padrões do formulário.
    Parâmetros
    É possível prefixar parâmetros de envio de formulário com a variável não palavra-chave.
    Ao prefixar um parâmetro com não , não é apresentado como parte da apresentação do formulário. Esse comportamento é útil para caixas de seleção que devem ser enviadas desmarcadas.
    Por exemplo, suponha que você deseja enviar os seguintes parâmetros:
    • O parâmetro de email com o valor nobody@mydomain.com
    • O parâmetro password com o valor teste
    • O parâmetro mycheckbox como desmarcado.
    • Todos os outros <form> parâmetros como seus valores padrão
    Seu parâmetro de envio de formulário seria semelhante ao seguinte:
    email=nobody@mydomain.com password=tryme not mycheckbox
    O atributo de método do <form> na página da Web é usada para decidir se os dados são enviados para o servidor usando o método GET ou o método POST.
    Se a <form> não contém um atributo de método, o formulário é submetido usando o método GET.
  4. Clique em Add .
  5. (Opcional) Execute um dos procedimentos a seguir:

Editar uma definição de formulário

É possível editar uma definição de formulário existente se um formulário do seu site tiver sido alterado ou se for necessário alterar a definição.
Esteja ciente de que não há nenhum History recurso na Form Submission página para reverter quaisquer alterações feitas em uma definição de formulário.
Certifique-se de recriar o índice do site para que os resultados das alterações fiquem visíveis aos clientes.
Para editar uma definição de formulário
  1. No menu do produto, clique em Settings > Crawling > Form Submission .
  2. Na Form Submission página, clique Edit à direita de uma definição de formulário que deseja atualizar.
  3. Na Edit Form Definition página, defina as opções Form Recognition e Form Submission .
  4. Clique em Save Changes .
  5. (Opcional) Execute um dos procedimentos a seguir:

Excluindo uma definição de formulário

É possível excluir uma definição de formulário existente se o formulário não existir mais em seu site ou se você não quiser mais processar e indexar um formulário específico.
Esteja ciente de que não há nenhum History recurso na Form Submission página para reverter quaisquer alterações feitas em uma definição de formulário.
Certifique-se de recriar o índice do site para que os resultados das alterações fiquem visíveis aos clientes.
Para excluir uma definição de formulário
  1. No menu do produto, clique em Settings > Crawling > Form Submission .
  2. Na Form Submission página, clique Delete à direita de uma definição de formulário que deseja remover.
    Certifique-se de escolher a definição de formulário correta a ser excluída. Não há caixa de diálogo de confirmação de exclusão ao clicar Delete na próxima etapa.
  3. Na Delete Form Definition página, clique em Delete .
  4. (Opcional) Execute um dos procedimentos a seguir:

Sobre o Conector de índice

Use Index Connector para definir fontes de entrada adicionais para indexar páginas XML ou qualquer tipo de feed.
Você pode usar uma fonte de entrada de feed de dados para acessar o conteúdo armazenado em um formulário que é diferente do que normalmente é descoberto em um site usando um dos métodos de rastreamento disponíveis. Cada documento rastreado e indexado corresponde diretamente a uma página de conteúdo do site. No entanto, um feed de dados provém de um documento XML ou de um arquivo de texto delimitado por vírgula ou por tabulação e contém as informações de conteúdo a serem indexadas.
Uma fonte de dados XML consiste em estrofes XML, ou registros, que contêm informações que correspondem a documentos individuais. Esses documentos individuais são adicionados ao índice. Um feed de dados de texto contém registros separados delimitados por nova linha que correspondem a documentos individuais. Esses documentos individuais também são adicionados ao índice. Em ambos os casos, uma configuração de conector de índice descreve como interpretar o feed. Cada configuração descreve onde o arquivo reside e como os servidores o acessam. A configuração também descreve as informações de "mapeamento". Ou seja, como os itens de cada registro são usados para preencher os campos de metadados no índice resultante.
Depois de adicionar uma definição de Conector de índice à Staged Index Connector Definitions página, é possível alterar qualquer configuração, exceto os valores Nome ou Tipo.
A Index Connector página mostra as seguintes informações:
  • O nome dos conectores de índice definidos que você configurou e adicionou.
  • Um dos seguintes tipos de fonte de dados para cada conector adicionado:
    • Texto - Arquivos simples "simples", delimitados por vírgulas, delimitados por tabulação ou outros formatos delimitados consistentemente.
    • Feed - feeds XML.
    • XML - Coleções de documentos XML.
  • Se o conector está ativado ou não para a próxima pesquisa e indexação concluída.
  • O endereço da fonte de dados.

Como o processo de indexação funciona para configurações de Texto e Feed no Conector de índice

Etapa
Processo
Descrição
1
Baixe a fonte de dados.
Para configurações de Texto e Feed, é um download de arquivo simples.
2
Analise a fonte de dados baixada em pseudo-documentos individuais.
Para Texto , cada linha de texto delimitada por nova linha corresponde a um documento individual e é analisada usando o delimitador especificado, como uma vírgula ou tabulação.
Para o Feed , os dados de cada documento são extraídos usando um padrão de expressão regular no seguinte formulário:
<${Itemtag}>(.*?)</${Itemtag}>
Usando o Mapa na página Adição do Conector de índice, crie uma cópia em cache dos dados e crie uma lista de links para o crawler. Os dados são armazenados em um cache local e são preenchidos com os campos configurados.
Os dados analisados são gravados no cache local.
Esse cache é lido posteriormente para criar os documentos HTML simples de que o crawler precisa. Por exemplo,
<html><head> <title>{title}</title> <meta name="{field}" content="{data}" /> ... </head><body> {body} </body></html>
O elemento <title> só é gerado quando existe um mapeamento para o campo de metadados Title. Da mesma forma, o elemento <body> só é gerado quando existe um mapeamento para o campo de metadados do Corpo.
Importante : Não há suporte para a atribuição de valores à tag meta de URL predefinida.
Para todos os outros mapeamentos, as tags <meta> são geradas para cada campo que tem dados encontrados no documento original.
Os campos de cada documento são adicionados ao cache. Para cada documento gravado no cache, um link também é gerado como nos seguintes exemplos:
<a href="index:Adobe?key=<primary key field>\" /> <a href="index:Adobe?key=<primary key field>\" /> ....
O mapeamento da configuração deve ter um campo identificado como Chave primária. Esse mapeamento forma a chave usada quando os dados são obtidos do cache.
O rastreador reconhece o índice de URL: prefixo do esquema, que pode então acessar os dados armazenados em cache localmente.
3
Rastrear o conjunto de documentos em cache.
O índice: os links são adicionados à lista pendente do rastreador e são processados na sequência de rastreamento normal.
4
Processar cada documento.
O valor principal de cada link corresponde a uma entrada no cache, portanto, rastrear cada link resulta na busca dos dados do documento do cache. Em seguida, é "montado" em uma imagem HTML que é processada e adicionada ao índice.

Como o processo de indexação funciona para configurações XML no Conector de índice

O processo de indexação para a configuração XML é semelhante ao processo para configurações de Texto e Feed com as seguintes pequenas alterações e exceções.
Como os documentos para rastreamentos XML já estão separados em arquivos individuais, as etapas 1 e 2 na tabela acima não se aplicam diretamente. Se você especificar um URL nos campos Host Address e File Path da Index Connector Add página, ele será baixado e processado como um documento HTML normal. A expectativa é que o documento de download contenha uma coleção de <a href="{url}"... links, cada um dos quais aponta para um documento XML processado. Esses links são convertidos no seguinte formulário:
<a href="index:<ic_config_name>?url="{url}">

Por exemplo, se a configuração da Adobe retornou os seguintes links:
<a href="https://www.adobe.com/somepath/doc1.xml">doc 1</a> 
<a href="https://www.adobe.com/otherpath/doc2.xml">doc 2</a>

Na tabela acima, a etapa 3 não se aplica e a etapa 4 é concluída no momento da pesquisa e indexação.
Como alternativa, você pode combinar seus documentos XML com outros documentos que foram descobertos naturalmente pelo processo de rastreamento. Nesses casos, você pode usar regras de regravação ( Settings > Rewrite Rules > Crawl List Retrieve URL Rules ) para alterar os URLs dos documentos XML para direcioná-los para o Conector de índice.
Consulte Sobre Regras de URL de Recuperação de Lista de Rastreamento.
Por exemplo, suponha que você tenha a seguinte regra de regravação:
RewriteRule (^http.*[.]xml$) index:Adobe?key=$1

Essa regra converte qualquer URL que termine com .xml em um link do Conector de índice. O rastreador reconhece e regrava o esquema de index: URL. O processo de download é redirecionado pelo servidor Apache do Conector de índice no primário. Cada documento baixado é examinado usando o mesmo padrão de expressão comum usado nos Feeds. Nesse caso, no entanto, o documento HTML fabricado não é salvo no cache. Em vez disso, é entregue diretamente ao crawler para processamento de índice.

Como configurar vários conectores de índice

É possível definir várias configurações do Conector de índice para qualquer conta. As configurações são automaticamente adicionadas à lista suspensa em Settings > Crawl > URL Entrypoints , conforme mostrado na ilustração a seguir:
Selecionar uma configuração na lista suspensa adiciona o valor ao final da lista de pontos de entrada de URL.
Embora as configurações do Conector de índice desativado sejam adicionadas à lista suspensa, não é possível selecioná-las. Se você selecionar a mesma configuração do Conector de índice pela segunda vez, ela será adicionada ao final da lista e a instância anterior será excluída.
Para especificar um ponto de entrada Conector de índice para um rastreamento incremental, é possível adicionar entradas usando o seguinte formato:
index:<indexconnector_configuration_name>

O rastreador processa cada entrada adicionada se ela for encontrada na página Conectores de índice e estiver ativada.
Observação: Como cada URL de documento é construído usando o nome de configuração do Conector de índice e a chave primária do documento, certifique-se de usar o mesmo nome de configuração do Conector de índice ao executar atualizações incrementais! Isso permite Adobe Search&Promote atualizar corretamente documentos indexados anteriormente.
Consulte também Sobre pontos de entrada de URL.
O uso dos mapas de configuração ao adicionar um conector de índice
No momento em que você adiciona um Conector de índice, é possível usar opcionalmente o recurso Setup Maps para baixar uma amostra de sua fonte de dados. Os dados são examinados para determinar a adequação da indexação.
Se você escolher o tipo Conector de índice...
O recurso Configurar Mapas...
Texto
Determina o valor do delimitador tentando tabulações primeiro e, em seguida, barras verticais ( | ) e finalmente vírgulas ( , ). Se você já tiver especificado um valor delimitador antes de clicar em Configurar Mapas , esse valor será usado.
O esquema de melhor ajuste resulta no preenchimento dos campos de Mapa com suposições nos valores apropriados de Tag e Campo. Além disso, uma amostra dos dados analisados é exibida. Certifique-se de selecionar Cabeçalhos na Primeira Linha se você sabe que o arquivo inclui uma linha de cabeçalho. A função de configuração usa essas informações para identificar melhor as entradas de mapa resultantes.
Feed
Faz o download da fonte de dados e executa uma análise XML simples.
Os identificadores XPath resultantes são exibidos nas linhas de tag da tabela Mapa e valores similares em Campos. Essas linhas identificam apenas os dados disponíveis e não geram as definições XPath mais complicadas. No entanto, ainda é útil, pois descreve os dados XML e identifica os valores de Item.
Observação: A função Setup Maps baixa a fonte XML inteira para executar sua análise. Se o arquivo for grande, essa operação poderá expirar.
Quando bem-sucedida, essa função identifica todos os itens XPath possíveis, muitos dos quais não são desejáveis para uso. Certifique-se de examinar as definições de mapa resultantes e remover as que você não precisa ou deseja.
XML
Faz o download do URL de um documento individual representativo, não da lista do link principal. Esse único documento é analisado usando o mesmo mecanismo usado com Feeds, e os resultados são exibidos.
Antes de clicar em Adicionar para salvar a configuração, certifique-se de alterar o URL de volta para o documento de lista do link principal.
Importante : O recurso Configurar Mapas pode não funcionar para grandes conjuntos de dados XML, pois seu analisador de arquivos tenta ler o arquivo inteiro na memória. Como resultado, você pode experimentar uma condição de falta de memória. No entanto, quando o mesmo documento é processado no momento da indexação, ele não é lido na memória. Em vez disso, documentos grandes são processados "em trânsito" e não são lidos inteiramente na memória primeiro.
O uso da Pré-visualização ao adicionar um Conector de índice
No momento em que você adiciona um Conector de índice, é possível usar opcionalmente o recurso Preview para validar os dados, como se estivesse salvando-os. Ele executa um teste em relação à configuração, mas sem salvar a configuração na conta. O teste acessa a fonte de dados configurada. No entanto, ele grava o cache de download em um local temporário; ele não entra em conflito com a pasta de cache principal que o crawler de indexação usa.
A Pré-visualização processa apenas um padrão de cinco documentos, conforme controlado por Acct:IndexConnector-Pré-visualização-Max-Documentos. Os documentos visualizados são exibidos no formulário de origem, à medida que são apresentados ao rastreador de indexação. A exibição é semelhante a um recurso "Fonte de Visualização" em um navegador da Web. É possível navegar pelos documentos no conjunto de pré-visualizações usando links de navegação padrão.
A Pré-visualização não suporta configurações XML porque esses documentos são processados diretamente e não são baixados para o cache.

Adicionando uma definição de Conector de índice

Cada configuração do Conector de índice define uma fonte de dados e mapeamentos para relacionar os itens de dados definidos para essa fonte aos campos de metadados no índice.
Antes que os efeitos da definição nova e ativada fiquem visíveis para os clientes, recrie o índice do site.
Para adicionar uma definição de Conector de índice
  1. No menu do produto, clique em Settings > Crawling > Index Connector .
  2. Na Stage Index Connector Definitions página, clique em Add New Index Connector .
  3. Na Index Connector Add página, defina as opções de conector desejadas. As opções disponíveis dependem do Type que você selecionou.
    Opção
    Descrição
    Nome
    O nome exclusivo da configuração do Conector de índice. É possível usar caracteres alfanuméricos. Os caracteres "_" e "-" também são permitidos.
    Tipo
    A fonte de seus dados. O tipo de fonte de dados selecionado afeta as opções resultantes que estão disponíveis na página Adicionar conector de índice . Você pode escolher entre as seguintes opções:
    • Texto
      Arquivos de texto simples, delimitados por vírgulas, delimitados por tabulação ou outros formatos consistentemente delimitados. Cada linha de texto delimitada por nova linha corresponde a um documento individual e é analisada usando o delimitador especificado.
      É possível mapear cada valor, ou coluna, para um campo de metadados, referenciado pelo número da coluna, começando em 1 (um).
    • Feed
      Faz o download de um documento XML primário que contém várias "linhas" de informações.
    • XML
      Faz o download de um documento XML primário que contém links ( <a> ) a documentos XML individuais.
    Tipo de fonte de dados: Texto
    Ativado
    Ativa a configuração "on" para rastrear e indexar. Ou, você pode desativar a configuração para evitar o rastreamento e a indexação.
    Observação : As configurações do Conector de índice desativado serão ignoradas se forem encontradas em uma lista de ponto de entrada.
    Endereço do host
    Especifica o endereço do host do servidor no qual os dados estão localizados.
    Se desejar, você pode especificar um caminho URI completo (Uniform Resource Identifier) para o documento da fonte de dados, como nos seguintes exemplos:
    https://www.somewhere.com/some_path/some_file.xml
    ou
    ftp://user:password@ftpserver.somewhere.com/some_path/some_file.xml
    O URI é dividido nas entradas apropriadas para os campos Endereço do host, Caminho do arquivo, Protocolo e, opcionalmente, Nome do usuário e Senha.
    Especifica o endereço IP ou URL do sistema host em que o arquivo de fonte de dados é encontrado.
    Caminho do arquivo
    Especifica o caminho para o arquivo de texto simples, delimitado por vírgulas, delimitado por tabulação ou outro arquivo de formato delimitado consistentemente.
    O caminho é relativo à raiz do endereço do host.
    Caminho do arquivo incremental
    Especifica o caminho para o arquivo de texto simples, delimitado por vírgulas, delimitado por tabulação ou outro arquivo de formato delimitado consistentemente.
    O caminho é relativo à raiz do endereço do host.
    Este arquivo, se especificado, é baixado e processado durante operações de Índice Incremental. Se nenhum arquivo for especificado, o arquivo listado em Caminho do arquivo será usado.
    Caminho do arquivo vertical
    Especifica o caminho para o arquivo de texto simples, delimitado por vírgulas, delimitado por tabulação ou outro arquivo de formato delimitado consistentemente a ser usado durante uma Atualização Vertical.
    O caminho é relativo à raiz do endereço do host.
    Este arquivo, se especificado, é baixado e processado durante as operações de Atualização vertical.
    Observação : Este recurso não está ativado por padrão. Entre em contato com o suporte técnico para ativar o recurso para uso.
    Exclui o caminho do arquivo
    Especifica o caminho para o arquivo de texto simples, contendo um único valor de identificador de documento por linha.
    O caminho é relativo à raiz do endereço do host.
    Este arquivo, se especificado, é baixado e processado durante operações de Índice Incremental. Os valores encontrados neste arquivo são usados para construir solicitações "delete" para remover documentos indexados anteriormente. Os valores neste arquivo devem corresponder aos valores encontrados nos arquivos Caminho de arquivo completo ou incremental, na coluna identificada como Chave primária .
    Observação : Este recurso não está ativado por padrão. Entre em contato com o suporte técnico para ativar o recurso para uso.
    Protocolo
    Especifica o protocolo usado para acessar o arquivo. Você pode escolher entre as seguintes opções:
    • HTTP
      Se necessário, você pode inserir as credenciais de autenticação adequadas para acessar o servidor HTTP.
    • HTTPS
      Se necessário, você pode inserir as credenciais de autenticação adequadas para acessar o servidor HTTPS.
    • FTP
      Você deve inserir as credenciais de autenticação adequadas para acessar o servidor FTP.
    • SFTP
      Você deve inserir as credenciais de autenticação adequadas para acessar o servidor SFTP.
    • Arquivo
    Tempo limite
    Especifica o tempo limite, em segundos, para conexões FTP, SFTP, HTTP ou HTTPS. Esse valor deve estar entre 30 e 300.
    Tentativas
    Especifica o número máximo de tentativas para conexões FTP, SFTP, HTTP ou HTTPS com falha. Esse valor deve estar entre 0 e 10.
    Um valor zero (0) impedirá tentativas de repetição.
    Codificação
    Especifica o sistema de codificação de caracteres usado no arquivo de fonte de dados especificado.
    Delimitador
    Especifica o caractere que você deseja usar para delinear cada campo no arquivo de fonte de dados especificado.
    O caractere vírgula ( , ) é um exemplo de um delimitador. A vírgula atua como um delimitador de campo que ajuda a separar campos de dados no arquivo de fonte de dados especificado.
    Selecione Guia? para usar o caractere de tabulação horizontal como delimitador.
    Cabeçalhos na primeira linha
    Indica que a primeira linha do arquivo de fonte de dados contém apenas informações de cabeçalho, não dados.
    Número mínimo de documentos para indexação
    Se definido como um valor positivo, isso especifica o número mínimo de registros esperado no arquivo baixado. Se forem recebidos menos registros, a operação de índice será abortada.
    Observação : Este recurso não está ativado por padrão. Entre em contato com o suporte técnico para ativar o recurso para uso.
    Observação : Este recurso é usado somente durante operações de Índice completo.
    Mapa
    Especifica mapeamentos de coluna para metadados, usando números de coluna.
    • Coluna
      Especifica um número de coluna, com a primeira coluna sendo 1 (uma). Para adicionar novas linhas de mapa para cada coluna, em Ação , clique em + .
      Não é necessário referenciar cada coluna na fonte de dados. Em vez disso, você pode optar por ignorar valores.
    • Campo
      Define o valor do atributo name usado para cada tag <meta> gerada.
    • Metadados?
      Faz com que o Campo se torne uma lista suspensa da qual você pode selecionar campos de metadados definidos para a conta atual.
      O valor de Campo pode ser um campo de metadados indefinido, se desejado. Um campo de metadados não definido às vezes é útil para criar conteúdo usado pelo Filtrar script .
      Quando o Conector de índice processa documentos XML com várias ocorrências em qualquer campo de mapa, os vários valores são concatenados em um único valor no documento em cache resultante. Por padrão, esses valores são combinados usando um delimitador de vírgula. No entanto, suponha que o valor de Campo correspondente seja um campo de metadados definido. Além disso, esse campo tem o conjunto de atributos Permitir listas . Nesse caso, o valor Delimitadores de Lista do campo, que é o primeiro delimitador definido, é usado na concatenação.
    • Chave primária?
      Somente uma definição de mapa é identificada como a chave primária. Esse campo se torna a referência exclusiva que é apresentada quando esse documento é adicionado ao índice. Esse valor é usado no URL do documento no Índice.
      Os valores da Chave primária devem ser exclusivos em todos os documentos representados pela configuração do Conector de índice - todos os duplicados encontrados serão ignorados. Se os documentos de origem não contiverem um único valor exclusivo para uso como Chave primária , mas dois ou mais campos juntos puderem formar um identificador exclusivo, você poderá definir a Chave primária combinando vários valores de Coluna com uma barra vertical ("|") delimitando os valores.
    • Remover HTML?
      Quando essa opção estiver marcada, todas as tags HTML encontradas nos dados desse campo serão removidas.
    • Ação
      Permite adicionar linhas ao mapa ou remover linhas do mapa. A ordem das linhas não é importante.
    Tipo de fonte de dados: Feed
    Ativado
    Ativa a configuração "on" para rastrear e indexar. Ou, você pode desativar a configuração para evitar o rastreamento e a indexação.
    Observação : As configurações do Conector de índice desativado serão ignoradas se forem encontradas em uma lista de ponto de entrada.
    Endereço do host
    Especifica o endereço IP ou URL do sistema host em que o arquivo de fonte de dados é encontrado.
    Caminho do arquivo
    Especifica o caminho para o documento XML primário que contém várias "linhas" de informações.
    O caminho é relativo à raiz do endereço do host.
    Caminho do arquivo incremental
    Especifica o caminho para o documento XML incremental que contém várias "linhas" de informações.
    O caminho é relativo à raiz do endereço do host.
    Este arquivo, se especificado, é baixado e processado durante operações de Índice Incremental. Se nenhum arquivo for especificado, o arquivo listado em Caminho do arquivo será usado.
    Caminho do arquivo vertical
    Especifica o caminho para o documento XML que contém várias "linhas" esparsas de informações a serem usadas durante uma atualização vertical.
    O caminho é relativo à raiz do endereço do host.
    Este arquivo, se especificado, é baixado e processado durante as operações de Atualização vertical.
    Observação : Este recurso não está ativado por padrão. Entre em contato com o suporte técnico para ativar o recurso para uso.
    Exclui o caminho do arquivo
    Especifica o caminho para o arquivo de texto simples, contendo um único valor de identificador de documento por linha.
    O caminho é relativo à raiz do endereço do host.
    Este arquivo, se especificado, é baixado e processado durante operações de Índice Incremental. Os valores encontrados neste arquivo são usados para construir solicitações "delete" para remover documentos indexados anteriormente. Os valores neste arquivo devem corresponder aos valores encontrados nos arquivos Caminho de arquivo completo ou incremental, na coluna identificada como Chave primária .
    Observação : Este recurso não está ativado por padrão. Entre em contato com o suporte técnico para ativar o recurso para uso.
    Protocolo
    Especifica o protocolo usado para acessar o arquivo. Você pode escolher entre as seguintes opções:
    • HTTP
      Se necessário, você pode inserir as credenciais de autenticação adequadas para acessar o servidor HTTP.
    • HTTPS
      Se necessário, você pode inserir as credenciais de autenticação adequadas para acessar o servidor HTTPS.
    • FTP
      Você deve inserir as credenciais de autenticação adequadas para acessar o servidor FTP.
    • SFTP
      Você deve inserir as credenciais de autenticação adequadas para acessar o servidor SFTP.
    • Arquivo
    Item
    Identifica o elemento XML que pode ser usado para identificar linhas XML individuais no arquivo de fonte de dados especificado.
    Por exemplo, no fragmento Feed a seguir de um documento XML da Adobe, o valor da tag do Item é record :
    <?xml version="1.0" encoding="utf-8"?> <!DOCTYPE gsafeed PUBLIC "-//Google//DTD GSA Feeds//EN" ""> <gsafeed>      <header>           <datasource>marketplace</datasource>           <feedtype>incremental</feedtype>      </header>      <group action="add"> <record url=https://www.adobe.com/cfusion/marketplace_gsa index.cfm?event=marketplace.home&amp;marketplaceid=1 action="add" mimetype="text/html"displayurl="https://www.adobe.com/cfusion/marketplace/index.cfm?event=marketplace.home&amp;marketplaceid=1"><metadata> <meta name="mp_mkt" content="1"/> <meta name="mp_logo" content="/images/marketplace/ dbreferenced/marketplaceicons/icn_air.png"/> <meta name="title" content="Adobe AIR Marketplace"/> <meta name="description" content="Discover new applications ..."/> </metadata> <content><![CDATA[<html><head><title>Adobe AIR Marketplace</title></head><body>Discover new applications ...</body></html>]]></cntent> </record> <record url=https://www.adobe.com/cfusion/marketplace_gsa/ index.cfm?event=marketplace.home&amp;marketplaceid=2 action="add" mimetype="text/html" displayurl="https://www.adobe.com/cfusion/ marketplace/index.cfm?event=marketplace.home&amp;marketplaceid=2"> <metadata> <meta name="mp_mkt" content="2"/> <meta name="mp_logo" content="/images/marketplace/ dbreferenced/marketplaceicons/icn_photoshop.png"/> <meta name="title" content="Adobe Photoshop Marketplace"/> <meta name="description" content="Extend your creative possibilities ..."/> </metadata> <content><![CDATA[<html><head><title>Adobe Photoshop Marketplace</title></head><body>Extend your creative possibilities ...</body></html>]]>/content> </record> ... <record> ... </record>      </group> </gsafeed>
    Número mínimo de documentos para indexação
    Se definido como um valor positivo, isso especifica o número mínimo de registros esperado no arquivo baixado. Se forem recebidos menos registros, a operação de índice será abortada.
    Observação : Este recurso não está ativado por padrão. Entre em contato com o suporte técnico para ativar o recurso para uso.
    Observação : Este recurso é usado somente durante operações de Índice completo.
    Mapa
    Permite que você especifique mapeamentos de elemento para metadados XML, usando expressões XPath.
    • Adicionar tag
      Especifica uma representação XPath dos dados XML analisados. Usando o exemplo do documento Adobe XML acima, na opção Item tag, ele pode ser mapeado usando a seguinte sintaxe:
      /record/@displayurl -> page-url /record/metadata/meta[@name='title']/@content -> title /record/metadata/meta[@name='description']/@content -> desc /record/metadata/meta[@name='description']/@content -> body
      A sintaxe acima é traduzida como a seguinte:
      • /record/@displayurl&nbsp;->&nbsp;page-url
        O atributo display url do elemento record mapeia para o campo de metadados page-url .
      • /record/metadata/meta[@name='title']/@content&nbsp;->&nbsp;title
        O atributo de conteúdo de qualquer meta elemento contido em um elemento de metadados , que está contido em um elemento de registro, cujo atributo de nome é título , mapeia para o campo de metadados .
      • /record/metadata/meta[@name='description']/@content&nbsp;->&nbsp;desc
        O atributo de conteúdo de qualquer meta elemento contido em um elemento de metadados , que está contido no elemento record , cujo atributo name é descrição , mapeia para o campo de metadados desc.
      • /record/metadata/meta[@name='description']/@content&nbsp;->&nbsp;body
        O atributo de conteúdo de qualquer meta- elemento contido em um elemento de metadados , contido no elemento record , cujo atributo name é descrição , mapeia para o campo de metadados .
      XPath é uma notação relativamente complicada. Mais informações estão disponíveis no seguinte local:
    • Campo
      Define o valor do atributo name usado para cada tag <meta> gerada.
    • Metadados?
      Faz com que o Campo se torne uma lista suspensa da qual você pode selecionar campos de metadados definidos para a conta atual.
      O valor de Campo pode ser um campo de metadados indefinido, se desejado. Um campo de metadados não definido às vezes é útil para criar conteúdo usado pelo Filtrar script .
      Quando o Conector de índice processa documentos XML com várias ocorrências em qualquer campo de mapa, os vários valores são concatenados em um único valor no documento em cache resultante. Por padrão, esses valores são combinados usando um delimitador de vírgula. No entanto, suponha que o valor de Campo correspondente seja um campo de metadados definido. Além disso, esse campo tem o conjunto de atributos Permitir listas . Nesse caso, o valor Delimitadores de Lista do campo, que é o primeiro delimitador definido, é usado na concatenação.
    • Chave primária?
      Somente uma definição de mapa é identificada como a chave primária. Esse campo se torna a referência exclusiva que é apresentada quando esse documento é adicionado ao índice. Esse valor é usado no URL do documento no Índice.
      Os valores da Chave primária devem ser exclusivos em todos os documentos representados pela configuração do Conector de índice - todos os duplicados encontrados serão ignorados. Se os documentos de origem não contiverem um único valor exclusivo para uso como Chave primária , mas dois ou mais campos juntos puderem formar um identificador exclusivo, você poderá definir a Chave primária combinando várias definições de Tag com uma barra vertical ("|") que delimita os valores.
    • Remover HTML?
      Quando essa opção estiver marcada, todas as tags HTML encontradas nos dados desse campo serão removidas.
    • Usar para Excluir?
      Usado apenas durante operações de Índice Incremental. Registros que correspondem a este padrão XPath identificam itens para exclusão. O valor da Chave Primária para cada registro é usado para construir solicitações "delete", como acontece com Excluir caminho de arquivo.
      Observação : Este recurso não está ativado por padrão. Entre em contato com o suporte técnico para ativar o recurso para uso.
    • Ação
      Permite adicionar linhas ao mapa ou remover linhas do mapa. A ordem das linhas não é importante.
    Tipo de fonte de dados: XML
    Ativado
    Ativa a configuração "on" para rastrear e indexar. Ou, você pode desativar a configuração para evitar o rastreamento e a indexação.
    Observação : As configurações do Conector de índice desativado serão ignoradas se forem encontradas em uma lista de ponto de entrada.
    Endereço do host
    Especifica o endereço URL do sistema host no qual o arquivo de fonte de dados é encontrado.
    Caminho do arquivo
    Especifica o caminho para o documento XML primário que contém links ( <a> ) a documentos XML individuais.
    O caminho é relativo à raiz do endereço do host.
    Protocolo
    Especifica o protocolo usado para acessar o arquivo. Você pode escolher entre as seguintes opções:
    • HTTP
      Se necessário, você pode inserir as credenciais de autenticação adequadas para acessar o servidor HTTP.
    • HTTPS
      Se necessário, você pode inserir as credenciais de autenticação adequadas para acessar o servidor HTTPS.
    • FTP
      Você deve inserir as credenciais de autenticação adequadas para acessar o servidor FTP.
    • SFTP
      Você deve inserir as credenciais de autenticação adequadas para acessar o servidor SFTP.
    • Arquivo
    Observação : A configuração Protocolo só é usada quando há informações especificadas nos campos Endereço do host e/ou Caminho do arquivo. documentos XML individuais são baixados usando HTTP ou HTTPS, de acordo com suas especificações de URL.
    Item
    Identifica o elemento XML que define uma "linha" no arquivo de fonte de dados especificado.
    Mapa
    Permite que você especifique mapeamentos de coluna para metadados, usando números de coluna.
    • Adicionar tag
      Especifica uma representação XPath dos dados XML analisados. Usando o exemplo do documento Adobe XML acima, sob a opção Item tag, é possível mapeá-lo usando a seguinte sintaxe:
      /record/@displayurl -> page-url /record/metadata/meta[@name='title']/@content -> title /record/metadata/meta[@name='description']/@content -> desc /record/metadata/meta[@name='description']/@content -> body
      A sintaxe acima é traduzida como a seguinte:
      • /record/@displayurl&nbsp;->&nbsp;page-url
        O atributo display url do elemento record mapeia para o campo de metadados page-url .
      • /record/metadata/meta[@name='title']/@content&nbsp;->&nbsp;title
        O atributo de conteúdo de qualquer meta elemento contido em um elemento de metadados , que está contido em um elemento de registro, cujo atributo de nome é título , mapeia para o campo de metadados .
      • /record/metadata/meta[@name='description']/@content&nbsp;->&nbsp;desc
        O atributo de conteúdo de qualquer meta elemento contido em um elemento de metadados , que está contido no elemento record , cujo atributo name é descrição , mapeia para o campo de metadados desc.
      • /record/metadata/meta[@name='description']/@content&nbsp;->&nbsp;body
        O atributo de conteúdo de qualquer meta- elemento contido em um elemento de metadados , contido no elemento record , cujo atributo name é descrição , mapeia para o campo de metadados .
      XPath é uma notação relativamente complicada. Mais informações estão disponíveis no seguinte local:
    • Campo
      Define o valor do atributo name usado para cada tag <meta> gerada.
    • Metadados?
      Faz com que o Campo se torne uma lista suspensa da qual você pode selecionar campos de metadados definidos para a conta atual.
      O valor de Campo pode ser um campo de metadados indefinido, se desejado. Um campo de metadados não definido às vezes é útil para criar conteúdo usado pelo Filtrar script .
      Quando o Conector de índice processa documentos XML com várias ocorrências em qualquer campo de mapa, os vários valores são concatenados em um único valor no documento em cache resultante. Por padrão, esses valores são combinados usando um delimitador de vírgula. No entanto, suponha que o valor de Campo correspondente seja um campo de metadados definido. Além disso, esse campo tem o conjunto de atributos Permitir listas . Nesse caso, o valor Delimitadores de Lista do campo, que é o primeiro delimitador definido, é usado na concatenação.
    • Chave primária?
      Somente uma definição de mapa é identificada como a chave primária. Esse campo se torna a referência exclusiva que é apresentada quando esse documento é adicionado ao índice. Esse valor é usado no URL do documento no Índice.
      Os valores da Chave primária devem ser exclusivos em todos os documentos representados pela configuração do Conector de índice - todos os duplicados encontrados serão ignorados. Se os documentos de origem não contiverem um único valor exclusivo para uso como Chave primária , mas dois ou mais campos juntos puderem formar um identificador exclusivo, você poderá definir a Chave primária combinando várias definições de Tag com uma barra vertical ("|") que delimita os valores.
    • Remover HTML?
      Quando essa opção estiver marcada, todas as tags HTML encontradas nos dados desse campo serão removidas.
    • Ação
      Permite adicionar linhas ao mapa ou remover linhas do mapa. A ordem das linhas não é importante.
  4. (Opcional) Clique em Setup Maps para baixar uma amostra da sua fonte de dados. Os dados são examinados para determinar a adequação da indexação. Esse recurso está disponível apenas para tipos de texto e feed.
  5. (Opcional) Clique em Preview para testar o funcionamento real da configuração. Esse recurso está disponível apenas para tipos de texto e feed.
  6. Clique Add para adicionar a configuração à Index Connector Definitions página e à lista Index Connector Configurations suspensa na URL Entrypoints página.
    Consulte Sobre pontos de entrada de URL.
  7. Na Index Connector Definitions página, clique em rebuild your staged site index .
  8. (Opcional) Na Index Connector Definitions página, execute um dos procedimentos a seguir:

Editar uma definição de Conector de índice

Você pode editar um Conector de índice existente definido por você.
Nem todas as opções estão disponíveis para alteração, como Nome do conector de índice ou Tipo na lista suspensa. Type
Para editar uma definição do Conector de índice
  1. No menu do produto, clique em Settings > Crawling > Index Connector .
  2. Na Index Connector página, sob o cabeçalho da Actions coluna, clique Edit em um nome de definição do Conector de índice cujas configurações você deseja alterar.
  3. Na Index Connector Edit página, defina as opções desejadas.
    Consulte a tabela de opções em Adicionar uma definição de Conector de índice.
  4. Clique em Save Changes .
  5. (Opcional) Na Index Connector Definitions página, clique em rebuild your staged site index .
  6. (Opcional) Na Index Connector Definitions página, execute um dos procedimentos a seguir:

Como visualizar as configurações de uma definição de Conector de índice

Você pode revisar as configurações de uma definição de conector de índice existente.
Depois que uma definição de Conector de índice é adicionada à Index Connector Definitions página, não é possível alterar a configuração Tipo. Em vez disso, você deve excluir a definição e adicionar uma nova.
Para visualização das configurações de uma definição do Conector de índice
  1. No menu do produto, clique em Settings > Crawling > Index Connector .
  2. Na Index Connector página, sob o cabeçalho da Actions coluna, clique Edit em um nome de definição do Conector de índice cujas configurações você deseja revisar ou editar.

Copiando uma definição de Conector de índice

É possível copiar uma definição existente do Conector de índice para usar como a base para um novo Conector de índice que você deseja criar.
Ao copiar uma definição de Conector de índice, a definição copiada é desativada por padrão. Para ativar ou "ativar" a definição, edite-a da Index Connector Edit página e selecione Enable .
Consulte Editando uma definição de Conector de índice.
Para copiar uma definição do Conector de índice
  1. No menu do produto, clique em Settings > Crawling > Index Connector .
  2. Na Index Connector página, sob o cabeçalho da Actions coluna, clique Copy em um nome de definição do Conector de índice cujas configurações você deseja duplicado.
  3. Na Index Connector Copy página, digite o novo nome da definição.
  4. Clique em Copy .
  5. (Opcional) Na Index Connector Definitions página, execute um dos procedimentos a seguir:

Renomeando uma definição de Conector de índice

Você pode alterar o nome de uma definição existente do Conector de índice.
Depois de renomear a definição, marque Settings > Crawling > URL Entrypoints . Certifique-se de que o nome da nova definição seja refletido na lista suspensa na URL Entrypoints página.
Para renomear uma definição de Conector de índice
  1. No menu do produto, clique em Settings > Crawling > Index Connector .
  2. Na Index Connector página, sob o cabeçalho da Actions coluna, clique Rename para o nome de definição do Conector de índice que você deseja alterar.
  3. Na Index Connector Rename página, digite o novo nome da definição no Name campo.
  4. Clique em Rename .
  5. Clique em Settings > Crawling > URL Entrypoints . Se o nome do Conector de índice anterior estiver presente na lista, remova-o e adicione a entrada renomeada recentemente.
    Consulte Adicionar vários pontos de entrada de URL que você deseja indexar . 1. (Opcional) Na Index Connector Definitions página, execute um dos procedimentos a seguir:

Excluindo uma definição de Conector de índice

É possível excluir uma definição existente do Conector de índice que não é mais necessária ou não é mais usada.
Para excluir uma definição de Conector de índice
  1. No menu do produto, clique em Settings > Crawling > Index Connector .
  2. Na Index Connector Definitions página, sob o cabeçalho da Actions coluna, clique Delete para obter o nome de definição do Conector de índice que deseja remover.
  3. Na Index Connector Delete página, clique em Delete .