Show Menu
TÓPICOS×

Sobre o Índice Incremental

Você pode usar o Índice incremental para indexar "partes" do site ao vivo ou em etapas, como uma coleção de páginas alteradas com frequência.

Usando índice incremental

Um índice incremental demora apenas segundos para ser executado e é útil em sites de grande capacidade que podem levar muitas horas para ser indexados completamente.
Quando você gera um índice incremental, as informações de status são exibidas, como hora de início, tempo decorrido e erros durante o processo de indexação. As informações sobre o status do último índice também são exibidas.
Você pode interromper ou reiniciar o processo de indexação incremental a qualquer momento.
Enquanto o novo índice incremental é criado para seu site ativo, os clientes podem continuar a pesquisar seu site usando seu último índice incremental.

Configuração de um índice incremental de um site preparado

Você pode configurar quais páginas de site deseja incluir no índice incremental especificando URLs de site e máscaras de URL.
Para configurar um índice incremental de um site preparado
  1. No menu do produto, clique em Index > Incremental Index > Configuration .
  2. Na Incremental Index Configuration página, use os vários campos para especificar quais páginas você deseja indexar.
    Campo
    Descrição
    Adicionar ou atualizar URLs
    Especifique URLs.
    O robô de pesquisa indexa somente os documentos especificados que foram alterados desde a última vez que você indexou.
    Além disso, o robô de pesquisa segue links contidos nos documentos especificados e indexa apenas os documentos que foram alterados.
    Esse campo deve conter apenas URLs de documento e não máscaras, como no exemplo a seguir:
    https://www.mydomain.com/products/new.html
    Você pode usar as seguintes palavras-chave com o URL:
    • noindex
      Se você não quiser indexar o texto na página que corresponde a um URL especificado, mas quiser seguir os links da página, adicione noindex após o URL, como no exemplo a seguir:
      https://www.mydomain.com/products/new.html noindex
      Certifique-se de separar noindex do URL com um espaço; uma vírgula não é um separador válido.
    • nofollow
      Se você quiser indexar o texto na página que corresponde ao URL especificado, mas não quiser seguir os links da página, adicione nofollow após o URL, como no exemplo a seguir:
      https://www.mydomain.com/products/new.html nofollow
      Certifique-se de separar nofollow do URL com um espaço; uma vírgula não é um separador válido.
    Localizar e atualizar máscaras de URL
    Especifique máscaras de URL simples — caminho completo, caminho parcial ou caminhos que usam curingas ou expressões regulares.
    O robô de pesquisa encontra todos os documentos correspondentes e indexa apenas os documentos que foram alterados desde a última vez que você indexou.
    Além disso, o robô de pesquisa segue links contidos nos documentos correspondentes e indexa somente as páginas que foram alteradas. Por exemplo:
    https://www.mydomain.com/products/household/*.html
    Também é possível usar expressões regulares como no seguinte exemplo:
    regexp ^https://www\.mydomain\.com/products/home/.*\.html$
    Consulte Expressões regulares.
    Você também pode usar as palavras-chave nofollow e noindex conforme descrito em Adicionar ou atualizar URLs acima.
    Incluir e excluir máscaras de URL
    Especifique máscaras simples de inclusão ou exclusão de URL: caminho completo, caminho parcial ou caminhos que usam curingas ou expressões regulares.
    O robô de pesquisa encontra e indexa ("incluir") ou ignora ("excluir") documentos com base no tipo de máscara especificado.
    Ao indexar um site, as instruções são seguidas em ordem de aparência. Por exemplo, a seguinte lista de máscaras:
    include https://www.mydomain.com/products/household/lightbulbs*.html
    excluir https://www.mydomain.com/products/
    indexa as páginas lâmpadas1.html e lâmpadas2.html . No entanto, ele não indexa nenhuma outra página listada no diretório products.
    Uma máscara de URL que aparece primeiro sempre tem precedência sobre uma que aparece posteriormente na lista. Além disso, se o robô de pesquisa encontrar um documento que corresponda a uma máscara de inclusão e uma máscara de exclusão, a máscara listada primeiro terá prioridade.
    Você também pode usar as palavras-chave nofollow e noindex conforme descrito em Adicionar ou atualizar URLs acima.
    Consulte Sobre máscaras de URL.
    Incluir e excluir máscaras de data
    Especifique máscaras simples de inclusão ou exclusão de datas: caminho completo, caminho parcial ou caminhos que usam curingas ou expressões regulares.
    O robô de pesquisa encontra e indexa ("incluir") ou ignora ("excluir") documentos com base no URL e na data dos documentos.
    Você pode usar os seguintes tipos de máscaras de data:
    • incluir dias NNN
      O robô de pesquisa indexa todos os documentos que correspondem à máscara de URL especificada e são NNN dias ou mais antigos.
      Você pode seguir a máscara de URL com uma ou mais das seguintes palavras-chave:
      • nofollow
      • noindex
      • data do servidor
      Por exemplo, a seguinte máscara inclui todos os documentos na pasta /archive/support com 0 dias ou mais:
      incluir dias 0 https://www.mydomain.com/archive/support/
    • incluir data AAAA-MM-DD
      O robô de pesquisa indexa todos os documentos que correspondem à máscara de URL especificada e são tão antigos ou mais antigos que a data AAAA-MM-DD.
      Você pode seguir a máscara de URL com uma ou mais das seguintes palavras-chave:
      • nofollow
      • noindex
      • data do servidor
      O exemplo de máscara a seguir inclui todos os documentos na pasta /archive/ com data de 25 de julho de 2011 ou antes dela:
      incluir data 2011-07-25 https://www.mydomain.com/archive/
    • dias excluídos NNN
      Desabilite a indexação de todos os documentos que correspondem à máscara de URL especificada e são NNN dias ou mais antigos.
      Como opção, você pode seguir a máscara de URL pela palavra-chave data do servidor .
      O exemplo de máscara a seguir exclui todos os arquivos PDF com 90 dias de idade ou mais do índice:
      excluir dias 90 *.pdf
    • data de exclusão AAAA-MM-DD
      Desabilite a indexação de todos os documentos que correspondem à máscara de URL especificada e são tão antigos ou mais antigos que a data AAAA-MM-DD.
      Como opção, você pode seguir a máscara de URL pela palavra-chave data do servidor .
      O exemplo de máscara a seguir exclui todos os documentos na pasta /archive/ com data de 23 de abril de 2004 ou antes dela:
      exclude-date 2004-04-23 https://www.mydomain.com/archive/
    Consulte Sobre máscaras de data.
    Excluir URLs
    Especifique URLs.
    O robô de pesquisa encontra e exclui os documentos especificados do índice de pesquisa. Se uma página especificada já estiver em seu índice de pesquisa, o robô a excluirá antes de adicionar ou atualizar quaisquer outras páginas.
    Este campo deve conter apenas URLs de documento, e não máscaras.
    Localizar e excluir máscaras de URL
    Especifique máscaras de URL simples: caminho completo, caminho parcial ou que usam curingas ou expressões regulares.
    Se a máscara de URL especificada corresponder às páginas no índice de pesquisa, o robô de pesquisa excluirá as páginas antes de adicioná-las ou atualizá-las. Por exemplo:
    https://www.mydomain.com/products/1998/household/*
    Também é possível usar expressões regulares como no seguinte exemplo:
    regexp ^https://www\.mydomain\.com/products/199[567]/.*$
    Consulte Expressões regulares.
  3. Clique em Save Changes .
  4. (Opcional) Execute um dos procedimentos a seguir:

Definir a programação de índice incremental para um site ao vivo

Você pode selecionar a frequência do Índice Incremental e o tempo base que é usado para rastrear e atualizar seu índice incremental.
A hora selecionada é local de acordo com o fuso horário configurado nas Configurações da conta.
Consulte Definição das configurações da sua conta.
Os servidores da Web normalmente ficam inativos para manutenção no meio da noite. Se o servidor estiver inativo durante um tempo de índice programado, o processo de indexação falhará. Certifique-se de selecionar uma hora do dia em que o servidor Web está disponível.
A programação de índice se aplica somente ao seu índice ativo; não é possível agendar índices preparados.
Para definir a programação de índice incremental para um site ativo
  1. No menu do produto, clique em Index > Incremental Index > Live Schedule .
  2. Na página Na Incremental Index Schedule , na lista Incrementally Index suspensa, selecione a frequência de indexação em horas ou minutos.
  3. Na lista Base Time suspensa, selecione a hora de início em que deseja gerar novamente um novo índice incremental.
  4. Clique em Save Changes .

Execução de um índice incremental de um site ao vivo ou preparado

Você pode usar o Índice incremental para indexar "partes" do site ao vivo ou em etapas, como uma coleção de páginas alteradas com frequência.
Para executar um índice incremental de um site ao vivo ou preparado
  1. No menu do produto, execute um dos procedimentos a seguir:
    • Clique em Index > Incremental Index > Live Index .
    • Clique em Index > Incremental Index > Staged Index .
  2. Clique em Incremental Index Now .
  3. (Opcional) Se ocorreram erros de indexação, clique em View Errors para exibir o log associado.

Exibindo o log de índice incremental de um site ao vivo ou preparado

Quando um índice incremental em tempo real ou um índice incremental em estágio é concluído, você pode exibir seu log associado para solucionar quaisquer erros que ocorreram.
Não é possível exportar registros nem salvá-los. O log permanece disponível para exibição até que o novo índice ocorra.
Para exibir o log de índice incremental de um site ao vivo ou preparado
  1. No menu do produto, execute um dos procedimentos a seguir:
    • Clique em Index > Incremental Index > Live Log .
    • Clique em Index > Incremental Index > Staged Log .
  2. Na página de log, na parte superior ou inferior, execute um dos procedimentos a seguir:
    • Use as opções de navegação First , Prev , Last ou Go to line para percorrer o log.
    • Use as opções de exibição Errors only , Wrap line ou Show para refinar o que você vê.