Show Menu
TÓPICOS×

Sobre o Índice Incremental

Você pode usar o Índice incremental para indexar "partes" do site ao vivo ou em etapas, como uma coleção de páginas alteradas com frequência.

Usando índice incremental

Um índice incremental demora apenas segundos para ser executado e é útil em sites de grande capacidade que podem levar muitas horas para ser indexados completamente.
Quando você gera um índice incremental, as informações de status são exibidas, como tempo de start, tempo decorrido e erros durante o processo de indexação. As informações sobre o status do último índice também são exibidas.
Você pode interromper ou reiniciar o processo de indexação incremental a qualquer momento.
Enquanto o novo índice incremental é criado para seu site ativo, os clientes podem continuar a pesquisar seu site usando seu último índice incremental.

Configuração de um índice incremental de um site preparado

Você pode configurar quais páginas de site deseja incluir no índice incremental especificando URLs de site e máscaras de URL.
Para configurar um índice incremental de um site preparado
  1. No menu do produto, clique em Index > Incremental Index > Configuration .
  2. Na Incremental Index Configuration página, use os vários campos para especificar quais páginas você deseja indexar.
    Campo
    Descrição
    Adicionar ou atualizar URLs
    Especifique URLs.
    O robô de pesquisa indexa somente os documentos especificados que foram alterados desde a última vez que você indexou.
    Além disso, o robô de pesquisa segue links contidos nos documentos especificados e indexa apenas os documentos que foram alterados.
    Esse campo deve conter apenas URLs de documento e não máscaras, como no exemplo a seguir:
    https://www.mydomain.com/products/new.html
    Você pode usar as seguintes palavras-chave com o URL:
    • noindex
      Se você não quiser indexar o texto na página que corresponde a um URL especificado, mas quiser seguir os links da página, adicione noindex após o URL como no exemplo a seguir:
      https://www.mydomain.com/products/new.html noindex
      Certifique-se noindex de separar o URL com um espaço; uma vírgula não é um separador válido.
    • nofollow
      Se você quiser indexar o texto na página que corresponde ao URL especificado, mas não quiser seguir os links da página, adicione nofollow após o URL como no exemplo a seguir:
      https://www.mydomain.com/products/new.html nofollow
      Certifique-se nofollow de separar o URL com um espaço; uma vírgula não é um separador válido.
    Localizar e atualizar máscaras de URL
    Especifique máscaras de URL simples: caminho completo, caminho parcial ou caminhos que usam curingas ou expressões regulares.
    O robô de pesquisa encontra todos os documentos e índices correspondentes somente aqueles que foram alterados desde a última vez que você indexou.
    Além disso, o robô de pesquisa segue links contidos nos documentos correspondentes e indexa apenas as páginas que foram alteradas. Por exemplo:
    https://www.mydomain.com/products/household/*.html
    Você também pode usar expressões regulares como no exemplo a seguir:
    regexp ^https://www\.mydomain\.com/products/household/.*\.html$
    Consulte Expressões regulares.
    Você também pode usar as palavras-chave nofollow e noindex conforme descrito em Adicionar ou atualizar URLs acima.
    Incluir e excluir máscaras de URL
    Especifique máscaras simples de inclusão ou exclusão de URL: caminho completo, caminho parcial ou caminhos que usam curingas ou expressões regulares.
    O robô de pesquisa encontra e indexa ("incluir") ou ignora ("excluir") documentos com base no tipo de máscara especificado.
    Ao indexar um site, as instruções são seguidas em ordem de aparência. Por exemplo, a seguinte lista de máscaras:
    include https://www.mydomain.com/products/household/lightbulbs*.html
    exclude https://www.mydomain.com/products/
    indexa as páginas lightbulbs1.html e lightbulbs2.html . No entanto, ele não indexa nenhuma outra página listada no diretório products.
    Uma máscara de URL que aparece primeiro sempre tem precedência sobre uma que aparece mais tarde na lista. Além disso, se o robô de pesquisa encontrar um documento que corresponda a uma máscara de inclusão e uma máscara de exclusão, a máscara listada primeiro terá prioridade.
    Você também pode usar as palavras-chave nofollow e noindex conforme descrito em Adicionar ou atualizar URLs acima.
    Consulte Sobre máscaras de URL.
    Incluir e excluir máscaras de data
    Especifique máscaras simples de inclusão ou exclusão de datas: caminho completo, caminho parcial ou caminhos que usam curingas ou expressões regulares.
    O robô de pesquisa encontra e indexa ("incluir") ou ignora ("excluir") documentos com base no URL e na data dos documentos.
    Você pode usar os seguintes tipos de máscaras de data:
    • include-days NNN
      O robô de pesquisa indexa todos os documentos que correspondem à máscara de URL especificada e são NNN dias ou mais antigos.
      Você pode seguir a máscara de URL com uma ou mais das seguintes palavras-chave:
      • nofollow
      • noindex
      • data do servidor
      Por exemplo, a máscara a seguir inclui todos os documentos na pasta /archive/support com 0 dias ou mais:
      include-days 0 https://www.mydomain.com/archive/support/
    • include-date YYYY-MM-DD
      O robô de pesquisa indexa todos os documentos que correspondem à máscara de URL especificada e são tão antigos ou mais antigos que a data AAAA-MM-DD.
      Você pode seguir a máscara de URL com uma ou mais das seguintes palavras-chave:
      • nofollow
      • noindex
      • data do servidor
      O exemplo de máscara a seguir inclui todos os documentos na pasta /archive/ com data de 25 de julho de 2011 ou antes dela:
      include-date 2011-07-25 https://www.mydomain.com/archive/
    • exclude-days NNN
      Desabilite a indexação de todos os documentos que correspondem à máscara de URL especificada e são dias NNN ou mais antigos.
      Como opção, você pode seguir a máscara de URL pela palavra-chave server-date .
      O exemplo de máscara a seguir exclui todos os arquivos PDF com 90 dias de idade ou mais do índice:
      exclude-days 90 *.pdf
    • exclude-date YYYY-MM-DD
      Desabilite a indexação de todos os documentos que correspondem à máscara de URL especificada e são tão antigos ou mais antigos que a data AAAA-MM-DD.
      Como opção, você pode seguir a máscara de URL pela palavra-chave server-date .
      O exemplo de máscara a seguir exclui todos os documentos na pasta /archive/ datados de 23 de abril de 2004 ou antes:
      exclude-date 2004-04-23 https://www.mydomain.com/archive/
    Consulte Sobre máscaras de data.
    Excluir URLs
    Especifique URLs.
    O robô de pesquisa encontra e exclui os documentos especificados do índice de pesquisa. Se uma página especificada já estiver em seu índice de pesquisa, o robô a excluirá antes de adicionar ou atualizar quaisquer outras páginas.
    Este campo deve conter apenas URLs de documento, e não máscaras.
    Localizar e excluir máscaras de URL
    Especifique máscaras de URL simples: caminho completo, caminho parcial ou que usam curingas ou expressões regulares.
    Se a máscara de URL especificada corresponder às páginas no índice de pesquisa, o robô de pesquisa excluirá as páginas antes de adicioná-las ou atualizá-las. Por exemplo:
    https://www.mydomain.com/products/1998/household/*
    Você também pode usar expressões regulares como no exemplo a seguir:
    regexp ^https://www\.mydomain\.com/products/199[567]/.*$
    Consulte Expressões regulares.
  3. Clique em Save Changes .
  4. (Opcional) Execute um dos procedimentos a seguir:

Definir a programação de índice incremental para um site ao vivo

Você pode selecionar a frequência do Índice Incremental e o tempo base que é usado para rastrear e atualizar seu índice incremental.
A hora selecionada é local de acordo com o fuso horário configurado nas Configurações da conta.
Consulte Definição das configurações da sua conta.
Os servidores da Web normalmente ficam inativos para manutenção no meio da noite. Se o servidor estiver inativo durante um tempo de índice programado, o processo de indexação falhará. Certifique-se de selecionar uma hora do dia em que o servidor Web está disponível.
A programação de índice se aplica somente ao seu índice ativo; não é possível agendar índices preparados.
Para definir a programação de índice incremental para um site ativo
  1. No menu do produto, clique em Index > Incremental Index > Live Schedule .
  2. Na página Na Incremental Index Schedule , na lista Incrementally Index suspensa, selecione a frequência de indexação em horas ou minutos.
  3. Na lista Base Time suspensa, selecione a hora de início em que deseja gerar novamente um novo índice incremental.
  4. Clique em Save Changes .

Execução de um índice incremental de um site ao vivo ou preparado

Você pode usar o Índice incremental para indexar "partes" do site ao vivo ou em etapas, como uma coleção de páginas alteradas com frequência.
Para executar um índice incremental de um site ao vivo ou preparado
  1. No menu do produto, execute um dos procedimentos a seguir:
    • Clique em Index > Incremental Index > Live Index .
    • Clique em Index > Incremental Index > Staged Index .
  2. Clique em Incremental Index Now .
  3. (Opcional) Se ocorreram erros de indexação, clique em View Errors para visualização o log associado.

Exibindo o log de índice incremental de um site ao vivo ou preparado

Quando um índice incremental em tempo real ou um índice incremental por etapas for concluído, você poderá visualização seu log associado para solucionar quaisquer erros ocorridos.
Não é possível exportar registros nem salvá-los. O log permanece disponível para exibição até que o novo índice ocorra.
Para visualização do log de índice incremental de um site ao vivo ou preparado
  1. No menu do produto, execute um dos procedimentos a seguir:
    • Clique em Index > Incremental Index > Live Log .
    • Clique em Index > Incremental Index > Staged Log .
  2. Na página de log, na parte superior ou inferior, execute um dos procedimentos a seguir:
    • Use as opções de navegação First , Prev , Next Last ou Go to line para percorrer o log.
    • Use as opções de exibição Errors only , Wrap line ou Show para refinar o que você vê.