Si quieres que tu página web aparezca entre los primeros resultados de las páginas de búsqueda, debes saber qué es rastrear una URL con Google y cuál es la mejor vía para hacerlo. De esa forma, garantizarás que el buscador indexe de manera correcta todo el contenido de tu sitio web.
Indice del artículo
¿Qué es rastrear una URL?
Para entender qué significa rastrear una URL, debes tener claro qué son las arañas o rastreadores web.
Las arañas, también llamadas rastreadores, son programas que viajan por la red en busca de contenido nuevo. Algo así como cazadores de páginas web. Cuando encuentran una que no figuraba en el índice, navegan a través de ella, siguiendo enlaces, activando scripts y recabando información. Luego, envían el resultado de su indagación al buscador, para que este pueda indexar el nuevo contenido.
Este proceso es al que llamamos rastrear una URL. Y no es propio de Google, pues todos los buscadores lanzan sus rastreadores en busca de “actualizaciones” en la Red.
¿Cómo rastrear una página web?
Se recomiendan 3 métodos para rastrear con Google tu sitio web, y deberás utilizarlos todos a la vez si quieres resultados óptimos.
1. Meta canonical
Es un potente recurso para ayudar a Google a rastrear tus páginas web. Se le llama meta canonical al atributo HTML que le indica al buscador indexar solo una URL en concreto.
Por ejemplo, supongamos que tu sitio es accesible a través de varias URLs:
www.tusitio.com tusitio.com www.tusitio.com/index.php tusitio.com/index.php
Como ves, se trata del mismo sitio pero referenciado de manera distinta cada vez. El buscador puede suponer que hay contenido duplicado, pues ha detectado varias URL que conducen al mismo contenido. Para evitar esto, añades a URL preferente en la cabecera entre el <head> y </head> del HTML tu página:
<link rel=’canonical’ href=’tusitio.com’/>
Atributos hreflang
El atributo hreflang se incluye en la etiqueta <link> para indicar en qué idioma está el contenido de la página. Eso, por supuesto, si tienes versiones de tu sitio para cada idioma. Por ejemplo:
<link rel=’alternate’ hreflang=’es’ href=’http://www.tusitio.es’>
Nota que la URL no tiene que ser cómo la indicamos arriba. También podrías poner: es.tusitio.com y www.tusitio.com/es, entre otras variantes.
Directivas robot
Las directivas robot le dicen a Google cómo debe indexar las páginas de tu web sin estorbarles la navegación a los usuarios. Ell permite, entre otras cosas:
evitar problemas de contenido duplicado
no indexar partes del sitio que prefieres
ocultar
Para ello, simplemente tienes que incluir la meta etiqueta <robots> en el código de la página cuyo rastreo quieres controlar:
<meta name="robots" content="directiva1, directiva2, ..." />
El valor de contents pueden ser las siguientes directivas:
noindex: evita que Google indexe el
sitio web (su opuesta es index
y no hay que indicarla, pues el buscador la asume por defecto)
nofollow: impide a los rastreadores
seguir el enlace (su opuesta es follow,
y trabaja igual que index)
notranslate: le dice al buscador que
no ofrezca traducciones de la página
noarchive: no se muestra la página
disponible la caché de Google
nosnippet: no mostrar la información
de los fragmentos enriquecidos (snippets) en los resultados de
búsqueda
unavailable_after: pasado un tiempo la página no aparecerá más en los resultados de búsqueda
¿Cómo volver a rastrear una URL?
Artículos Relacionados
Suscríbete al Newsletter
Suscríbase a nuestro boletín de correo electrónico para que pueda mantenerse al tanto y conocer nuestras increíbles noticias, ideas y ofertas. También recibirá útiles consejos de marketing para hacer de las ventas su negocio.
Información elemental sobre protección de datos
Responsable: Los datos de carácter personal que recopilados al enviar este formulario son gestionados por IDX con CIF: B86091451 como propietaria de esta web. Finalidad: La recogida y tratamiento de datos personales tiene como finalidad, la gestión de la solicitud de información sobre los servicios, productos y promociones ofrecidas por IDX. Legitimación: Consentimiento del interesado. Destinatarios: Alojamos la información en servidores ubicados en OVH, además utilizamos Acumbamail y Pipedrive para la gestión de comunicaciones comerciales por email. Derechos: Puedes ejercer tus derechos de acceso, rectificación, limitación y eliminación los datos enviando un email en rgpd[arroba]innovadeluxe.com. Tienes derecho a presentar reclamación ante una autoridad de control. Información Adicional: Consulta información detallada sobre nuestra política Protección de Datos en el Aviso Legal.