Si has llegado hasta aquí es porque te estás preguntando qué hacer para desindexar una URL de Google que, por el motivo que sea, no debería aparecer en los resultados de búsqueda. En este artículo te voy a mostrar las diferentes formas de proceder a desindexar una URL según sea tu caso en particular.
¿Qué significa desindexar?
Ya sabrás que una URL es la dirección única y exacta que tiene cada página dentro de una web, pero ¿en qué consiste la indexación?
Para proceder a indexar Google primero “crawleará” (rastreará) las distintas URL que se va encontrando con Googlebot para analizar, añadir a su índice el contenido (indexarlo) y poder posteriormente mostrar las URL en los resultados de búsqueda, siempre y cuando proceda.
La forma más rápida de que no aparezcan determinadas páginas en los resultados de búsqueda de Google es no indexarlas de inicio, añadiendo la metaetiqueta “noindex”, (más adelante te mostraré cómo hacerlo).
Sin embargo, puede suceder que por cualquier razón sea después cuando te des cuenta de que no te conviene que determinadas URL aparezcan como públicas en el buscador, accesibles a cualquiera, o puede ser que directamente desees deshacerte de una página.
Causas por las que podrías necesitar desindexar una URL
Los motivos pueden ser tan diversos y personales como tu propia página, no obstante, los más comunes o que pueden englobar la mayoría de las causas son los siguientes:
- Porque son páginas que no tienen contenido, o el que tienen quieres eliminarlo en cuanto sea posible.
- Porque no quieres que nadie acceda desde Google a esa información, bien porque sea privada, no aporte valor a priori o porque quieras que esté restringida a tus usuarios.
- Porque la URL ya no existe o has movido el contenido a otra URL.
- Porque te está dando problemas de canibalización de palabras clave y tus páginas están compitiendo entre sí.
Cómo desindexar una URL de Google
Vistas las diferentes razones por las que podrías querer desindexar una o varias URL del índice de Google, te voy a mostrar las diferentes formas de proceder según tu caso en particular, y cuándo servirte de cada una de ellas, dependiendo de qué sea lo que pretendes hacer con dichas URL.
Dentro de Publisuites podrás generar ingresos vendiendo posts patrocinados dentro de tu blog para otros usuarios. Entra y Hazte una cuenta de editor para empezar a ganar dinero.
Desde la herramienta de Google Search Console, puedes desindexar URL de forma temporal (durante unos 6 meses máximo), por lo que para desindexarlas de forma permanente te voy a enseñar a complementar esta opción junto con la que hará que esa URL quede desindexada indefinidamente (no obstante, esto no es completamente irreversible).
No sirve de nada ir de inicio a Google Search Console para desindexar URL Google si previamente no has realizado la modificación oportuna de las mismas; es decir, primero hay que hacer una desindexación a nivel de código de la URL (ahora te enseñaré cómo), y luego la petición a Google de desindexación.
Si no lo haces así tendrás que “reindexar” esa URL para hacer la petición de desindexación de nuevo. Así que os vamos a enseñar cómo solicitar a Google que retire información de su buscador o de una URL.
Veremos 6 métodos para retirar una página de Google. Estos son:
- El contenido de la página va a ser eliminado permanentemente
- El contenido ha sido movido a otra URL: redirección 301
- Quieres desindexar la URL, pero la página debe ser visible para el usuario
- Subordinar una URL a otra: definir una URL como canónica
- Desindexar varias URL mediante Google Search Console
- Evitar la indexación desde Google Search Console de URL con parámetros
¡Vamos con el primero!
El contenido de la página va a ser eliminado permanentemente
Aquí te voy a explicar cómo eliminar una URL que ya no va a existir y no te esté aportando unos resultados que pudiera interesarte mantener redireccionándola hacia otra URL, ya sea para URL creadas de forma puntual (una oferta o producto de tiempo limitado que no volverás a tener operativos), o para cualquier página que quieres “borrar del mapa”.
Pasos a seguir para desindexar y eliminar una URL:
Mediante el código de error 410
Antes de nada, todo archivo que no sea HTML debe eliminarse de la página, puedes hacerlo con un archivo robots.txt configurándolo con la directiva “disallow”.
Lo que harás después es devolver un código de error HTTP 410 Gone o Página no disponible. Con este código le estamos diciendo al bot de Google que esta URL ya no existe y no volverá a hacerlo, para que no vuelva a pasar por ella.
Vas a escribir en el .htaccess la directiva Redirect gone, seguida de la URL que quieres eliminar:
Redirect gone /URL a eliminar
No hay que confundir este código de error con el 404 (página no encontrada). En realidad, aunque pueden servir para lo mismo, este último suele aparecer también de forma involuntaria, cuando, por ejemplo, un enlace en tu web se ha roto, por lo que el código de error 410 en ese aspecto no da lugar a dudas a Google.
Una vez hecho esto, dirígete a Google Search Console, en el panel de la izquierda harás clic en el menú desplegable “Índice de Google”, en “Retirada de URL”, y en “Nueva solicitud”.
Te aparecerá una ventana con dos pestañas. Irás a la pestaña “Retirar URL temporalmente”.
Introduce la URL que quieres desindexar, marca la opción “Retirar solo esta URL“, y haz clic en “Siguiente”.
Google no recomienda desindexar mediante Search Console cuando estableces estas directivas, ya que de forma “natural” se encontrará con las URL y las leerá, no obstante sirve para agilizar el proceso de desindexación.
Retirada de contenido obsoleto
Otra forma de acelerar el proceso de eliminación de URL es haciendo clic en este enlace que te llevará directamente a la herramienta de retirada de contenido obsoleto de Search Console.
Aquí te aparecerá un recuadro donde introducirás la URL copiada de los resultados de búsqueda de Google, para después clicar en “Solicitar retirada”.
El contenido ha sido movido a otra URL: redirección 301
Una redirección 301 te servirá tanto si has movido el contenido de la página a otra URL (o incluso a otro dominio), como si esta última va a ser eliminada y tenía un buen posicionamiento en los resultados de búsqueda y como es lógico, no quieres perder ese PageRank.
Lo que harás es redireccionar (y conservar dicha autoridad) hacia una nueva página. Es muy importante evitar los enlaces rotos de cara a un buen posicionamiento.
Esta es la mejor opción, ya que, además, así indexarás a la par la nueva URL de contenido similar a la anterior.
Para hacerlo puedes utilizar varios plugins, como, por ejemplo, plugin Redirection, que también te ofrece la posibilidad de hacerte un seguimiento de errores 404 y de hits.
También es posible hacerlo mediante htaccess, pero en este caso, si no tienes los conocimientos suficientes, te recomiendo que no lo hagas por esta vía, ya que un comando mal introducido puede generarte problemas de contenido duplicado.
Una vez redireccionada la URL hacia la nueva página, iremos a la herramienta de retirada de URL de Search Console para, siguiendo los pasos del punto anterior, solicitar a Google que retire de forma temporal dicha URL.
Entra en Publisuites y consigue referencias de otras webs con posts patrocinados. Ponemos a tu disposición más de 17.000 medios especializados segmentados por temática, precio, idioma, país, métricas SEO…
Hazte una cuenta de anunciante y pasa por la plataforma para mejorar la autoridad de tu web. Con total garantía y confianza.
Quieres desindexar la URL, pero la página debe ser visible para el usuario
Si lo que quieres es que ciertos contenidos de tu web solo sean accesibles a algunos usuarios (a quienes estén registrados, por ejemplo, o a aquellos que entran a ciertas secciones de tu web, pero cuyo contenido no es relevante en los resultados de búsqueda), entonces tienes estas opciones:
Bloquear el acceso a URL con contraseña
Puede ser de tu interés que solo tú o determinadas personas tengan acceso a alguna/s de tu/s página/s, u ofrecer la posibilidad de que algunos de tus usuarios tengan su propia contraseña.
Esta es también una forma infalible de desindexar URL Google, en el sentido de que mientras tenga una contraseña establecida no será indexada de ninguna manera.
Aquí, al contrario que en las anteriores formas, es conveniente, si no has configurado directamente la URL durante la creación de la página correspondiente, que primero le indiques a Google a través de Search Console que quieres desindexarla.
Desindexar con una metaetiqueta “noindex”
Tal vez no desees que tu URL tenga ningún tipo de contraseña, pero no sea valiosa para un usuario a priori (en los resultados de búsqueda), y sí lo sea posteriormente, mientras navega por tus páginas. Un ejemplo claro pueden ser páginas que se generan por alguna funcionalidad de la web, como de políticas de privacidad, por ejemplo, o cuya funcionalidad se limita a determinados procesos que pueda llevar a cabo el usuario.
Lo ideal es que tan pronto como crees estas páginas les agregues la metaetiqueta “noindex”, pero si por lo que sea las has dejado indexadas, tendrás que colocar esta metaetiqueta en la sección “head” (en la cabecera) de cada página:
<meta name=»robots» content=»noindex»>
Si utilizas WordPress puedes instalar Yoast SEO y seguir estos pasos para desindexar una URL:
- Primero añade la metaetiqueta “noindex” a la URL.
- Luego vamos al icono de configuración.
- Donde dice “¿Permitir a los motores de búsqueda mostrar esta página en los resultados?”, haz clic en “No”.
- Y por último en “Guardar”.
Aunque no quieras que Google rastree tu página para optimizar tu crawl budget (tiempo que destina Google al rastreo de tu web), primero debes dejar que Google “entienda” que quieres desindexar tu página si ha sido indexada (dejarle leer la metaetiqueta “noindex”), y posteriormente podrás poner la metaetiqueta “nofollow” (directiva que impide el crawleo de una página).
Si no ha sido previamente indexada, entonces podrás añadir “nofollow” de forma inmediata.
No hay que confundir la directiva “nofollow” con el archivo robots.txt. Este último solo está recomendado si lo que quieres es que el buscador no rastree un archivo por ejemplo un elemento que no esté configurado en HTML; y jamás lo utilices si has establecido la directiva “noindex” para una URL, pues parece que a Google no le gusta encontrarse con el robots.txt durante su rastreo.
Además, debes tener en cuenta que “noindex” es una directiva, no una obligación, y en algunas ocasiones Google puede saltársela, sobre todo en casos en los que la URL en cuestión reciba varios enlaces internos y externos.
Posteriormente, podrás dirigirte a Google Search Console para indicarle que quieres que desindexe la URL.
Subordinar una URL a otra: definir una URL como canónica
Esta opción puede servirte en casos en los que, por ejemplo, tengas contenido en una página que dependa de otra, para disminuir el contenido duplicado de las páginas internas en el buscador, o cuando algunas de tus páginas estén compitiendo entre sí y te interese que solo aparezca una en los resultados de búsqueda.
Un ejemplo es tener una página en la que tengas una primera y segunda parte, y quieres que el usuario visualice la primera antes de que acceda a la segunda; entonces lo que harás será definir esa URL que debe ser visitada primero como URL canónica.
Como ocurre con la metaetiqueta “noindex”, puede haber casos en los que Google considere oportuno saltarse la directiva, sobre todo si no has definido como canónica la URL en cuestión inmediatamente después de haber creado la página subordinada.
Para definir como canónica una URL, tendrás que añadir la etiqueta rel=”canonical” en la sección “head” de la página a subordinar:
<link rel=»canonical» href=»https://tu/URL/canónica»>
Si utilizas WordPress, puedes utilizar Yoast SEO para establecer automática o manualmente URL canónicas.
Ahora podrás ir a Google Search Console para pedirle que desindexe la URL.
Desindexar varias URL mediante Google Search Console
Puedes pensar que, si tienes varias páginas que desindexar, va a ser bastante tedioso hacerlo una a una. La buena noticia es que una vez redireccionadas, establecidos los códigos de error en cada una de ellas, etc., podrás realizar el proceso de desindexado a través de Google Search Console con todas esas URL a la vez.
Te muestro cómo hacerlo:
- Antes de nada, para ello hace falta instalar Google Webmaster Tools Bulk URL Removal, una extensión de Chrome que añade esta funcionalidad a Search Console para poder subir un archivo de texto con todas las URL que quieras eliminar.
- Para ello iremos desde Chrome a: Herramientas > Extensiones > Cargar extensión descomprimida.
- Ahora, en Google Search Console te aparecerá un botón que antes no estaba para subir un archivo donde indicarás todas las páginas que quieras desindexar Google.
- Deberás escribir una URL por línea, guardar el archivo en extensión .txt, y cargarlo en Search Console.
- Ahora te toca esperar a que la extensión solicite la desindexación de cada URL de forma automática, por lo que solo tendrás que mantener abierto el navegador hasta que termine el proceso.
Evitar la indexación desde Google Search Console de URL con parámetros
Desde el propio Search Console se puede evitar también que Google rastree e indexe páginas con parámetros idénticos.
Es una opción muy útil si tienes más de 1000 URL indexadas y no quieres que haya contenido duplicado de URL sin valor, como las que se generan por la funcionalidad de la propia web que contengan el mismo parámetro, como puede ocurrir por ejemplo con el parámetro “page”.
No obstante, es mejor utilizar URL canónicas; ya que, de no ser un experto en SEO, el uso inadecuado de esta herramienta puede producirte más inconvenientes que beneficios.
Para ver qué parámetros ha detectado Google cuando ha indexado tus páginas, irás a “Rastreo”, harás clic en “Parámetros de URL”, y luego en “Editar” o “Añadir parámetro”. Debes escribir el parámetro tal como aparece en la URL.
Ahora te aparecerá una ventana en la que, según con qué parámetro estés tratando, deberás indicar:
Si el parámetro de URL influye en el contenido de la página:
- “No, no influye en él”.
- “Sí, cambia, reordena o restringe el contenido de la página”. Si es el caso del parámetro en cuestión, deberás seleccionar el uso del mismo:
- Ordena el contenido. Un ejemplo claro son parámetros que modifican el orden según los precios.
- Restringe el contenido. Suele utilizarse para filtrar el contenido y mostrar solo los productos o servicios que contengan ciertas características.
- Especifica el contenido. Señala la categoría en la que se encuentra el contenido que se va a mostrar en la página.
- Traduce el contenido. Sirve para traducir de forma automática el contenido de una página.
- Página el contenido. Te muestra páginas concretas de artículos o directorios extensos.
“¿Qué URL con este parámetro debe rastrear el robot de Google?”. Aquí es donde le indicarás a Google lo que tiene que hacer con el parámetro que has seleccionado.
- Dejar que el robot de Google decida. Puede servirte si no sabes muy bien la utilidad de cada parámetro o si tiene diversas funcionalidades según a qué función obedezca dentro de la web.
- Todas las URL. Esta opción te sirve para todo lo contrario, para que Google no considere como duplicado el contenido de URL similares con parámetros idénticos.
- Solo URL con un determinado valor. Solo rastreará las URL que, del parámetro escogido, tengan un valor en concreto, el resto no serán rastreadas. Es una opción muy útil si tu sitio se sirve del valor de parámetro para cambiar el orden en que se pueda mostrar el mismo contenido.
- Ninguna URL. Aquí le indicarás a Google que no crawlee ninguna URL con un parámetro específico.
Deberás tener mucho cuidado con las reglas que se hereden del/los parámetros que desees aplicar, ya que podrías terminar impidiendo el rastreo de URL que sí deberían ser indexadas.
Por ejemplo, un subdominio se considera como una propiedad secundaria del dominio principal, por lo que, si le aplicamos una restricción de parámetros al dominio principal, afectará a los dominios secundarios.
Si configuras varios parámetros, has de tener en cuenta también que a una URL que tenga varios de esos parámetros se le aplicará la regla más restrictiva.
Por estos motivos, es conveniente que, si no tienes más de 1000 URL que puedan generarte contenido duplicado, las definas como URL dependientes de una URL canónica.
¿Cuándo no utilizar estas herramientas de desindexación?
Antes de proceder a mostrarte cómo desindexar una URL de Google a través de varios métodos, veamos cuándo tendrás que servirte de prácticas distintas a la desindexación:
Para solicitar el bloqueo de páginas que no te pertenecen . Si por cualquier motivo encontraras contenido de índole personal que consideras que no debería aparecer en una web, puedes, en primer lugar, ponerte en contacto con el dueño de la página; bien a través del e-mail de contacto que tenga puesto o escribiendo en el navegador “WHOIS www-la-web-pertinente.com”.
Si no consiguieras ponerte en contacto con el propietario de la web, o este hiciera caso omiso a tu petición, entonces cabría la posibilidad de que lo haga el propio Google.
Se puede conseguir que se retire información personal que suponga un riesgo para ti, al igual que si se ha cometido una infracción es posible llevarlo por lo legal.
Si han pirateado tu sitio , no elimines todas las URL de tu web, hazlo solo con las que haya creado el hacker.
Si has encontrado contenido inadecuado , también puedes denunciarlo.
Conclusión
Has podido comprobar que existen diversas formas de desindexar una URL, y que la mejor manera de que no acabe indexada una URL que no debería estarlo es
- si no quieres que Google la rastree, poner inmediatamente después de la creación y publicación de una página una metaetiqueta “nofollow”;
- si sí pretendes que la rastree, pero que no la indexe, con la metaetiqueta “noindex”.
Has aprendido también los métodos a seguir si vas a eliminar o trasladar una página, incluso una web al completo.
No obstante, si tienes cualquier duda o problema, siempre puedes contactar con un experto, ya que una mala configuración en la indexación o desindexación de URL puede ocasionarte un problema incluso mayor al originario.
2 comentarios en “Guía para desindexar una URL de Google: ejemplos y casos de uso”
muchas gracias a la información de la pagina y algunos comentarios pude resolverlo. Esto me ayudo mucho , por que se me hizo mas facil para proyectos que tenia pendiente y no me salia.
¡Genial! Que buen artículo, me fue de mucha utilidad, gracias