Cuando Creas Contenido pero no Aparece en los Resultados de Google
Cómo Solucionar el Problema de «Rastreada – actualmente no indexada» en Google Search Console: Guía para los Newsletters de Substack
Cómo Solucionar el Problema de «Rastreada – actualmente no indexada» en Google Search Console
Conseguir que Google indexe tus páginas es crucial para que los usuarios puedan descubrir tu contenido en cualquier medio. También en Substack, a medida que la competencia por conseguir suscriptores (especialmente los de pago) aumente.
Si tu contenido no está indexado, no aparecerá en los resultados de búsqueda, lo que significa que todo tu duro trabajo podría pasar desapercibido.
Google gestiona miles de millones de páginas web y da prioridad a la indexación de contenidos que aporten valor a los usuarios. Sus responsables lo reconocen (véase más adelante).
Si tu contenido no supera esta evaluación inicial, puede aparecer marcado como «rastreado, actualmente no indexado» en Google Search Console. De hecho, verás que una buena de tus posts están ahí, y que, cada vez más, aumenta su proporción respecto a los indexados. No es tu culpa. Es la política de Google de indexar cada vez menos.
Incluso el contenido de alta calidad puede tener dificultades para ser indexado si tu sitio tiene un historial de contenido deficiente, o existe demasiado contenido parecido en internet.
Google no indexa el 100% de las páginas que envías, y hay varias razones por las que una página puede quedar excluida de la indexación. Si ya has verificado tu sitio web con Google Search Console, puedes identificar estas páginas excluidas navegando a la sección Páginas → No indexadas dentro de tu Search Console.
No des por sentado que, una vez indexada una página, no necesitas volver a hacer nada con ella. Google puede cambiar la forma en que evalúa tu contenido con el tiempo. Tal vez tu contenido se eliminó parcialmente debido a un error. O unas modificaciones del contenido no cumplen los estándares de Google. Es más común de lo que crees.
“Rastreada – actualmente no indexada”
“Rastreada – actualmente no indexada” (“Crawled – Currently Not Indexed”) significa que Google ha rastreado tu página pero aún no la ha indexado. Como ya sabemos, Google no indexa todas las URL que enviamos, y encontrar cierto número de URL bajo este estado es completamente normal. Y para dejarlo claro, no se trata de un error, sino más bien de una razón por la que Google ha excluido la(s) página(s) de su índice.
Sin embargo, en ocasiones la página sí están indexada (se puede ver en la herramienta de inspección de URL, caso por caso). Google ha explicado que los datos del informe de indexación de páginas se actualizan a un ritmo diferente (normalmente más lento) que los de su herramienta de inspección de URL. Por tanto, es comprensible que el informe de indexación de páginas tarde unos días en reflejar el estado real de cualquier página.
A pesar de que existe una laguna en los informes de Google Search Console, los webmasters han informado de páginas indexadas hace mucho tiempo, que siguen apareciendo como Rastreadas – actualmente no indexadas.
Calidad
Si ves que alguna página importante (con información valiosa/útil) de tu sitio web aparece en esta lista, entonces, como sugiere John Mueller de Google, es probable que se trate de un problema de calidad general de todo el sitio que ha afectado a la indexación de tus páginas importantes. Recomienda mejorar la estructura y la calidad general de tu sitio web.
Mi equipo y yo hemos escrito este artículo lo mejor que hemos podido, teniendo cuidado en dejar contenido que ya hemos tratado en otros artículos de esta revista. Si crees que hay algo esencial que no hemos cubierto, por favor, dilo. Te estaré, personalmente, agradecido. Si crees que merecemos que compartas este artículo, nos haces un gran favor; puedes hacerlo aquí:
No puedes forzar la indexación de las páginas; para Google, “es normal” que no indexen todas las páginas de todos los sitios web.
Otro aspecto en el que debes centrarte es la optimización del contenido generado por el usuario en tu sitio web.
Supongamos que en la zona de comentarios, alguien hace una pregunta. Aunque puede haber muchas respuestas valiosas en el futuro, no había ninguna en el momento del rastreo, por lo que Google puede clasificar la página como contenido de baja calidad. Por eso es interesante que haya contenido en los comentarios, y su respuesta por el autor, en las primeras horas tras la publicación.
Creo que una de las mejores cosas de escribir online es que el lector (tú) puede dar su opinión, y que el autor (mi equipo y yo) puede recibir "feedback". Pero todo empieza con un comentario tuyo:
Algunas Soluciones
Crear contenido muy especializado
Si escribes sobre aspectos jurídicos o económicos muy específicos de, por ejemplo, Costa de Marfil, Google entenderá que no hay alternativas a tu artículo, y lo indexará. Algo parecido ocurre cuando no hay una “keyword” que se ajuste a tu contenido, como se ha visto en algunas investigaciones sobre los resultados de Google. Esto puede beneficiar a algunos boletines de Substack, dado que abordan temáticas sumamente de “mico-nicho”.
Estructura de enlaces internos
Es crucial proporcionar una buena arquitectura del sitio web (Substack es poco customizable, pero hay varias posibilidades) y asegurarse de que existen enlaces internos a todas las páginas que quieres que se indexen (si, no es facil en Substack; pero se pueden utilizar las tags y las secciones para ello). Si intentas indexar una página o post importante, asegúrate de que tiene enlaces internos desde páginas relevantes de tu substack. Para crear enlaces internos, puedes establecer tus páginas importantes como “contenido pilar” (una técnica muy interesante, que podemos explicar en los comentarios).
Contenido duplicado
Comprueba si los artículos que intentas indexar están duplicadas en tu substack. En caso de que encuentres alguna, en muchas webs se puede añadir una etiqueta canónica desde estas páginas duplicadas, apuntando al contenido original que quieres indexar. Sin embargo, recuerda que las etiquetas sólo son sugerencias, y que Google no está obligado a seguirlas.
Si Google ignora tu etiqueta canónica, puedes detectarlo gracias al estado «Duplicado, Google eligió una canónica diferente a la del usuario» en Google Console.
Por ejemplo, algunos expertos en SEO compartieron un caso interesante con la comunidad SEO. Su página fue reportada como «Rastreada – actualmente no indexada» porque Google pensó que era una página duplicada. No está claro por qué Google podría elegir «Rastreada – actualmente no indexada» en lugar de un estado específico para contenido duplicado. Una posible explicación es que el estado cambiará más tarde, cuando Google decida si hay otro más adecuado para la página.
Como Substack no permite añadir etiquetas, la única opción que se me ocurre es añadir un link al post que se considera el original.
Basado en la experiencia de varios autores, mis opiniones, perspectivas y recomendaciones se expresarán a continuación (o en otros lugares de esta plataforma, respecto a las características en 2024 o antes, y el futuro de esta cuestión):
Auditoría de contenidos
En cualquier momento, un sitio web (incluyendo los boletines) tendrá algún contenido obsoleto. Una auditoría de contenidos te ayudará a identificar esas páginas carentes de valor, y podrás mejorarlas. En los casos en que no sea apropiado añadir más contenido a la página, puedes considerar alternativas como eliminar la página por completo (y, quizás, pasar su contenido a otra que sí está indexada), o redirigir a una página más relevante.
Utilizar un sitemap temporal
A veces, páginas como las URL de destino de los redireccionamientos aparecen en el informe «Rastreado – Actualmente no indexado». Esto, como se ha dicho más arriba, no se debe a redireccionamientos incorrectos, sino que está relacionado con la frecuencia con la que Google rastrea tu sitio web. Es posible que Google rastree estas URL de destino pero no las añada a su índice.
Si este tipo de historias es justo lo que buscas, y quieres recibir actualizaciones y mucho contenido que no creemos encuentres en otro lugar, suscríbete a este substack. Es gratis, y puedes cancelar tu suscripción cuando quieras:
Qué piensas de este contenido? Estamos muy interesados en conocer tu opinión sobre este texto, para mejorar nuestras publicaciones. Por favor, comparte tus sugerencias en los comentarios. Revisaremos cada uno, y los tendremos en cuenta para ofrecer una mejor experiencia.
Una posible solución consiste en crear un archivo sitemap temporal en una página de Substack. Comienza extrayendo todas las URL del informe «Rastreadas – Actualmente no indexadas» y alinéalas con las redirecciones establecidas mediante Excel o Google Sheets.
A continuación, genera un mapa del sitio, lo que puede hacerse con herramientas como XML Sitemaps, y súbelo a tu panel de Google Search Console.
Un vídeo popular de Guillermo sobre crear contenido:
¿Cuánto tardan los nuevos contenidos en pasar por el sistema de indexación?
Si hay interés en este tema, uno de los próximos artículos sería acerca de cuánto tardan los nuevos contenidos en pasar por el sistema de indexación. Por favor, dejádmelo saber en los comentarios.
Eso pasa mucho, tristemente pasa mucho
“Rastreada – actualmente no indexada” (“Crawled – Currently Not Indexed”) significa que Google ha rastreado tu página pero aún no la ha indexado. Como ya sabemos, Google no indexa todas las URL que enviamos, y encontrar cierto número de URL bajo este estado es completamente normal. Y para dejarlo claro, no se trata de un error, sino más bien de una razón por la que Google ha excluido la(s) página(s) de su índice.
Sin embargo, en ocasiones la página sí están indexada (se puede ver en la herramienta de inspección de URL, caso por caso). Google ha explicado que los datos del informe de indexación de páginas se actualizan a un ritmo diferente (normalmente más lento) que los de su herramienta de inspección de URL. Por tanto, es comprensible que el informe de indexación de páginas tarde unos días en reflejar el estado real de cualquier página.
A pesar de que existe una laguna en los informes de Google Search Console, los webmasters han informado de páginas indexadas hace mucho tiempo, que siguen apareciendo como Rastreadas – actualmente no indexadas.
Si ves que alguna página importante (con información valiosa/útil) de tu sitio web aparece en esta lista, entonces, como sugiere John Mueller de Google, es probable que se trate de un problema de calidad general de todo el sitio que ha afectado a la indexación de tus páginas importantes. Recomienda mejorar la estructura y la calidad general de tu sitio web.
Hay varias soluciones, como se apunta en este artículo: