Las Páginas de Error 404 desempeñan un papel muy importante tanto en el SEO como en la usabilidad del sitio web. Aunque a menudo se perciben como la peste bubónica del SEO 👀, las 404 sirven a un propósito sencillo que debería adoptarse estratégicamente.
A lo largo de los años, nos hemos ocupado exhaustivamente de los errores «404 página no encontrada». Y al hacerlo, nos han hecho muchas preguntas. A continuación hemos recopilado las preguntas más frecuentes que nos hacen los clientes sobre las páginas 404 no encontradas, incluidas las cosas que suelen salir mal (para que sepas cómo solucionarlas), además de consejos sobre cómo configurar y supervisar correctamente los errores 404.
Esta guía es muy extensa, así que utiliza los enlaces del índice para encontrar las preguntas que más te interesen.
Un error 404 (HTTP 404), también llamado «código de respuesta del encabezado» o «código de estado http», o simplemente «errores de rastreo», es el equivalente informático de decir «No se ha encontrado» o «Página no encontrada».
Esta es la definición en «lenguaje técnico»:
«El servidor no ha encontrado nada que coincida con el Request-URI. No se indica si el estado es temporal o permanente. El código de estado 410 (Desaparecido) DEBERÍA utilizarse si el servidor sabe, a través de algún mecanismo configurable internamente, que un recurso antiguo no está disponible permanentemente y no tiene dirección de reenvío. Este código de estado se suele utilizar cuando el servidor no desea revelar exactamente por qué se ha rechazado la solicitud, o cuando no es aplicable ninguna otra respuesta.»
– vía w3.org
En otras palabras (menos técnicas), el código de respuesta 404 indica esencialmente a los motores de búsqueda -y a los usuarios- que el recurso (o URL solicitada) al que se hace referencia no existe o que literalmente no se puede encontrar.
Es la versión robot de un encogimiento de hombros y una mirada vacía.
Hay muchos otros tipos de error de respuestay todas las URL devuelven códigos de respuesta de algún tipo. Una página que funcione correctamente, por ejemplo, debería devolver un código de estado «200», que significa «Encontrado». El otro tipo principal de error se denomina «errores del servidor», representados por los códigos de estado HTTP 500-599. Los distintos tipos de error ayudan a los administradores web a diagnosticar el origen de los errores para que puedan solucionarlos adecuadamente.
Los errores 404 suelen ser el tipo de error más común. También suelen ser manejados incorrectamente por personas bienintencionadas, ¡de ahí el propósito de escribir este artículo! Los errores HTTP 404 a veces se denominan «Errores del cliente», donde el «cliente» suele referirse al navegador web del usuario (Google Chrome, IE, Firefox, etc.)
¿Qué es un Soft 404?
Un soft 404 es esencialmente una página que no devuelve un código de respuesta 404, pero Google(bot) cree sin embargo que la página está experimentando un error. Los errores 404 suaves se producen cuando el servidor envía un estado 200 para la página solicitada (lo que implica que la página existe), pero Google cree que la página debería devolver un error 404.
¿Cuál es la diferencia entre un 404 y un Soft 404?
Esencialmente, un 404 suave no emite un código de estado de cabecera 404; en su lugar emite (quizás incorrectamente) un código de estado 200 (Vale). Sin embargo, Google piensa que que la página debe devolver un 404, por lo que emite a la página un 404 suave.
Por otro lado, una página 404 correcta emite correctamente un código de estado HTTP 404 (Página no encontrada). Así, mientras que los errores 404 simplemente indican páginas que no existen, Los errores 404 blandos son algo más ambiguos, ya que indican una página que no debería o no existe pero sigue existiendo de hecho según el CMS.
¿Pueden ser útiles las páginas 404?
Un error 404 indica a los motores de búsqueda, a los visitantes del sitio web y a los administradores de la web cuándo las URL de las páginas están rotas o nunca existieron en primer lugar. Desde una perspectiva técnica, las 404 son herramientas de comunicación útiles que nos ayudan a actuar.
Cuando podemos ver dónde se producen estos códigos de error, podemos solucionar el problema para los futuros visitantes del sitio web (generalmente mediante una redirección 301 a la nueva ubicación de ese contenido), preservando así el poder de la página que una vez existió (… o el enlace incorrecto a una página que nunca existió. Es lo que llamamos «construcción de backlinks rotos»).
Si no emites un código de respuesta 404, no sabrás intrínsecamente que la página -y, por tanto, el usuario- está experimentando un error.
Así que SÍ. Una página 404 es útil. ¡No puedes arreglar lo que no conoces!
¿Qué son las páginas 410, 403 y otras páginas 4{xx}?
Los errores 400 a 499 son todos varios tipos de Errores de Cliente. Otros errores 4xx habituales son
- 400 (Petición errónea) – el servidor no puede procesar la solicitud debido a un error percibido por el cliente, como una sintaxis de solicitud imprecisa o un encuadre de mensaje de solicitud no válido.
- 401 (No autorizada) – la solicitud no se puede procesar porque carece de credenciales de autenticación válidas.
- 403 (Prohibido) – Este suele aparecer cuando rastreas un sitio demasiado rápido y la plataforma/servidor (por ejemplo, Shopify!) te denegará el acceso para reducir la carga de su servidor web.
- 410 (Desaparecido) – Fuera lo que fuera este recurso, ahora ha desaparecido, y eso es permanente & intencionado.
- Encuentra un lista completa de todos los errores de estado 4{xx}.
¿Cómo y cuándo se producen los errores 404?
Hay varios casos que pueden provocar que se produzcan errores 404. Algunas de las razones más comunes de cómo y cuándo las páginas experimentan 404s incluyen:
- Cuando las páginas se han movido (por ejemplo, una página que falta, quizás debido a que se ha movido a una sección diferente de tu sitio web) o se han eliminado (por ejemplo, una página inexistente o eliminada se olvidó y nunca se redirigió)
- Cuando un administrador web, un usuario del CMS o un ingeniero de software escribe mal una URL en una página o «plantilla de página» o comete un error de copiar y pegar (por ejemplo, se enlazó a una URL incorrecta)
- Cuando se producen enlaces rotos o truncados accidentalmente en páginas web, publicaciones en redes sociales o en un mensaje de correo electrónico
- Los verdaderos soft 404 se producen cuando una página emite un estado 200 (OK) cuando debería haber emitido algún otro error porque algo salió mal. Lo más habitual es que la página web debería haber emitido un error 404, pero no lo hizo. Normalmente, esto es un indicio de que los 404 no funcionan correctamente. A veces funciona en algunas secciones de tu sitio, pero no en otras.
Errores 404 y SEO
Comprende la relación entre los errores 404 y el SEO, incluidos los errores más comunes y las repercusiones de una configuración 404 inadecuada.
¿Puedo dejar páginas 404? (¡Google dice que está bien!)
Sí, ¡eso dicen! Pero, por desgracia, Google a veces dice cosas que no son -en sentido estricto-. exactas. (Ver: Los vendedores dicen que la mayoría de las declaraciones públicas de Google son falsas o engañosas.) Aquí tienes algunos puntos aclaratorios sobre por qué no debes permitir que las páginas sigan mostrando el 404 en la mayoría de los casos:
- Enlazar activamente a 404 es malo, para todos. Usuarios perdidos y, por tanto, oportunidades de ingresos perdidas.
- Tener demasiados 404, u otros errores del sitio, puede contribuir a una tasa de error global elevada en tu sitio, lo que puede hacer que Google desconfíe de tu sitio con el tiempo. Además, no querrás que Googlebot dedique tiempo a rastrear tus 404 en lugar de tu contenido funcional y de alta calidad, ¿verdad?
- Las URLs de error pueden tener valor SEO – que no puedes/recibes si no las arreglas.
- Cuando existe un argumento comercial para no redirigir algunas URL – considera la posibilidad de emitir un mensaje 410 «Gone» en su lugar. Casos de uso para no redirigir cosas: ¡el sitio de tu web fue pirateado y las URL en cuestión eran spam/problemas de malware! O compraste tu dominio a un tercero, y antes había páginas para un negocio diferente – y activamente no quieres que se asocien con tu nuevo negocio). Googlebot tiende a respetar los 410 mucho más rápidamente que los 404.
El problema con las 404, tal y como nosotros lo vemos, es que Googlebot parece tratarlas como «temporales». Si hay enlaces activos a páginas 404 -ya sea en tu sitio o en otro lugar de la web-, Google puede seguir comprobándolas, y lo hará, para ver cuándo se arreglan. Seguirá haciéndolo durante meses -y a veces años- después de que las URL dejen de funcionar (incluso cuando las arregles), si no las resuelves.
Puedes validar esto tú mismo consultando tus archivos de registro y viendo la cantidad/frecuencia con la que Googlebot accede a las páginas 404.
¿Los errores 404 son malos para el SEO?
Hay algunas discrepancias en Internet sobre si los errores 404 son malos para el SEO. Aquí tienes un desglose de por qué los 404 pueden ser perjudiciales tanto para el SEO como para la experiencia del usuario.
En teoría, al menos, los errores 404 son «malos» porque representan errores en tu sitio web (o en la web, pero relacionados con tu sitio web). Pero los errores ocurren, y se perdonan fácilmente a pequeña escala.
Dicho esto, es menos probable que un usuario que se encuentre con una página 404 vuelva a ese sitio más adelante. (Más adelante veremos cómo hacer que esto sea menos probable).
Demasiados errores de respuesta de encabezado 404 -o 403, 500, o realmente cualquier otro tipo de error 4{xx} o 5{xx}- en un sitio pueden crear una tasa de error global elevada frente a la tasa de éxito. Esto provoca problemas de confianza: si Google (o Bing, etc.) ve demasiados errores frente a páginas funcionales, no querrá enviar usuarios a tu sitio.
¿Por qué lo harían? Ese usuario se perderá y se enfadará, y tendrá una mala experiencia. Significaría que Google ha fracasado en su trabajo: ayudar al usuario a encontrar rápidamente & fácilmente la respuesta a su pregunta.
Si tu sitio web está enlazando activamente a un montón de páginas no funcionales, eso significa que estás pasando «page rank» (es decir, equidad SEO)… a la nada. Imagina un escenario en el que tu sitio web sea como un monedero con agujeroscon dinero goteando. ¡No es bueno!
Dicho esto, los errores 404 pueden ocurrir y ocurrirán pase lo que pase. Una página 404 que funcione correctamente notificará al administrador de la web que se ha producido el error, y dónde se ha producido. Entonces podremos arreglarlo mediante una redirección 301 (permanente). El usuario y los motores de búsqueda no tendrán que volver a encontrarse con este problema.
Punto clave: Algunos equipos consideran que los 404 son «malos» y, por tanto, evitan esta «maldad» inherente simplemente eligiendo no emitir un código de estado 404 en una página 404. El problema es que los errores que experimentan los usuarios reales pueden producirse y se producirán pase lo que pase. No «disparemos al mensajero». Los errores ocurren, ¡y los códigos de error nos ayudan a identificarlos! Emitir un código de estado 404 correcto significa que puedes más fácilmente encontrar cuestiones para arreglar los.
Así que… para decir lo obvio… ¡no te olvides de arreglarlos! Demasiados pendientes, 404 sin arreglar pueden ser activamente maloso pueden ser grandes oportunidades perdidas. Además, es una mala experiencia para el usuario.
¿Cuáles son los errores 404 más comunes?
Los errores y las configuraciones inadecuadas de las páginas 404 no son infrecuentes. He aquí algunos de los percances más frecuentes relacionados con las configuraciones 404.
- Redirigir a una página 404. Esto perjudica a todos. Los usuarios se pierden, los motores de búsqueda creen que todo va bien cuando no es así, y como no sabes cuándo ocurre, no puedes arreglarlo.
- Redirigir automáticamente a la página que supones que quieren los motores de búsqueda y los usuarios. Una solución arriesgada, que puede salir mal fácilmente (normalmente porque se les envía a contenido irrelevante, como tu página de inicio). Es mejor no suponer. Encuentra el problema y arréglalo.
- Servir un mensaje 404 en la página visualmente, pero no entregar el código de respuesta http 404 correspondiente. Esto perjudica a todos (por la misma razón que el punto anterior «redirigir a una página 404»).
- Servir un código de estado diferente a diferentes agentes de usuario. Por ejemplo, ¿estás enviando a Bingbot un 404 (no encontrado), y a los usuarios en un navegador un mensaje 200 (correcto)? A veces esto ocurre en diferentes dispositivos, por ejemplo, hay un 404 en móvil (y para Googlebot-Mobile) pero no en navegadores de escritorio.
- No encontrar & resolver errores críticos – de forma regular. Los equipos de ingenieros están ocupados y no quieren más trabajo, por lo que no es raro que se nieguen a hacerlo. Sobre todo cuando no comprenden plenamente el valor del trabajo para la empresa.
- Las SPA (Aplicaciones de Página Única) no pueden crear un 404 adecuado «fuera de la caja». Aquí tienes la forma correcta de solucionarlo.
¿Cuáles son las consecuencias de los errores de configuración 404?
Cuando se descuidan los errores 404 o se pasan por alto los errores de configuración, pueden producirse las siguientes repercusiones:
- Si se producen demasiados errores 404 en el sitio web, la propia URL 404 puede empezar a clasificarse (un problema que se produce cuando combinas una redirección a una página 404 con una URL que no emite una respuesta de encabezado http 404 adecuada).
- Páginas del sitio web que deben no se benefician del enlace, lo que reduce el potencial de posicionamiento general en los buscadores. Esto se traduce en menos tráfico hacia el sitio web en general, y no te queda más remedio que averiguar qué hacer a continuación para recuperar tu tráfico.
- Los usuarios ven una página 404 -en lugar de la página que deberían ver-, lo que a menudo provoca que abandonen el sitio.
Por desgracia, no es probable que estos usuarios vuelvan:
- Las páginas 404 tienen una alta tasa de rebote, es decir, el porcentaje de visitantes que visitan esta página en primer lugar (a menudo a través de un motor de búsqueda) e inmediatamente abandonan el sitio web.
- Las páginas 404 tienen un alto índice de salida, es decir, el porcentaje de visitantes que encuentran esta página al hacer clic en un enlace en algún lugar de tu sitio web, tras lo cual la abandonan inmediatamente.
Encontrar y corregir errores 404
Aprende las técnicas y procesos utilizados para identificar errores 404 y qué medidas puedes tomar para solucionarlos.
¿Cómo puedo encontrar errores 404 en mi sitio web?
Hay varias formas de localizar errores 404 en tu sitio. Sinceramente, te recomendamos que las utilices todas, ya que algunas herramientas pueden encontrar problemas que otras no ven.
- Rastrea tu sitio web. Hay un montón de rastreadores realmente buenos, entre ellos Screaming Frog para sitios pequeños, y DeepCrawl para sitios muy grandes/empresariales (ambos suelen funcionar en todas las situaciones, a menudo es una preferencia personal o una cuestión de presupuesto. Sitebulb es otra herramienta fantástica). Cada una de ellas te dirá qué errores de código de estado están vinculados en tu sitio.
- Comprueba en Search Console (GSC) el Informe de cobertura, en la sección Excluidos:
- Comprueba Google Analytics (GA) Busca títulos de páginas que contengan «no encontrado» o «404»: es una buena lista que te indica cuántas veces se ha accedido a una página determinada y, por tanto, puede ayudarte a priorizar mejor qué errores hay que solucionar primero.
- Comprueba tus archivos de registro. Esta es nuestra forma favorita de comprobar si hay errores 404 (¡y también otros problemas!), ya que puedes ver exactamente quién -también conocido como qué bot- provoca qué errores, en qué páginas concretas, con qué frecuencia, y la «tasa de error» total de tu sitio. Desgraciadamente, no todo el mundo puede acceder a los archivos de registro, dependiendo de tu plataforma y de tu host. Habla con tu equipo informático y/o de desarrollo para ver si es una opción para ti. Necesitarás una herramienta de análisis de registros para hacerlo; nuestra favorita es de Screaming Frog.
¿Cómo Puedo Encontrar Errores 404 En Las Páginas Desde Las Que Están (Supuestamente) Enlazadas?
Si tienes problemas para encontrar el error 4{xx} en la página desde la que está enlazado (por ejemplo, desde enlaces internos), aquí tienes algunas cosas que puedes probar. Si no puedes encontrar la URL utilizando ninguno de estos métodos, es probable que el problema sea utilizó pero se ha corregido.
1) Realiza periódicamente un nuevo rastreo del sitio para encontrar y corregir errores antiguos y nuevos.
- En primer lugar, comprueba si el enlace procede de un enlace entrante o un redirigir. El informe de enlaces internos 404 de Screaming Frog te dirá cuál es cuál; otros rastreadores como DeepCrawl y Sitebulb pueden darte datos similares.
- Si la respuesta es «AHREF», entonces se puede encontrar mediante un hipervínculo directo y puedes seguir los pasos que se indican a continuación.
- Si la respuesta es «Redirección HTTP», entonces el origen del enlace es otra URL enlazada, que luego redirige a tu página rota. Comprueba el archivo de redirección de la URL original (por ejemplo, en Apache o en un archivo Htaccess) o en el centro de administración/CMS de tu sitio web (por ejemplo, en un plugin de redirección de WordPress). Actualiza la ubicación de la redirección para que ya no apunte a una página rota.
2) Ver Fuente en la URL en cuestión y Control+Buscar (C+F) la ruta de la URL rota.
3) Ver fuente renderizada (Complementos de navegador de terceros como éste Plugin Ver fuente renderizada para Chrome) te mostrará el código fuente DESPUÉS de que el navegador lo haya renderizado (por ejemplo, después de que JavaScript y CSS se hayan ejecutado.) De nuevo, C+F para encontrar la ruta URL rota.
4) Utiliza Google Analytics y busca «404» o «Página no encontrada» en el Título. Una vez acotada la URL infractora, haz clic en el panel de Navegación para encontrar las páginas anteriores en esa ruta
5) Ejecuta la URL a través de la Herramienta Mobile-Friendly de GSC. Una vez ejecutada, haz clic en la pestaña HTML, y Copia + Pega el contenido de los resultados en un documento de Word, editor de texto, etc. De nuevo, C+F para encontrar la ruta URL rota.
Consejo profesional: Si utilizas la Herramienta Mobile-Friendly, obtendrás el código real renderizado por Googlebot: un recurso EXCELENTE para comprobar problemas como éste.
¿Cómo puedo encontrar errores 404 que no están enlazados en mi sitio web?
No es raro que se produzcan errores 404 en URLs… que nunca existieron en tu sitio web. Esto se debe generalmente a
- Problemas con Googlebot al rastrear JS, HTML o CSS incorrectamente. Encuentra estos errores a través de GSC > en el informe Excluidos. Afortunadamente, a medida que Google ha mejorado su capacidad para rastrear JS de forma eficaz, esto ocurre cada vez con menos frecuencia.
- Enlaces externos a tu sitio que tienen rutas rotas (por ejemplo, otro sitio web está enlazando activamente a una página no funcional de tu sitio web). Puedes descubrirlos con herramientas de terceros. Mi favorita es el informe de enlaces rotos de Ahrefs (una herramienta SEO de pago). Puedes exportar estos datos en un archivo CVS y, a continuación, rastrear cada URL en el modo Lista para ver qué enlaces 404 están activos hoy.
Consejos profesionales:
1) A veces verás errores 404 en GSC sin una «fuente», y a los que no puedes encontrar ningún enlace, ni interno ni externo. Dependiendo del volumen, puedes ignorarlos o redirigirlos de todos modos.
2) La caché web puede bloquear el proceso de control de calidad – es posible que una URL concreta no esté dando 404 actualmente, pero lo estaba – o que no lo estaba, pero ahora sí. Así que recuerda borrar la caché de tu sitio web, y también la de tu navegador, si experimentas alguna rareza.
3) Cuidado con crear «saltos de redirección» (una redirección de la página A a la página B y luego a la página C, por ejemplo) o «bucles de redirección» (por ejemplo, una redirección de la página D a la página E y luego de vuelta a la página F, ¡para que el visitante de la web no pueda acceder a ninguna URL funcional!) La mayoría de los buenos rastreadores pueden ayudarte a identificarlas en acción.
4) Ten en cuenta que no vale la pena redirigir todos los enlaces externos. Si el enlace roto procede de un sitio web de spam o de muy poco valor, es mejor que lo ignores. Puedes determinar esta respuesta por ti mismo, de nuevo mediante herramientas de pago de terceros O mediante una inspección visual manual. Algunos ejemplos de formas de determinar la calidad rápidamente son DR (valoración de dominio) y UR (métricas de valoración de URL) de Ahref, DA (autoridad de dominio) de Moz, o puntuaciones de Spam. Más información sobre el examen de errores para determinar lo que debes corregir.
¿Cómo se solucionan los errores 404 y cómo se pueden evitar?
Hay varias formas de solucionar los errores 404, dependiendo de la configuración/plataforma de tu sitio y de las capacidades/prioridades de tu equipo de desarrollo de software. Pero la forma más sencilla de solucionar un error 404 es implementar un redirección 301.
- Es posible que puedas implementar esto por ti mismo en el centro de administración de tu sitio web. Si es así, ¡ésta es la forma más fácil de hacerlo! Sólo tienes que elegir la mejor nueva URL a la que redirigir esta página (idealmente algo muy relevante.)
- A veces tendrás que pasar por tu equipo de software o de TI. No es raro que se opongan a hacer este trabajo, ya sea por completo o por la cantidad de cosas que hay que implementar (a veces son muchas). No siempre ven el valor, y están muy ocupados trabajando con otros profesionales de la empresa. En general, es algo por lo que recomendamos luchar, dentro de unos límites. Más información a continuación.
¿Puedes evitar que se produzcan errores 404? No. Son sólo una realidad del mundo, e ignorarlos no ayudará. Considera los 404 como una «deuda técnica» que tienes que encontrar/evitar/resolver periódicamente.
Quieres saber más sobre redirecciones? Semrush puede ayudarte¡!
¿Cómo puedo solucionar los errores Soft 404?
Parte 1: Examina tu lista GSC «Soft 404» para asegurarte de que los problemas encontrados son realmente problemas que hay que solucionar… porque no siempre lo son.
Para ello, exporta las URL de error «Soft 404» de GSC, e inspecciónalas 1) manualmente (visualmente: ¿parece que tienen contenido?), 2) mediante un rastreador de comprobación de códigos de estado (por el código de estado real que emiten), y potencialmente 3) mediante una auditoría de JavaScript.
Un caso de uso fascinante sobre los Soft 404 fue compartido por el increíble Paige Ford: «Descubrimos varios Soft 404 en artículos válidos del Centro de Ayuda, y teorizamos que Google no los indexaría porque los artículos de ayuda explicaban códigos de error, en los que esos mensajes podían malinterpretarse como mensajes 404. Mantuvimos los códigos de error (que no eran 404 ni 500) pero eliminamos el mensaje de error, y Google acabó indexándolo.»
- Para los elementos que eran errores y quieres activamente que esas URL se indexen -y crees que ahora están bien- envíalos para su indexación a través de GSC.
- Para los elementos que no son una prioridad para indexar, tú puede ser capaz de ignorarlos. Realmente depende de cuántos haya: ¡no dejes que haya tantos que no veas problemas reales y auténticos!
Parte 2: Comparte tu lista vetada de problemas con tu equipo de desarrollo de software o soluciónalos directamente. En la mayoría de los casos es una de las siguientes:
- No es una página válida a la que los motores de búsqueda deberían acceder o indexar de todos modos. En este caso, puedes bloquear la página/ruta de la página a través del archivo Robots.txt, o a través de la herramienta Eliminar URL en GSC si necesitas desindexarla.
- Es una página que debería haber emitido un error 404, pero no lo hizo. Tu equipo de software tendrá que indagar para entender por qué ocurre esto y resolverlo. Una vez que vuelva a emitir correctamente un 404, puedes pasar a la parte 3.
- Hay un problema de rastreo o renderizado de JavaScript que provoca que el contenido sea visible para los usuarios, pero no para los robots de los motores de búsqueda.. Para solucionar este problema, puedes utilizar la herramienta Inspeccionar URL en GSC, o utilizar herramientas de representación como Ver fuente renderizada, la información sobre herramientas de Inspeccionar elemento de tu navegador, o el HTML que se representa desde la Herramienta Mobile-Friendly.
Parte 3: Sigue los pasos descritos anteriormente para arreglar los 404 normales.
¿Cómo se gestionan los errores 404 en Javascript?
Javascript y las Páginas de Aplicación Única (SPA) presentan retos únicos en el manejo de los 404 y otros códigos de estado.
Con las SPA, los usuarios obtienen el mismo HTML independientemente de la URL que estén visitando. Descargan el código de la aplicación JavaScript del sitio, y la SPA muestra el contenido apropiado.
Aunque la experiencia se parece mucho a navegar por varias páginas, sólo estás viendo una aplicación JavaScript y técnicamente sólo una «página» (por el número real de páginas index.html que se sirven).
Por tanto, las páginas de error 404 en las SPA no funcionan igual. A diferencia de las páginas estáticas, Google no tiene forma de saber qué «páginas» de las SPA son válidas y cuáles no. Y esto puede crear problemas para el SEO.
Para cubrir estas lagunas JS 404, desglosamos varias soluciones potenciales y ejemplos de código Apache/Nginx en un post relacionado que se encuentra aquí. Dos de esas técnicas son:
- Solución de inclusión: Una de las opciones más sencillas para los sitios más pequeños es la solución de la lista de inclusión, que consiste en crear un mapa del sitio «incluido» y añadir un bloque de código de configuración que devuelva explícitamente un 200 para las URL de la lista.
- Solución de exclusión: Como la técnica de la lista de inclusión pero a la inversa, puedes crear un mapa del sitio con las URL a las que sabes que la gente accede pero que no son válidas en el sitio. Cuando se añaden y eliminan páginas con frecuencia, la solución de exclusión puede funcionar mejor.
Cómo examinar y priorizar los 404 y otros errores para su reparación
Aunque generalmente recomendamos arreglar los 404 y otros errores mediante redireccionamientos 301, hay veces en que arreglarlos todos no es posible, o no es factible, a menudo debido a limitaciones técnicas, profesionales de la empresa que compiten entre sí o políticas internas. (¡A veces no es una batalla que merezca la pena librar!)
Así es como enfocamos este proceso de «vetado de errores y priorización»:
- Identifica las páginas de error que experimentan los visitantes del sitio web. Utiliza Google Analytics y/o tus archivos de registro para identificarlas. Priorízalas por frecuencia y, potencialmente, por los ingresos obtenidos históricamente (por ejemplo, ¡las páginas de redireccionamiento que te hicieron ganar mucho dinero en el pasado!)
- Identifica las páginas de error que experimentan los robots de los motores de búsqueda. Utiliza tus archivos de registro para identificar estas páginas. Priorízalas por frecuencia y longevidad (en otras palabras: ¿Googlebot sigue accediendo a una página meses y años después de haberla retirado? Si es así, plantéate redireccionarla. Googlebot la comprueba repetidamente por una razón).
- Identifica las páginas de error que tienen backlinks vivos/funcionales hacia ellas. Las URL con más/mejores backlinks son más importantes para redireccionar, de modo que puedas beneficiarte del poder de estos enlaces existentes; esto se denomina «construcción de backlinks rotos».
También puedes considerar la posibilidad de utilizar las Prioritization Insights de GSC en el informe de errores; supuestamente, están en orden de prioridad.
Si las URL que ves en GSC no cumplen ninguno de los requisitos anteriores, puedes ignorarlas (y dejar que sigan dando 404). Como alternativa, considera la posibilidad de utilizar un código de estado 410 (Perdido) en lugar de un 404. Google tiende a respetar los errores 410 más rápidamente (por ejemplo, desindexándolos y dejando de rastrearlos).
¿Cómo se controla una página 404?
Aquí tienes nuestro proceso paso a paso para confirmar si tu página 404 funciona como esperabas:
1) Encuentra una URL 404 & audítala manualmente.
- Esto puede ser tan sencillo como poner una cadena de letras al azar después del dominio / página de inicio y hacer clic en enter, por ejemplo en https://thegray.company/i-made-this-up
- TEN EN CUENTA, sin embargo, que los sitios más grandes y complejos pueden tener diferencias de funcionalidad en las distintas secciones del sitio – en otras palabras, la página 404 podría funcionar en algunos lugares de tu sitio, pero no en otros.
- Si tienes un sitio pequeño, no te preocupes por esto. Si tienes un sitio grande, como mínimo, prueba estos pasos de control de calidad dentro de cada sección principal del sitio (por ejemplo, https://thegray.company/servicios/i-made-this-up Y https://thegray.company/clientes/i-made-this-up). Supervisa GSC con más atención para detectar errores 404 y errores soft 404, por si acaso.
2) Confirma que la página está emitiendo la respuesta 404 correcta. Recomendamos httpstatus.io. Copia + pega la URL falsa en el campo y haz clic en el botón Comprobar estado (puedes comprobar varias URL a la vez, y también probar a través de diferentes agentes de usuario):
- Confirma que emite un código 404. (Aclara y repite según sea necesario para los 404 de otras secciones del sitio)
- No debe: redirigir (301 o 302) a un 404, NI emitir un estado 200 (ok).
3) Aparte de esto, los principales elementos a los que hay que prestar atención son los relacionados con la usabilidad: si/cuando el usuario entra en la página, ¿le ayudas con éxito a encontrar el camino de nuevo? ¿Cómo puedes hacerlo mejor? Lee más sobre esto y sobre las mejores prácticas para las páginas 404. (También puedes obtener más información sobre el control de calidad para SEO).
¿Deben indexarse los 404?
No, definitivamente no. ¡No indexes las páginas de error! Eso es como preguntar a ¡una experiencia de usuario menos ideal!
(Esta pregunta ha sido formulada por Sarah McDowellque necesita responder a esta pregunta para sus clientes. Sarah copresenta Podcast de la Comunidad WTSEO – no dejes de visitarlo!)
Ejemplos de páginas 404 y buenas prácticas
Mejora tu destreza en el manejo de las páginas 404 con ideas del siguiente nivel. Explora las mejores prácticas y los mejores ejemplos sobre cómo utilizar eficazmente las páginas 404.
¿Cómo debe funcionar una página 404? (¡La experiencia del usuario importa!)
Las mejores páginas 404 deben ofrecer algo más que un mensaje acorde con la marca y unos próximos pasos claros. También deben cumplir ciertas normas de UX y funcionalidad, como se indica a continuación.
- Paso 1: Permanece en la URL a la que se llamó, (por ejemplo: https://www.thegray.company/i-made-this-up/) – por ejemplo, NO redirijas esto a otra página como /404.html. El error debe cargarse en la URL con el error, para que podamos ver el error -dónde se produjo- y, por tanto, solucionarlo adecuadamente.
- Paso 2: El servidor debe emitir un «error de estado http» 404. Utiliza una herramienta como httpstatus.io para comprobar que funciona.
- Paso 3: Un mensaje 404 -visible para el visitante del sitio web, en la página- debe explicar claramente lo que ha ocurrido e incluir recursos, enlaces e, idealmente, la posibilidad de buscar en tu sitio para encontrar lo que estaban buscando. Más abajo encontrarás más información sobre cómo hacer esto amigable para la UX.
¿Cuáles son las mejores prácticas para crear páginas 404 fáciles de usar?
Hay varias cosas que puedes hacer para mejorar la página 404 de tu sitio web – y la probabilidad de que los visitantes se queden y visiten el resto de tu sitio web. A continuación se indican algunas de las mejores prácticas más importantes de la página 404 que debes tener en cuenta.
- Explica, en inglés sencillo (o en el idioma al que se dirija tu sitio), qué ha ocurrido exactamente. Esto es en beneficio del usuario…. ¡porque eso importa!
- Incluye un enlace a tu página de contacto para que los usuarios puedan intentar resolver el problema con tu ayuda.
- Incluye un mapa del sitio HTML simplificado (incrustado en el cuerpo de la página) para que el usuario pueda encontrar su propio camino. Haz un seguimiento de lo que se busca con más frecuencia y haz que esos recursos sean más fáciles de encontrar.
- Considera la posibilidad de añadir una barra de búsqueda a la plantilla de la página 404, para que el usuario pueda buscar el recurso si aún no aparece en la lista.
- Asegúrate de que el título de la plantilla 404 incluye el texto «404» o «Página no encontrada» – de esta forma podrás averiguar a qué páginas acceden los visitantes de tu sitio, y la frecuencia con la que esto ocurre, en Google Analytics (o la herramienta de seguimiento analítico que elijas).
¡Diviértete con ello! Extiende la personalidad de tu marca & conecta con tu público. Puedes encontrar ejemplos de grandes implementaciones de esto aquí.
¿Cuáles son las mejores páginas 404?
Basándonos en algunas de las mejores prácticas de páginas 404 mencionadas anteriormente, hemos recopilado varios de nuestros ejemplos favoritos. Además de utilizar la lógica e incluir formas útiles de hacer que los usuarios vuelvan a la pista, mantén tus páginas 404 dentro de la marca con personalidad y creatividad añadidas.
Ponte en contacto con nosotros si necesitas ayuda para arreglar o mejorar la funcionalidad de la página 404 de tu sitio web: ¡nos encantará ayudarte!