Gli errori 404 influenzano il mio sito?

Pochissimi giorni fa Aruba per un principio d’incendio alla sala UPS ha messo offline gran parte della rete italiana. Tantissimi webmaster si stavano domandando fin dai primissimi minuti successivi all’evento se il downtime potesse influenzare in qualche modo il valore di posizionamento delle proprie pagine. Google, in questi giorni ha pubblicato un post sul suo blog che descrive per bene come si comporta il suo algoritmo quando un contenuto non è raggiungibile. Ho pensato di tradurlo per chiarire il dubbio di tanti. 🙂

˜˜˜

Perciò eccoti, stai seguendo i tuoi affari, stai usando i Webmaster Tools per controllare quant’è favoloso il tuo sito… ma, aspetta! La pagina di raccolta degli errori è piena di errori 404 (Not found)! E’ imminente il disastro???

Errori di crawling - Googler webmaster tools

Non spaventarti, mio giovane padawan. Guardiamo meglio gli errori 404 e come essi influenzano (o meno) il tuo sito.

Domanda: Gli errori 404 riportati nella Webmaster Tools influenzano il ranking del mio sito?
Risposta: Gli errori 404 sono una parte del web perfettamente normale; internet è in continua evoluzione, nuovi contenuti nascono, vecchi contenuti muoiono, e quando muoiono (idealmente) ritornano un codice di risposta HTTP 404. I motori di ricerca sono a conoscenza di questo, abbiamo errori 404 anche sui nostri siti (Google n.d.r.), come puoi vedere sopra, e li troviamo ovunque nel web. Nei fatti, attualmente Google preferisce che, quando ti liberi di una pagina sul tuo sito, ti assicuri che essa ritorni un appropriato codice di risposta 404 o 410 (al posto di “404 soft”). Tieni in mente che per permettere ai nostri crawler di vedere i codici di risposta HTTP di un URL, esso dev’essere accessibile al crawler – se l’URL è bloccato dal tuo file robots.txt Google non sarà in grado di visitarlo e vedere il suo codice di risposta. Il fatto che alcuni URLs nel tuo sito non esistono più / ritornano un 404 non influenza come gli altri URL del tuo sito (quelli che ritornano 200 (Successful)) risultano nei nostri risultati di ricerca.

Domanda: Così i 404 non disturbano il mio sito del tutto?
Risposta: Se alcuni URL sul tuo sito rispondono con un 404, questo fatto da solo non ti disturba o conta negativamente per i tuoi risultati nelle ricerche di Google. Comunque, ci possono essere altre ragioni per cui tu vorresti gestire alcuni tipi di 404. Per esempio, se alcune delle pagine che ritornano un errore 404 sono pagine di cui ti occupi, dovresti approfondire perché Google sta vedendo risposte 404 quando le visita! Se tu vedi un errore di digitazione di un URL valido (ad esempio www.example.com/stuepndo invece di www.example.com/stupendo), è molto probabile che qualcuno ha linkato verso quella pagina del tuo sito ed ha fatto un errore di digitazione. Invece di ritornare un errore 404, tu potresti redirezionare i visitatori con un codice 301 dall’URL scritto male all’URL corretto e raccogliere il traffico previsto per quel link. Puoi anche assicurarti che, quando un utente finisce su una pagina 404 sul tuo sito, tu lo aiuti a trovare quel che stava cercando invece di dirgli semplicemente “404 non trovato”.

Domanda: Parlami ancora dei 404 soft.
Risposta: Un errore 404 soft è quando un server web ritorna un codice di risposta diverso da 404 (o 410) per un URL che non esiste. Un esempio comune è quando il proprietario di un sito vuole ritornare una pagina 404 attraente con informazioni d’aiuto per i suoi utenti, e pensa che per servire contenuti agli utenti debba ritornare un codice di risposta 200. Non è così! Tu puoi ritornare una codice di risposta 404 mentre servi qualsiasi contenuto tu voglia. Un altro esempio è quando un sito redireziona qualsiasi URL sconosciuto alla sua homepage invece di ritornare errori 400. In entrambi i casi abbiamo effetti negativi nel interpretare e indicizzare il tuo sito, così ti raccomandiamo d’assicurarti che il tuo server risponda con il codice di risposta corretto per contenuti non esistenti. Ricordati che solo perché una pagina dice “404 Non trovato”, non significa che stia attualmente ritornando un codice di risposta HTTP 404 – usa la funzione Visualizza come Googlebot nei Webmaster Tools per verificarlo. Se non sai come configurare il tuo server per ritornare i giusti codici di risposta, controlla la documentazione di aiuto del tuo web host.

Domanda: Come so quando un URL dovrebbe ritornare un 404, un 301 o un 410?
Risposta: Quando rimuovi una pagina dal tuo sito, rifletti se quel contenuto si sta spostando da qualche altra parte, o se non hai in mente di avere quel tipo di contenuto sul tuo sito. Se stai movendo quel contenuto verso un nuovo URL, dovresti redirezionare con codice 301 il vecchio URL verso il nuovo URL – in quel modo quando gli utenti arrivano sul vecchio URL cercando per quel contenuto, saranno automaticamente redirezionati verso qualcosa di rilevante a cosa stavano cercando. Se stai rimuovendo quel contenuto interamente e non hai niente che possa interessare gli stessi bisogni dell’utente, allora il vecchio URL dovrebbe ritornare un codice 404 o 410. Attualmente Google tratta i 410 (Gone) allo stesso modo dei 404 (Not Found), così è indifferente per Google se ritorni l’uno o l’altro codice.

Domanda: Molti dei miei errori 404 sono per URL strani che non sono mai esistiti sul mio sito. Che succede con essi? Da dove arrivano?
Risposta: Se Google trova un link da qualche parte nel web che punta ad un URL del tuo dominio, potrebbe tentare di indicizzare quel link, sia che qualche contenuto esista lì o meno; e quando lo fa, tu dovresti ritornare un errore 404 se non c’è nulla da trovare lì. Questi link potrebbero essere causati da qualcuno che ha fatto un errore di digitazione quando ti ha linkato, ovvero da alcuni errori di configurazione (sei link sono generati automaticamente, ad esempio da un CMS), o dalle funzioni potenziate di Google per riconoscere e indicizzare link inclusi in Javascript o altri contenuti inclusi nel documento; o possono essere parte di un check veloce da parte di Google per vedere come gestisca gli URL sconosciuti il tuo server. Google non sa quali URL sono importanti per te rispetto a quelli che sono pensati come 404, così ti mostriamo tutti i documenti 404 che troviamo sul tuo sito e tu decidi quali, se ne esistono, richiedono la tua attenzione.

Domanda: Qualcuno ha esplorato il mio sito ed ha causato una serie di 404 nel processo. Essi sono tutti URL “reali” con altri codici fissati in coda, come “http://www.example.com/images/kittens.jpg” width=”100″ height=”300″ alt=”kittens”/></a… Disturberà il mio sito?
Risposta: Generalmente non hai bisogno di preoccuparti riguardo i “link rotti” come questi. Google capisce che i proprietari dei siti hanno poco se non alcun controllo sulla gente che esplora e scansiona il loro sito, o chi li linka in maniere strane. Se sei un mago con le espressioni regolari, tu potresti considerare di redirezionare questi URL come descritto qui, ma generalmente non è importante preoccuparsi di loro. Ricorda che tu puoi anche compilare una richiesta di takedown quando credi che qualcuno stia rubando i contenuti originali dal tuo sito.

Domanda: La scorsa settimana ho fissato tutti i 404 che Webmaster Tools riportava, ma sono ancora elencati nel mio account. Significa che non li ho sistemati correttamente? Quanto tempo è necessario per vederli scomparire?
Risposta: Guarda nella colonna “Detected” nella pagina degli errori di crawling – questa è la data più recente in cui abbiamo riscontrato ogni errore. Se la data o le date in quella colonna sono precedenti al tempo in cui hai sistemato gli errori, allora significa che non abbiamo incontrato quegli errori da quella data. Se le date sono più recenti, significa che stiamo continuando a vedere questi errori 404 quando noi visitiamo il sito.

Dopo aver implementato una soluzione, puoi verificare se il nostro crawler vede il nuovo codice di risposta usando Visualizza come Googlebot. Controlla un po’ di URL e, se rispondono correttamente, questi errori dovrebbero iniziare presto a scomparire dalla tua lista di errori di crawling.

Domanda: Posso usare il tool di rimozione di Google per fare scomparire gli errori 404 dal mio account più velocemente?
Risposta: No; lo strumento di rimozione degli URL rimuove gli URL dai risultati di ricerca di Google, non dal tuo account su Webmaster Tools. E’ disegnato per richieste urgenti di rimozione solamente, e usarlo non è necessario quando un URL ritorna già un errore 404, perché un URL verrà rimosso dai nostri risultati di ricerca naturalmente nel tempo. Guarda la parte finale di questo post per maggiori dettagli su cosa lo strumento di rimozione degli URL può fare e cosa non può fare per te.

Fonte: Official Google Webmaster Center – Do 404s hurt my site?

Emanuele

PS: se cercate un hosting con uptime garantito, il mio vi rimborsa mensilmente quando il downtime è inferiore al 100%.

10 commenti » Scrivi un commento

  1. All’inizio dell’articolo:
    ” … alla sala UPS ha messo online gran parte della rete italiana”.

    Penso che tu volessi dire “offline”. 😉

    • Valeria, è un post tecnico, se non hai un sito non ti può interessare… 😛
      camu, è scritto in fondo al post! 😮
      Ciao,
      Emanuele

  2. ma che cavolo io avevo tolto alcune pagine e si era riempito di 404 e cercavo di toglierli manualmente invano! 😀
    post veramente utile grazie! 😀

  3. ho provato con il tool di rimozione di Google , oppure escludendo i link con robots.txt -> ok ora insultatemi e prendetemi in giro! 😛

    • La soluzione più elegante comunque rimane quella di redirezionare quei link verso contenuti utili all’utente attraverso opportune regole di ReWrite nel file .htaccess.
      Io odio far morire i link per un’antica regola del web che diceva che “un buon link” (concetto che la gente sconosce ma che nell’internet primordiale degli elenchi cartacei era un must) non muore mai. 🙂
      Ciao,
      Emanuele

  4. Scusate ho cambiato completatmente sito, cioè dal vecchio ho instalalto un nuovo sito, questo dopo circa un mese, e ho errore 404 tipo

    Google non ha potuto eseguire la scansione di questo URL perché rimanda a una pagina che non esiste. In genere gli errori 404 non influiscono negativamente sul rendimento del sito nella ricerca, ma puoi utilizzarli per migliorare l’esperienza degli utenti.

    Azione consigliata
    Controlla la pagina Errori di scansione in Strumenti per i Webmaster.
    Verifica che le pagine del tuo sito non rimandino a pagine inesistenti. (Se un altro sito riporta un link non funzionante al tuo sito, è possibile che Google elenchi tale URL ma che tu non sia in grado di correggere l’errore).

Rispondi a Emanuele Annulla risposta

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.