Questo articolo apparteneva al vecchio blog (blog.danilopetrozzi.it), per cui le informazioni potrebbero non essere più aggiornate ed attendibili.

Parasite hosting: cos’è, come si fa, come ci si protegge

Attenzione: con questo post non voglio incitare nessuno a fare parasite hosting, anzi. Con le informazioni contenute nel post, spero che i professionisti onesti siano più consapevoli del problema e abbiano più strumenti per debellarlo.

Il parasite hosting è una vera e propria piaga della SEO. Prima ancora di introdurti l’argomento, ti mostro una SERP inglese: prova a vedere se noti qualcosa di strano:

parasite hosting su googleQuesta è la prima pagina per quella determinata keyword ma.. nessuno di questi domini vende prodotti farmaceutici ne tantomeno parla di trattamenti!

Il primo sito in SERP è una confessione religiosa, il secondo parla di iniziative benefiche/sociali , il terzo si occupa di ferrovie e il quarto si occupa di politiche sociali europee!

Perché questi siti si posizionano così bene per keyword che non c’entrano proprio nulla? E’ l’effetto del parasite hosting di cui sono stati vittima.

Cos’è il parasite hosting

Il parasite hosting (hosting parassita) è una pratica che prevede l’inserimento di contenuti all’interno di siti che non hanno autorizzato l’operazione o che ne sono completamente all’oscuro.

Nella maggiorparte dei casi, parasite hosting significa cracking: il malintenzionato riesce a entrare nell’FTP o nel database della vittima, così da poter creare pagine a piacimento.

Se il parasite hosting è effettuato in questo modo (senza il consenso dell’host in esame), spesso è configurabile il reato di cui all’articolo 615-ter del codice penale italiano. Commette un reato, infatti, chi abusivamente si introduce in un sistema informatico o telematico protetto da misure di sicurezza ovvero vi si mantiene contro la volontà espressa o tacita di chi ha il diritto di escluderlo

Perché viene fatto

Nessuno correrebbe rischi così elevati se non ci fossero dei ritorni di pari livello. Chi fa parasite hosting spesso lo fa perché (purtroppo) è un metodo molto efficace per frodare i motori di ricerca come Google. In pratica è una delle più efficaci tecniche di black hat SEO.

Come viene fatto

Le azioni messe in atto dal cracker sono quasi sempre le stesse:

  • 1) Buca un FTP/database in modo da avere libero accesso al sito
  • 2) Crea una o più pagine focalizzate su keyword di suo interesse (spesso è spam puro – keyword ultracompetitive)
  • 3) Crea una notevole quantità di backlink verso questi nuovi URL appena generati
  • 4) Quando il sito si posiziona su Google per le keyword prescelte, il cracker inserisce un redirect (per soli umani) in modo da riendirizzare il traffico sui suoi siti (dove vende il prodotto/servizio)

Nell’esempio della SERP che vi ho fatto in alto, infatti, cliccando su uno qualsiasi di quei risultati si viene reindirizzati su altri domini completamente differenti.

Perché Google non interviene

In realtà, Google cerca in tutti i modi di “intervenire”, ma individuare i casi di parasite hosting non è semplicissimo (per lui).

Avete presente quando al punto 4) della scaletta ho detto che “il cracker inserisce un redirect (per soli umani)”? Significa che il redirect colpisce solo gli umani, ma non i bot (incluso Googlebot). Così facendo, l’ipotetica pagina X iniettata dal cracker sul dominio Nasa.gov per Google è identica a qualsiasi altra pagina presente sul sito. Dato che si comporta come tutte le altre, Google non si accorge immediatamente della beffa.

Come fanno i cracker a reindirizzare solo gli umani?

Con PHP è possibile filtrare il passaggio di umani/bot con pochissime righe. A patto di conoscere un minimo il codice (array, loop e altre cosette facile), chiunque è in grado di creare uno script per reindirizzare gli umani.

Se io fossi un malintenzionato che vuole creare pagine parassita, che poi, una volta posizionate su Google reindirizzino al mio sito www.spam.com, allora inserirei questo codice nelle neo-pagine:

Lo script controlla l’HTTP_REFERER della visita e se contiene le stringhe “google”, “yahoo” o “bing”, allora reindirizza verso il money-site www.spam.com

Quando un utente clicca su un risultato in SERP, l’http_referer è sempre il motore di ricerca di provenienza (es. ‘http://www.google.it/’) per cui, grazie a questo codice, chiunque cliccasse sulla pagina parassita all’interno di una SERP, verrebbe reindirizzato al mio sito spam, altrimenti proseguirebbe sulla pagina reale. 

Per essere sicuri al 100% che i crawler non vedano per sbaglio il redirect, è possibile “wrappare” tutto il codice dentro un if() che esclude esplicitamente i bot:

Ok, ora conosco il parasite hosting. Come mi proteggo?

La prima regola in assoluto è: mantieni aggiornati i tuoi siti. Se usi CMS come WordPress, Joomla, e così via, ricordati di mantenerli aggiornati all’ultima versione.

Per fare più vittime possibili, spesso i cracker dedicano la loro attenzione ai CMS più diffusi in modo da seminare più “parassiti” possibili.

WordPress e Joomla 1.5 sono in assoluto i due CMS più scelti dai cracker per effettuare il parasite hosting. Se invece i cracker cercano siti molto autorevoli, spesso puntano direttamente ai massimi livelli: ecco perché vengono bucati siti .edu, .gov, ecc, che poi finiscono in prima pagina per chi cerca keyword ultra-spam. (proprio come la SERP in cima all’articolo)

Oltre all’aggiornamento del CMS, valgono tutte le solite regole per la sicurezza: password FTP/DB/backend molto robuste. Limitare il numero di persone che hanno accesso ai pannelli e alle credenziali. Utilizzare solo plugin autorevoli, e così via.

Diagnosticare il parassita

Primo metodo: Uno dei metodi più rapidi per capire se si è vittima di parasite hosting è controllare Analytics: se c’è un aumento di traffico anomalo senza che le keyword tradizionali si siano mosse, è probabile che qualche pagina parassita si sia posizionata e abbia incominciato a fare il suo “sporco lavoro“.

Secondo metodo: controllare i backlink in entrata. Potete usare qualsiasi tool di analisi, ma se potete puntate direttamente al top, ossia MajesticSEO (il fresh index ci torna utile). Controllate i backlink recenti: se c’è un aumento esponenziale dei link in entrata di cui non eravamo a conoscenza, probabilmente è il cracker nella fase 3) della scaletta (sta creando dei backlink per far posizionare la pagina parassita sul nostro sito)

Terzo metodo: un metodo molto spartano è quello di cercare il proprio sito su Google associato a keyword notoriamente spammose. Ad esempio potresti effettuare diverse ricerche del tipo:

site:miodominio.it *keyword-spam*

Dove al posto di keyword-spam inserisci numerose keyword che ti vengono in mente (solite cose tipo farmaci, casino, gambling, perdita di peso, prestiti, e così via)

Conclusioni

Google, negli ultimi mesi, ha intensificato gli sforzi per ridurre questo fenomeno (grazie a una minore facilità di aggressione delle SERP con i domini “ospite”) ma la strada è ancora lunga dato che, come avete visto con lo screenshot in alto, le keyword spam vengono ancora attaccate solo e unicamente con le pagine parassita.

Danilo petrozzi

Ciao! Io sono Danilo Petrozzi, il fondatore di Eternal Curiosity. Oltre a essere un senior SEO Specialist e un Web Developer, è dall'età di 9 anni che mi appassiono a qualsiasi cosa ruoti intorno al web e all'informatica in generale.

Lascia un commento