Canali
Magnifier, ingrandimento, lente, lente d'ingrandimento

Google Dorking e web crawler: affinare le ricerche e scaricare interi siti in locale

25/10/2010
- A cura di
Internet - In questo articolo analizzeremo alcune tecniche con le quali possiamo scandagliare a fondo il web... e visualizzare alcuni siti anche quando la connessione ad Internet non è disponibile.

Download

Tag

Passa qui con il mouse e visualizza le istruzioni per utilizzare i tag!

google (1) , web (1) , download (1) , google hacking (1) , dork (1) , crawler (1) , wget (1) .

Valutazione

  •  
Voto complessivo 3 calcolato su 3 voti

Quando ci affidiamo ad Internet per la ricerca di un'informazione, la prassi è quella di dirigerci presso il nostro motore di ricerca di fiducia e iniziare a scrivere nell'apposito campo le parole che pensiamo siano congrue con l'informazione voluta.

In risposta, il motore di ricerca ci elencherà, secondo un ordine ben preciso, tutte le pagine web indicizzate che contengono le chiavi di ricerca immesse.

Normalmente siamo abituati immettere come chiave di ricerca una o più semplici parole. Tuttavia il motore di ricerca Google permette di inserire delle particolari chiavi dette operatori e metacaratteri con le quali possiamo estendere la ricerca oltre il semplice testo, scandagliando file, directory e raffinare i risultati.

Google Dorking

Che si chiami Google Hacking, Google Dorking o semplicemente Dorking non ha importanza in quanto ci si riferisce alla medesima tecnica, ossia quella di utilizzare gli operatori messi a disposizione da Google per effettuare una ricerca più approfondita.

C'è una lista di metacaratteri e operatori che ora vi elencheremo con spiegazione ed esempi. Per utilizzarli basta scriverli normalmente nel campo di ricerca uniti alla nostra chiave di ricerca.

Cominciamo con un esempio di una normale chiave di ricerca:

Cercagoogle1.jpg

Lanciando questa ricerca Google ci elencherà quindi tutte le pagine web che contengono la parola settembre.

Proviamo ora ad inserire un operatore...

Cercagoogle2.jpg

Questa ricerca ci elencherà tutte le pagine web all'interno del sito www.vacanze.it che contengono la parola settembre.

Abbiamo quindi usato l'operatore site, che, come abbiamo intuito, ci permette di restringere la ricerca su di un sito.

Descrizione degli operatori principali di Google

Di seguito l'elenco degli operatori messi a disposizione da Google:

  • intitle: elenca le pagine web il cui titolo contiene la parola chiave immessa - ESEMPIO: intitle:riassunto. Trova tutte le pagine il cui titolo contiene la parola riassunto
  • inurl: elenca le pagine web che hanno nel proprio URL la parola chiave immessa - ESEMPIO: inurl:pub. Trova tutte le pagine che contengono la parola pub nel proprio URL
  • site: Restringe la ricerca alle pagine web del sito specificato - ESEMPIO: site:www.megalab.it. Trova tutte le pagine web del sito www.MegaLab.it
  • link: Elenca le pagine web che contengono un link al sito specificato nella parola chiave - ESEMPIO: link:www.megalab.it. Elenca tutte le pagine web che contengono un link verso www.MegaLab.it
  • filetype: Elenca i file presenti nel web avente l'estensione specificata - ESEMPIO: filetype:mp3. Elenca tutti i file MP3 presenti nel web

Metacaratteri di Google

Oltre ai precedenti operatori, ce ne sono diversi altri che possono essere affiancati ai primi:

  • AND: Questo è un operatore booleano e va inserito tra due parole chiave. Il risultato sarà quindi tutte le pagine web che contengono entrambe le chiavi di ricerca scritte - ESEMPIO: sport AND nuoto. Elenca tutte le pagine web che contengono le parole sport e nuoto
  • OR: Ecco un altro operatore booleano, come per il precedente va inserito tra due chiavi di ricerca e ne restituirà tutte le pagine che contengono o una parola o l'altra - ESEMPIO: sport OR nuoto. Elenca tutte le pagine web che contengono o la parola sport o la parola nuoto.
  • -: È il segno meno, svolge la funzione di esclusione. Va inserito attaccato all'operatore o parola da escludere dalla ricerca - ESEMPIO: gatto -site:www.animali.it . Elenca tutte le pagine web che contengono la parola gatto, tranne quelle nel sito www.animali.it
  • *: È l'asterisco e sostituisce una parola intera - ESEMPIO: pedale * automobile. Elenca tutte le pagine web che contengono pedale, una parola qualsiasi e automobile
  • ..: Sono due puntini e svolgono la funzione di un range numerico - ESEMPIO: negozi aperti il 6..14 luglio. Effettua una normale ricerca testuale ma dove al posto dei due puntini vengono cercati numeri compresi tra 6 e 14.

Come utilizzarli

Questi operatori possono essere usati così come li avete visti oppure in combinazione tra di loro, in modo da affinare ulteriormente la ricerca; ecco alcuni esempi:

  • ristorante -intitle:pesce site:www.paginegialle.it. Trova le pagine web all'interno di www.paginegialle.it che contengano la parola ristorante ma che nel loro titolo non hanno la parola pesce
  • intitle:gallina AND gallo. Trova le pagine web il cui titolo contenga la parola gallina e la parola gallo.

È inoltre possibile sfruttare questi dork per effettuare delle ricerche non convenzionali, come l'elencazione di particolari tipi di piattaforme di hosting, dei file di configurazione che qualche webmaster ha sbadatamente lasciato liberi nel proprio server o la pagina di qualche webcam pubblica...

Insomma abbinando i dork alla giusta chiave di ricerca possiamo ottenere con semplicità informazioni che altrimenti risulterebbero quasi irraggiungibili.

Se volete approfondire l'utilizzo dei Google Dork per effettuare delle ricerche più underground vi rimando a questo sito, dove potete trovare il Google Hacking Database, con descrizione ed esempi.

Per chi possiede Mozilla Firefox segnalo la presenza di un Add-on che permette di usufruire dei dork in maniera semplice e veloce.

Chiudendo la parte relativa al Google Dorking, voltiamo pagina e vediamo un'altra tecnica attuabile nel web...

Pagine
  1. Google Dorking e web crawler: affinare le ricerche e scaricare interi siti in locale
  2. Crawling
  3. Crawling in Linux

 

Segnala ad un amico

Tuo nome Tuo indirizzo e-mail (opzionale)
Invia a:
    Aggiungi indirizzo email
    Testo

    megalab.it: testata telematica quotidiana registrata al Tribunale di Cosenza n. 22/09 del 13.08.2009, editore Master New Media S.r.l.; © Copyright 2017 Master New Media S.r.l. a socio unico - P.I. 02947530784. GRUPPO EDIZIONI MASTER Spa Tutti i diritti sono riservati. Per la pubblicità: Master Advertising

    • Gen. pagina: 0.24 sec.
    •  | Utenti conn.: 33
    •  | Revisione 2.0.1
    •  | Numero query: 19
    •  | Tempo totale query: 0.11