Web Scraping Tool: come Estrarre Dati Dal web (free!)

web-scraping

Il petroliere – Paul Thomas Anderson

Oggi su internet troviamo una grande quantità di informazioni, così grande che si chiama big data. Il problema di avere tante informazioni però è che ci sovrastano e a quel punto non le utilizziamo più. Sappiamo invece che creare strategie di marketing data driven è fondamentale e per questo scopo esistono gli strumenti di web scraping che riescono ad estrarre i dati in modo veloce e facile.

Cos’è il web scraping:

La web scraping è l’attività che fanno i crawler (cioè robot che fanno la scansione dei siti) copiando i contenuti di un sito e incollandoli dove riteniamo opportuno (come ad esempio un file excel). Esistono diverse tipologie di estrazione dei dati e ovviamente cambiano in base al dato. Grazie agli strumenti di web scraping possiamo estratte testi, tabelle, numeri ecc.

 

Le Applicazioni possibili:

  • estrazione di testi dai social per una sentiment analysis
  • estrazione delle parole chiave per l’analisi semantica e la keyword research
  • estrazione dei prezzi dei prodotti per determinare il prezzo medio di mercato

 

TOOLS e Software free:

Esistono tantissimi tool per estrarre dati dal web, i più famosi sono php, java, phytone, excel ,r, c# ma sono tutt’altro che facili da utilizzate. In questo articolo invece citiamo tool veramente facili ed utilizzabili da marketers.

 

1.Google Drive: il primo grande strumento è di google. Attraverso formule che trovate in rete potete importare nel vostro foglio di lavoro (sheet) dati, tabelle, feed e tanto altro. Di seguito le formule più utilizzate.

=importdata(” link “) copi tutti i dati in pagina

=importfeed(” link feed “) importa i feed

=importhtml(“link”; “table”) estrae la tabella dalla pagina

=importhtml(“link”; “table”; 4) estrae la tabella 4 dalla pagina

=importxml(A1, “//a/@href”)    estrae i dati della pagine (link in a1) e poi dici cosa vuoi. in questo caso il link

=importxml(A1, “//a[@class=’biz-name’]””)  estrae la classe a class=biz name

 

2.convextra.com: lo strumento che preferisco in assoluto, facilissimo da utilizzare e sulla home c’è anche un video di spiegazione che vale più di mille guide. Utilissimo per estrarre tabelle, immagini e tanto altro.

 

3. import.io: strumento molto potente con tipologia freemium, viene utilizzato molto dai giornalisti per importare news, articoli e tanto altro. Si possono utilizzare API’s e si possono schedulare le estrazioni.

web-scraping

 

4. Strumenti per la SEO

  • scraper strumento molto utilizzato per la SEO in quanto è in grado di estrarre dati da pagine web ma anche dalle SERP di google

estrarre-dati-dal-web

  • http://www.scrapebox.com/ – utile per cambiare proxy, trova tutte le parole chiave con la kw selezionata. estrae anche metadata

 

5. Strumenti per tweetter:

 

 

ALTRI tool Generici

  • http://www.outwit.com/ molto utile perchè suggerisce cosa scaricare
  • https://addons.mozilla.org/en-US/firefox/addon/downthemall/ che scarica anche pdf
  • https://chrome.google.com/webstore/detail/scraper/nndknepjnldbdbepjfgmncbggmopgden
  • IFTTT: di solito viene utilizzato per i social media in quanto costruisce delle regole come acd esempio se posti fu Facebook posta la solita cosa anche su tweetter o instagram. In questo caso possiamo costruire la ricetta in questo modo: se su ebay (etsy o instagram) compare la keyword allo esportala in google drive o dropbox

 

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *