Scopri La Compatibilità Con Il Segno Zodiacale
Come i giornalisti possono utilizzare Geocommons per creare mappe interattive
Altro
Alcuni mesi fa, John Keefe ha scritto un How To su Poynter.org sull'uso degli shapefile. Il potere dello shapefile, ha scritto, è la capacità di fare riferimento a regioni anziché punti.
Ma cosa succede se i tuoi dati hanno punti (ad esempio indirizzi) e desideri mappare le regioni? Diciamo, ad esempio, che tu abbia indirizzi di violazioni ambientali e desideri mostrare quali distretti congressuali hanno il maggior numero di violazioni. Devi trovare un modo per associare quei punti in forme. In questo tutorial, spiegherò come farlo.
Usiamo un esempio dell'organizzazione per cui lavoro, la Sunlight Foundation. Abbiamo un sito chiamato Dati sulla trasparenza , dove gli utenti possono scaricare dati, alcuni dei quali includono indirizzi. Uno di questi set di dati sono i dati sulle violazioni dell'EPA. Vai a Dati sulla trasparenza, fai clic sulla scheda 'EPA', quindi cerca le violazioni tra il 1 luglio 2011 e il 31 dicembre 2011. I dati sulla trasparenza restituiranno circa 1.300 record. Fai clic sul pulsante gigante 'Scarica dati' per salvare i record sul tuo computer.
Una volta scaricati i dati, li apriremo in un foglio di calcolo. Vedrai che una delle colonne include l'indirizzo della violazione. (Nota, alcune delle celle in questa colonna includono più indirizzi, mentre altre non hanno alcun indirizzo. Per i nostri scopi, elimineremo tutti i record con più indirizzi o quelli senza alcun indirizzo. Puoi fare riferimento a questa storia precedente, 'Come i giornalisti possono utilizzare Excel per organizzare i dati per le storie' se hai bisogno di aiuto per farlo.)
Dovremmo anche separare l'indirizzo nelle loro parti componenti. Creerò nuove colonne per città, stato e ZIP.
(Puoi fare riferimento a uno dei miei precedenti How To - 'Come i giornalisti possono usare le espressioni regolari per abbinare stringhe di testo' per assistenza su questo. Suggerimento, la mia ricerca/sostituzione era cercare:
|_+_|e sostituire con:
|_+_|Ciò lascerà alcuni errori (come i numeri di suite nel campo della città), che correggeremo cercando:
|_+_|e sostituendo con:
|_+_|Dopo aver ripulito i dati, li riporteremo nel nostro foglio di calcolo. Quindi esporteremo quel foglio di calcolo come un file di testo .csv o 'valore separato da virgola' che ti fornisce file che assomiglia a questo .)
Ora, per aggregare questi indirizzi con i distretti congressuali, utilizzeremo uno dei miei strumenti preferiti: GeoCommons . Inizieremo questo processo esportando il foglio di calcolo sopra come file di testo CSV o 'valori separati da virgola'. Ho pubblicato un file di esempio qui . Quindi, caricheremo quel CSV direttamente su GeoCommons.
Dopo il caricamento su GeoCommons, seguiremo le istruzioni fino a quando il servizio non ci chiederà di 'aiutare a geolocalizzare' i dati. Ci vengono date due opzioni. Innanzitutto, possiamo associare o unire i dati a un set di dati di confine. Se dovessimo selezionare questa opzione, avremmo bisogno di dati limite nel foglio di calcolo. Tali dati potrebbero includere nomi di contea o codici FIPS, codici distrettuali congressuali, trattati di censimento e simili. Non abbiamo quei campi nei nostri dati.
La seconda opzione, 'geocodifica basata su un indirizzo o nome di luogo', prende le informazioni sulla posizione, come un indirizzo stradale, e le converte in longitudine e latitudine. Questa è l'opzione che vogliamo selezionare.
A seconda dell'intestazione nel file, GeoCommons potrebbe riconoscere automaticamente alcuni dei campi della posizione. In caso contrario, dovremo aiutare GeoCommons a determinare quali campi compongono l'indirizzo. Per farlo, scorreremo verso il basso fino a 'indirizzo della posizione' e selezionare 'modifica'. Lì, sceglieremo 'indirizzo'. Faremo lo stesso per città, stato e CAP. Quindi fare clic su 'Continua'. (Nota, GeoCommons può geocodificare solo fino a 5.000 indirizzi per file.) Puoi anche modificare altri tipi di dati di campo, se lo desideri o se necessario.
Il servizio impiegherà del tempo per decodificare gli indirizzi e trasformarli in punti di latitudine e longitudine. Al termine di tale processo, GeoCommons ci farà sapere quanto è stato in grado di geolocalizzare gli indirizzi. Nel mio test, la geocodifica ha richiesto circa 10 minuti. (Se non vuoi aspettare che il tuo file venga geocodificato, sentiti libero di usare una copia dei miei dati, disponibile qui .) Naturalmente, puoi anche utilizzare altri servizi per geocodificare i dati in latitudine e longitudine, quindi caricare un CSV contenente quei campi, oltre a tutti gli altri, su GeoCommons.
Successivamente, sfrutteremo una delle migliori caratteristiche di GeoCommons: la sua capacità di analizzare i dati. Se andiamo al nostro nuovo set di dati geocodificato, possiamo accedere a queste funzionalità facendo clic sul pulsante 'analizza' in alto a destra della pagina.
Questo fa apparire una serie di opzioni. Dovresti dedicare un po' di tempo a giocare con questi strumenti, ma per questo tutorial selezioneremo il secondo, 'Aggregazione'. Nella finestra di dialogo risultante, dobbiamo selezionare un insieme di limiti. Apparirà una finestra e cercheremo '111° Distretti del Congresso'. Lì selezioneremo i distretti che ho caricato. Questi distretti hanno la forma di shapefile, che è un metodo basato su vettori per descrivere le aree.
Ho deselezionato 'Mantieni i confini vuoti', poiché non voglio mostrare i distretti che hanno zero violazioni.
GeoCommons eseguirà ora la sua analisi, che nel mio caso ha richiesto circa 20 minuti. Il file risultante si trova qui .
Sebbene sia possibile mappare il set di dati risultante all'interno di GeoCommons, trovo che le mappe del servizio siano troppo limitanti. Ad esempio, non hai il pieno controllo su come vengono formattate le informazioni nei suggerimenti della mappa.
Per questo motivo, mi piace esportare la mappa da GeoCommons utilizzando la funzione 'Scarica come KML'. Il file KML esportato da GeoCommons contiene tutti i dati, nonché le informazioni sui confini. Con questo file, posso passare a Google Fusion Tables, importare il KML e avere il pieno controllo sul design, l'ombreggiatura, la finestra delle informazioni e altro ancora. John Keefe ne ha già parlato nella sua introduzione agli shapefile, quindi non tratterò lo stesso argomento.
Sebbene in genere non utilizzi Geocommons per la mappa finita, è uno strumento inestimabile per la creazione di mappe informative e coinvolgenti, soprattutto quando si tratta di confini o aree.
Divertiti a esplorare e condividi la tua esperienza con GeoCommons e la mappatura nella sezione commenti. Se hai altri argomenti che vorresti che questa serie trattasse/indirizzi, faccelo sapere.
Questa storia fa parte di un Poynter Hacker/Hacker serie con Come fare per che si concentrano su ciò che i giornalisti possono imparare dalle tendenze emergenti della tecnologia e dai nuovi strumenti tecnologici.