Heatmap CH-Olympiateilnehmer

image00

Die von der Sportinformation veröffentlichte Liste aller Schweizer Olympiateilnehmer (gerade gelernt: Olympioniken wäre falsch, siehe wikipedia) enthält nebst Name und Sportart auch den Wohnort. Einmal aufbereitet, lässt sich daraus mit Google Fusion Tables eine Heatmap erstellen, indem die Geolokalisierung von Fusion Tables die Sportler anhand der Wohnorte auf einer Karte platziert. Daraus wird ersichtlich, dass die grösste Stadt der Schweiz und sowie das kleine Davos die grösste Anzahl Olympiateilnehmer stellen – dazu kommt, ebenfalls interessant – Zug (aber wohl nicht wegen der idealen Trainingsbedingungen). Das Wallis sowie die Regionen Waadt und Nordwestschweiz können hingegen als wintersportliche Einöde bezeichnet werden. Leider lässt sich die Heatmap nicht exportieren, respektive lediglich als Screenshot einbinden. Die Karte mit den einzelnen Athleten hingegen kann eingebunden werden.

Twitter im Bundeshaus

Twitter-User @polittweets führt eine aktuelle Liste twitternder National- und Ständeräte. Mit Hilfe des Excel-Tools NodeXL lassen automatisch auslesen und analysieren. Wegen der neuen restriktiven Richtlinien der Twitter-API dauert Follower-Abfrage der aktuell 84 auf der Liste eingetragenen Parlamentarier mehrere Stunden. Wichtig: Der Computer darf dabei einfach nicht in den Standby-Modus wechseln. Eine praktische Anleitung im Umgang mit Twitter-Listen und NodeXL liefert connectedaction.net. Das Resultat der Abfrage sind sämtliche „followed“-Verbindungen, das heisst Twitter User X folgt Twitter User Y. Falls Y User X ebenfalls folgt, ergibt das eine zweite Verbindung. Die Daten können mittels NodeXL weiterverarbeitet oder in die Visualisierungs-Software Gephi importiert werden. Für mein Beispiel „Twitterkönige im Bundeshaus“ habe ich Google Fusion Tables verwendet. Dazu habe ich die Daten aus Excel per copy/paste in ein Google Spreadsheet eingefügt und daraus eine Fusion Tables Datei erzeugt. Um die am besten vernetzten Parlamentarier zu finden, habe ich in der Diagramm-Ansicht einen Filter auf die erste Datenspalte angewendet. Durch einen Klick auf „sort by count“ zeigt es die Parlamentarier, die von anderen Parlamentarier am häufigsten gefolgt werden. Aktuell (28. Juli 2013) sind das Kathy Riklin (@kathyriklin) und Christian Wasserfallen (@cwasi). Beide zählen 70 der 84 twitternden Parlamentarier zu ihren Followern, allerding – wie der Network-Graph zeigt.

Interessen Grossräte

Die aktuellen Interessenbindungen der Grossräte werden auf bs.ch publiziert. Im Gegensatz zur PDF-Datei werden die Daten in den einzelnen Porträts ständig aktualisiert. Mittels Scraper-Wiki können die einzelnen Porträts automatisch ausgelesen werden, das entsprechende Python-Script ist hier. Das Script liefert ein Tabellen-File für sämtliche Grossräte in folgendem Format:

AticiMustafa InteressenbindungenArbeitgeberAD Atici Management GmbH, Basel (Gastronomie)Mitgliedschaften in F&uumlhrungs- und AufsichtsgremienA Foodliner GmbH, Basel (Gesellschafter/Geschäftsführer) AD Atici Management GmbH, Basel (Gesellschafter/Geschäftsführer)fabe: Familien-, Paar- und Erziehungsberatung, Basel (A/M)Neue Helvetische Gesellschaft Region Basel (A/M)MUSUB: Multikulturelle Suchtberatungsstelle beider Basel (A/M)GGG Ausländerberatung, Kommission (M)
SolandTanja InteressenbindungenArbeitgeberAids-Hilfe beider Basel, BaselMitgliedschaften in F&uumlhrungs- und AufsichtsgremienFDP Basel-Stadt (P)Hausbesitzerverein Basel, Delegiertenversammlung (M)Verein Gemeinnützige Institutionen, Basel (P)Rockförderverein Basel (A/M)Mitgliedschaften in staatlichen, nicht durch den Grossen Rat gewählten KommissionenNationalrat (M)Sicherheitskommission NR (M)

Die von Google Fusion Tables für Network-Graph vorgesehene Datenstruktur ist jedoch deutlich anders. Sie besteht im vorliegenden Beispiel aus einzelnen Verknüpfungen zwischen Organisationen und Grossräten. Das entsprechende Google Drive Spreadsheet steht hier zur Verfügung. Der Umwandlungsprozess war kompliziert und erforderte viel Handarbeit. Das beste Ergebnis erzielte ich durch den Einsatz von Excel und einem einfachen Text-Editor.

Die Tabelle kann danach in Google Fusion Tables importiert werden. Eine Filterung nach all jenen Organisationen, die mehr als einen Vertreter haben, lässt sich einfach vornehmen. Fusion Tables ermöglicht es, die einzelnen Werte nach Anzahl Nennungen anzuzeigen. Danach können die mehrfach vorkommenden Organisationen ausgewählt werden. Eine weitere Option ermöglicht es, die Werte aus den beiden Spalten unterschiedlich einzufärben.

Abstimmung Landrat

Eine Auswertung der ÖV-Abstimmung im Landrat im Rahmen des Sparpakets. Die Resultate sämtlicher Landratsentscheide, aufgeschlüsselt nach einzelnen Landräten, sind seit 2009 unter bl.ch verfügbar. Kombiniert man diese Daten mit den Wohnadressen der Landräte, kann man die Resultate via Google Fusion Tables auf einer Google Map darstellen. Zur Auswahl der einzelnen Symbole (im Beispiel: $ für Sparer, Bus-Symbol für ÖV-Förderer) muss man in Fution Tables „Nein“ durch den Namen des Symbols ersetzen. Eine praktische Übersicht sämtlicher verfügbarer Symbole gibt es hier: https://www.google.com/fusiontables/DataSource?dsrcid=308519#map:id=3.

Dasselbe gilt übrigens auch für Abstimmungen im Grossen Rat, hier ebenfalls ein Beispiel (Sperrung der Mittlere Brücke für Individualverkehr):

Babygalerie Bethesda-Spital

ScraperWiki ist ein Werkzeug, um Daten aus Internetseiten zu extrahieren und analysieren. Mit Hilfe dieses Werkzeugs und einigen Zeilen PHP-Code habe ich die Baby-Galerie des Basler Bethesda-Spitals ausgelesen. Knapp 5000 Neugeborene werden in der Galerie aufgelistet, mit Name, Grösse, Alter, Geschlecht und genauer Geburtszeit. Die erhaltenen Daten habe ich mit Microsoft Excel weiter analysiert, beispielsweise die Geburtszeit daraufhin überprüft, ob sie innerhalb der „normalen Arbeitszeiten“ von Montag – Freitag zwischen 06:00 und 22:00 liegen oder ausserhalb. Danach habe ich das Excel-File in Google Fusion Tables importiert und damit folgende Visualisierungen erstellt:

Das Verhältnis sollte eigentlich genau 50:50 sein, da Babies normalverteilt geboren werden und die  Zeiten der beiden Kategorien (rot: Mo bis Fr, zw. 06:00 und 22:00) und (blau: Wochenende, Nacht) gleich viele Stunden beinhalten. Die Recherche könnte der Frage nachgehen, weshalb das so ist und ob dies in allen Spitälern so ist.

 

Bevölkerungsdichte Basler Quartiere

MIt Google Fusion Tables lassen sich schöne datenjournalistische Projekte verwirklichen und als Google Map optisch aufbereiten. Eine gute Einführung bietet das Tutorial: Grenzen, Gebiete und Daten mit Fusion Tables kartieren„. Die Tücken liegen jedoch im Detail: Zunächst müssen die Quartiergrenzen in Fusion Tables importiert werden. Die entsprechenden Files sind im Geoshop von bs.ch frei verfügbar, liegen jedoch in der nicht kompatiblen Projektionsverfahren vor. Das Bundesamt für Topographie bietet die notwendigen Tools, um Datensätze im Schweizer Projektionsverfahren auf das Projektionsverfahren von Google Maps umzurechnen. Am besten funktioniert hat der KML-Generator, der die Quartiergrenzen zugleich in ein von Google Maps lesbares Format überträgt. Nun können die Daten in Fusion Tables eingelesen und als Karte dargestellt werden. Noch eine letzte Anpassung der Daten ist nötig, bevor die Quartiergrenzen mit anderen Daten kombiniert werden können: Mittels eines einfachen Tricks müssen die Grenzen in Flächen umgewandelt werden. Dazu müssen die einzelnen KML-Tags folgendermassen ersetzt werden:

<LineString> --> <Polygon><outerBoundaryIs><LinearRing>
</LineString> --> </Polygon></outerBoundaryIs></LinearRing>

Nun können die Quartierflächen wie im oben erwähnten Tutorial mit beliebigen Datensätzen kombiniert werden. Viele entsprechende Daten mit Angaben zu den einzelnen Quartieren finden sich auf statistik-bs.ch/tabellen. Ein einfaches Beispiel ist die Bevölkerungsdichte in den verschiedenen Quartieren: