vrijdag 19 juli 2013

Circos 1


Visualisatie is belangrijk als je veel data hebt. Faceted Classification werkt perfect voor het toegang bieden tot informatie: geen hiërarchie en het kunnen maken van complexe filters zonder dat je het door hebt omdat iedere gebruikersactie een reactie op het scherm geeft. Sequoia view van de TUE is een schitterende visualisatie van de bestanden op je hard disk. Ook hier: maximaal overzicht en tegelijkertijd maximaal veel detail, zonder dat je een hiërarchie hoeft te creëren. Sequoia view kent 2 spin off's: MagnaView voor websites en SynerScope voor echt zware datatoepassingen. SynerScope gebruikt een cirkel om een overzicht over de data te geven. Omdat SynerScope niet zo happig is met trial licenties, houd ik me eerst een tijd bezig met Circos. Circos gebruikt naar mijn oordeel van dit moment (19 juli 2013) ongeveer dezelfde visualisatie als SynerScope.

 De visualisatie met een cirkel is in zijn basis hetzelfde als een tabel: er zijn vertrekpunten (in een tabel meestal de rijen), er zijn aankomstpunten (in een tabel meestal de kolommen) en daartussen een verbinding die aangeeft hoeveel er is tussen het vertrek- en aankomstpunt (in een tabel de cel). Belangrijke verschillen tussen Circos en een tabel:
  1. het begrijpen van de cel vereist dat je het getal leest en je jezelf de grootte realiseert. Met een visualisatie, zie je al meteen de grootte, je hoeft niet te interpreterenn
  2. het wisselen tussen het lezen vanuit de kolommen en het lezen vanuit de rijen, kost relatief veel inspanning. Bij de cirkel visualisatie is het onderscheid tussen rijen en kolommen verdwenen. Je ziet tegelijkertijd beide benaderingen. Probeer maar eens hieronder waar het verband tussen de kleur van de ogen en de kleur van het haar wordt weergegeven.
  3. er is ook nog een wazig verhaal dat mensen gemakkelijker gebogen lijnen kunnen aflezen dan lijnen met hoeken erin. Ik kan dit verhaal niet staven noch ontkennen.


Methode

  1. Bepaal je interesse: waar gaat het je om? waar ligt je interesse?
  2. Zoek getallen bij je doel. 
  3. Bepaal de 2 belangrijkste aspecten (kolommen en rijen bij een tabel). Deze aspecten gaan de binnenste cirkel vormen. Iedere cel van de tabel wordt een lint (ribbon) in de cirkel. Een breed lint geeft een hoge waarde aan, een smal lint een lage waarde.
  4. Als je nog een aspect hebt, dan gaat dit een buitenste cirkel vormen. Een buitenste cirkel geeft een toelichting op de binnenste cirkel. Je kunt zoveel cirkels aanbrengen als je wilt

Bronnen

  1. Circos
  2. TableViewer invoer: tabel, uitvoer Circos visualisatie

Toepassing

Het gaat ons om de trias energetica.
  1. zo weinig mogelijk energie verbruiken
  2. energie zoveel mogelijk groen (bijv. zon of wind) opwekken
  3. zuinig met fossiele brandstof
Voor nu vertaal ik dit in energieverbruik waarbij de evnetueel opgewekte energie wordt afgetrokken van de verbruikte energie.

Verder heb ik nog niet heel veel data behalve van de Basisregistratie Adressen en Gebouwen (BAG) en de data van Liander. Ik kan dus werken met de volgende dimensies:
  • elektriciteitsverbruik (gas heb ik ook), dit worden de verschillende linten (de verbindingen in de cirkel)
  • postcode
  • functie (woonfunctie, winkelfunctie, sportfunctie, overige gebruiksfunctie, onderwijsfunctie, logiesfunctie, kantoorfunctie, industriefunctie, gezondheidszorgfunctie, celfunctie, bijeenkomstfunctie)
  • status (Verblijfsobject ingetrokken, Verblijfsobject in gebruik (niet ingemeten), Verblijfsobject in gebruik, Verblijfsobject gevormd, Verblijfsobject buiten gebruik, Niet gerealiseerd verblijfsobject)
  • pandstatus (Sloopvergunning verleend, Pand in gebruik (niet ingemeten), Pand in gebruik, Pand gesloopt, Pand buiten gebruik, Niet gerealiseerd pand, Bouwvergunning verleend, Bouw gestart)
  • totale oppervlakte voor deze postcode
  • mediaan bouwjaar voor deze postcode

Geen opmerkingen:

Een reactie posten