Plausibilitätsprüfung von Eingabedaten und Prognoseergebnissen
Merkmale (Spalten) können mit den Nummern 1, 2, 3, ... für die erste, zweite, dritte, ... -Spalte, oder mit den Zahlen -1, -2, -3 ... für die letzte, vorletzte, drittletzte, ... Spalte ausgewählt werden.
#1 == 2013verwende nur Sätze mit 2013 in Spalte 1
Layout des Plots
Prognose Adorf
Jahr
Einwohner
set key outside | außerhalb rechts oben |
---|---|
set key right bottom | innerhalb links unten |
set key left top | innerhalb links oben |
set key off | nirgends |
set key
für weitere Optionen
Bei einer Eingabe von 'refkeytxt' wird die Referenzdatei 'refkeytxt.csv' im gleichen Verzeichnis wie die Eingabedatei gesucht. Aufbau der Referenzdatei bei einer Schlusselspalte
1;Alter 0-24 2;Alter 25-64 3;Alter 65-99
bzw. bei mehreren Schlusselspalten
1;0;Neugeborenes männlich 1;1;ein Jahr männlich ... 2;0;Neugeborenes weiblich ...
Wenn ausschließlich Wertespalten vorgegeben werden, dann wird der Titel eines Linenplots der Spaltenüberschrift der Eingabedatei (falls vorhanden) entnommen.
Bei Linienplot Absolutwerte wird jeder Wert als Linienplot über die Jahre dargesellt.
linespoints | mit Linien und Punkten |
---|---|
lines | mit Linien |
points | mit Punkten |
steps | mit Stufen (siehe Sterbetafel) |
dots fsteps histeps
siehe gnuplot)
Bei Flächenplot je Wert stellt jeder farbige Balken den Wert eines Merkmals dar, die oberste Linie im Plot zeigt die Aggregation uber alle Merkmale.
Bei Histogramm wird für jedes Jahr ein für dieses jahr gleichbleibender Wert dargestellt. Das Histogramm kan nicht geschlechtsspezifisch aufbereitet werden.
*:* -1400:1500
,
sonst 0:* *:* 1200:1400
sinnvoll*:* log | falls Eingabedatei keine Werte = 0 enthält |
---|---|
0.0001:* log | |
1e-5:1e0 log[scale] [y [10]] | |
2**-5:2**0 logscale y 2 |
set logscale
)
Sikurs Eingaben:
eckgeb, eckgem, eckreg, eckstrb, ecktyp, neubaub, neubauzu, wegvol, zuvol
Sikurs Ausgaben:
agg, abgm, bewgem, bewgemagg (Sonderfall Bilanz-Bewegung), bewagg, zr_gem
z.B. ecktyp mit Typ für die x-Achse
Schritte:
1. Prognose .../besipiel/regtest/nbb.ini 1992 bis 2030
2. Zeitreihe mit Aggregation uber Bevölkerungsgruppen, Geschlecht und Referenzdatei refag3.csv für das Alter:
00;1 ... 24;1 25;2 ... 64;2 65;3 ... 99;3
3. Visualisierung Zeitreihen - Start X/Y-Plot zr_gem.csv
5 Schlussel ../refag3txt Referenzdatei Schlusseltexte (*) Linienplot Absolutwerte
Die Datei refag3txt.csv muss im gleichen Verzeichnis wie zr_gem.csv sein, oder die relative Position zu zr_gem.csv wir angegeben (zr_gem.csv ist im Verzeichnis .../Sikurs/Beispiel/regtest/nbb, ../refag3txt bedeutet dass refag3txt.csv im nächst höheren Verzeichnis .../Sikurs/Beispiel/regtest gesucht wird)
4. Optionale Optimierung Plot-Layout
Start/Visualisierung/gnuplot
und Auswahl der gnuplot-Kommandodatei pltzr.txt
Ergebnis:
als Linienplot
oder als Flächenplot
[2 ] x-Achse [1 ] Schlüssel [3 ] Wert (*) Linienplot Absolutwerte [steps ] [0:* ] y-Wertebereich
[1e-5:1 log ] y-Wertebereich
TkHist.pm - visualisiere Zeitreihe als animiertes Histogramm der Aussageneinheit (Gebiet/Typ/Aggregat)
Wähle eine DateiDatei | Inhalt |
---|---|
gem | Bevölkerung nach Bevölkerungs-, Geschlechts- und Altersgruppen |
zr_gem | aggregierte Zeitreihe Bevölkerung |
bew | Bewegungen (vorher mit bew2pivot in pivotfähiges Format umformen) |
haushalt | Anzahl der Haushalte (ANZH) nach dominanter Familienbeziehung (HDO) und Haushaltsgröße (HGr) |
hdo2 | Haushalte mit Kindern, HDO2=21: allein Erziehend, HDO2=22 : nicht allein Erziehend |
kinder | Haushalte mit Kindern (HDO=2) nach der Zahl der Kinder (1,2,3,4 u.m.) |
person | Anzahl der Personen (ANZP) nach dominanter Familienbez. (PDO), Geschlecht (G), Altersgrppe (AGR) und Haushalten nach dominanter Familienbez. (HDO) |
Jahr | keine |
---|---|
GKZ | keine oder "reftyp 1 3" oder "reftyp 1 4" |
BG | keine oder "alle Ausprägungen" |
GG | keine oder "alle Ausprägungen" |
AG | alle oder "refag 1 2" mit 2-20 Altersklassen |
Spalte für Jahr | zur Animation |
---|---|
Spalte für Balkenkennung | Gebiet/Typ oder Aggregat |
Spalte für Balkenteilung | zr_gem: 3 BG (oder 4 GG oder 5 AG) bew: 3 Bewegungsart (oder 4 BG, 5 GG, 6 AG) Haushalte: 4 HDO, 5 HHGr |
Normierung Balken | bleibt das Feld leer (=keine Normierung, dann entspricht die Balkenhöhe der Bevölkerunganzahl der Aussageneinheit Bei einer Zahl > 0 werden die Werte auf diese Zahl skaliert (z.B. 100 für Prozent oder 1000 für Promille). Damit läßt sich die Verteilung von Altersgruppen (z.B. 0-19 jung, 20-64 erwerbstätig, 65-00 alt), der Geschletsgruppen oder der Bevölkerungsgruppen der Aussageneinheiten vergleichen |
Bildgröße | 800,600 |
Y-Wertebereich | 0:70000 |
Beschriftungsgröße | tiny, small, medium, large, giant |
Animationspause /100 s | 100 |
Legende X-Achse | "" oder "reftyp 1 2" zur Ausgabe der Gebietskennziffer oder des Gebietnamens |
Legende Balkenteilung | "" oder "AG|GG|BG" oder "refbar 1 2" zur Ausgabe der Gruppennummer (AG, GG, BG) oder einer Gruppenbezeichnung (0-19, männlich, Deutsch) |
Merkmalsanordnung im Balken | 0 absteigend - für BG gut geeignet, 1 aufsteigend - meist zu bevorzugen |
Visualisiere Binnenwegzug, Außenwegzug oder Außenzuzug
Zeige die Verflechtung einer Binnenstrommatrix (strom.csv gstrom.csv, gstrom_weg.csv, gstrom_zu.csv
)
oder Außenwegzugsmatrix ([g]wegzug.csv [g]reaa.csv
)
oder Außenzuzugsmatrix ([g]zuzug.csv [g]neba.csv
)
als Kreise, Farbpalette oder Tortendiagramme.
Enthält die Eingabedatei Gebietskennzeichen (g*.csv
),
so werden diese automatisch in Gebietsnummern umgewandelt.
Dies entspricht der mamuellen Aggregation:
SIKURS Hauptmaske/Ergebnis/Zeitreihe/Optionen/Eingabedatei-Typ gstrom SIKURS Hauptmaske/Ergebnis/Zeitreihe/Start Aggreation über [ keine ] Jahr [ reftyp 1 0 ] Gebietskennzeichen [ reftyp 1 0 ] Gebietskennzeichen [ keine ] Bevölkerungsgruppe ...
Kreise werden so dargestellt, dass deren Fläche proportional
zur Summe über die demographische Gliederung ist.
Wenn vorher mit
Visualisierung Pyramiden/Einzelpyramiden
alle Pyramiden der Stromdatei als animated gif erzeugt wurden,
so werden die Kreise mit den Pyramiden verlinkt
Farbpalette in 2 Varianten wählt eine zur Summe über die demographische Gliederung passende Farbe. Diese Darstellung mag bei sehr großen Wanderungsmatrizen günstiger als die Kreisdarstellung sein.
Tortendiagramme:
Aufbau Referenzdatei für demographische Gliederung
#BG;GG;AG;Typ 1;1..2;0..99;1;Deutsch 2;1..2;0..99;2;Ausländer
#BG;G;AG;Typ 1..2;1;0..99;1;männlich 1..2;2;0..99;2;weiblich
#BG;G;AG;Typ 1..2;1..2;00..19;1;jung 1..2;1..2;20..64;2;erwerbstätig 1..2;1..2;65..99;3;alt
Der Benutzer kann die Ausgabedatei [g]strom_agg.csv
weiterverarbeiten (z.B. die Differenz aus 2 Prognosevarianten bilden)
und diese dann wieder mit diesem Programm visualisieren.
Wählbar sind
Beachte: bei der Darstellung von STRMyyyy.CSV oder WEGZyyyy.CSV ist die Interpretation schwierig, da die Wegzugswahrscheinlichkeiten über die demographische Differenzierung aufaddiert wird. Wenn man eine durchschnittliche Wegzugswahrscheinlichkeit darstellen will, dann kann man die Dateien STRM bzw. WEGZ mit 1/(NBG*NGG*NAG) skalieren (z.B. mit Extras/Eigene Scripts/Start/scale)
Anhaltspunkt für Wahl der Grafik-Parameter je nach Anzahl Typen
Typen | Größe | Font |
---|---|---|
2 | 300 | 2 |
10 | 300 | 2 |
20 | 600 | 2 |
50 | 600 | 2 |
100 | 1000 | 1 |
200 | 3000 | 1 |
500 | 3500 | 1 |
1000 | 3500 | 1 |
pltstromkreise.txt
plot '-' notitleersetzt durch
plot '-' using 1:2:xtic(3):y2tic(3) with points pt 0 notitle 0 0 1 1 eins 2 2 zwei 3 3 drei ... e