nur falls notwendig, da z.B. Stichprobe sehr klein
Glättung und Visualisierung von SIKURS-Dateien, die Alter (und bis auf bei Geburtenraten auch) Geschlecht enthalten: DSGA, DSGR, BGWR, ECKREG, FRUC, GEM, NEBQ, STRB, STRM, WEGZ, ZUDQ, sowie verschiedene Zeitreihen. Bei ZUAQ muss anschließend die Summe über die Typen auf 1 normiert werden.Die Eingabedatei muss aufsteigend sortiert sein.
InhaltsverzeichnisDer Altersbereich der Eingabedaten muss vorgegeben werden, dies kann bei Fruchtbarkeitsraten 15:44 sein, bei den meisten Dateien 0:99.
Es muss weiterhin angegeben werden, ob sich das Geschlecht aus einem Merkmal der Eingabedatei ergibt, oder wie bei fruc per Konvention immer weiblich ist.
Folgende Optionen stehen zur Verfugung:
Fehlende Werte werden nicht ergänzt und können in der Visualisierung von Null-Werten unterschieden werden.
Fehlende Werte werden mit einen vorzugebenden Wert (Voreinstellung 0, denkbare Werte z.B. 0,0/0,000001/?) besetzt.
Das gleitende Mittel ist leicht nachvollziehbar, flächentreu und es können keine negativen Werte entstehen. Der Nachteil ist, dass das gleitende Mittel nicht nur kleine Ausschläge benachbarter Altersgruppen mildert, sondern die gesamte Pyramide flacher macht, sie verliert ihre ausgeprägten Gipfel (z.B. Babyboom) und Einschnitte (z.B. Krieg).
Bei Geburtenraten (fruc-Datei) hat das gleitende Mittel folgenden Einfluss auf die Hadwiger-ParameterWenn sich der Glättungsprozess nicht auf den gesamten Altersbereich der Eingabedatei erstrecken soll, dann kann er hier eingeschränkt werden.
Beispiele:
0:99 - alle 1:98 - ohne 0, 99 10:39,50:79 - ohne 0:9,40:49,80:99 20:79,30:39 - ohne 0:19,80:99 doppelt: 30:39Sonderfälle für Beispiel Sterberaten:
Bei Fensterbreite 0 werden die Originaldaten ungeglättet visualisiert.
Bei Fensterbreite 1, 2, ... (bei Savitzky-Golay ab 2) wird tatsächlich geglättet. Fensterbreite 2 bedeutet dass zur Glättung der Mittelwert aus einem gegebenen Wert und den 2 linken und 2 rechten Nachbarwerten (also aus 5 Werten) berechnet wird.
Fehlende Werte werden je nach Option als Null angenommen oder durch lineare Interpolation aus Nachbarwerten ermittelt. Bei fehlenden Randwerten wird der letzte besetzte Wert verwendet.
Das fur die Eingabdatei vorgesehene Altersintervall (z.B 0-99 oder 15-44) muss angegeben werden, damit beim Glätten die Randbereiche richtig behandelt werden können.
Negative Werte können be Savitzky-Golay entstehen, wenn z.B. Altersbalken ungleich Null von Altersbalken gleich Null umgeben sind.
Die Summe über die Altersgruppen kann sich durch Ersatz fehlender Werte ungleich Null bzw. Interpolation und durch Korrektur negativer Werte nach Glättung ändern. Mit der Option Summentreu glätten kann die ursprungliche Summe durch lineare Anpassung wiederhergestellt werden.
Bei lokaler Skalierung wird jede Einzelpyramide der Eingabedatei auf volle Breite skaliert, bei globaler Skalierung gilt der gleiche Maßstab fur alle Einzelpyramiden, was zu sehr "schmalen" Pyramiden fuhren kann.
Eine Datei kann mehrere Paramiden enthalten (z.B. STROM.CSV Anzahl Jahre * Anzahl Typen * Anzahl Typen). Wenn eine Datei z.B. 625 Pyramiden enthält, dann kann man durch 1..625 alle, durch 17 eine spezielle, durch 1..16,18..525 alle bis auf eine spezielle oder durch 2..5,7,9..11,503..519 eine beliebige Teilmenge der Paramiden fur die Glättung auswählen.
Diese Auswahl wird nur angeboten, wenn die Fensterbreite fur das gleitende Mittel größer als 1 ist, d.h. tatsächlich etwas zu glätten ist.
Da bei sehr großen Dateien mit hunderten oder tausenden von Pyramiden die Ausgabe aller Pyramiden den Rechner und den Betrachter überlastet, kann man die Ausgabe der Pyramiden beschränken. Die Liste sit sinnvollerweise gleich oder kleider der Liste der zu glättenden Paramiden. Dies hat keine Auswirkung auf die Ausgabe der geglätteten Werte.
Beispiel: bei einer vorgegegebenen Anzahl von 625 Pyramiden, kann man wählen: 1..25,51,53,600..625
Diese Option ermöglicht z.B. bei dünn besetzten Wanderungsmatrizen eine kompaktere Ausgabedatei.
Mit Glätten/weitere Linienpyramiden von Datei kann Ausgangs- und geglättete Pyramide nachträglich verglichen werden.
Das händische Glätten kann eingesetzt werden
zu 1: Da für das händische Glätten nur auf Ergebnissdaten eines Glättungsprogramms zugegriffen werden kann, muss in diesem Fall zunächst das Glätten über das Alter mit der Breite Gleitfenster = 0 aufgerufen werden, (bei Breite Gleitfenster = 0 bleiben die Eingabedaten unverändert), um anschließend die Ergebnissdaten händisch zu bearbeiten und die Ergebnisse dieses Arbeitsschrittes in einer neuen Ergebnisdatei abzulegen, die dann als Eingabedatei für eine der drei Glättungsmethoden dient.
zu 2: Im zweiten Fall wird eines der drei Glättungsprogramme aufgerufen, anschließend können nicht zufriedenstellende Ergebniss mit optischer Unterstützung händisch angepasst werden.
zuaq sollte nicht geglättet werden, weil sich die geforderte Summe = 1 über alle Binnentypen nicht einhalten lässt
Visualisierung und Glättung von SIKURS-Dateien je nach Option Ergebnisdarstellung
mit Achsen x: Altersgruppen, y: Jahre, z: Bevölkerung
mit Achsen x: additive Bevölkerung aller Bevölkerungsgruppen getrennt nach links männlich und rechts weiblich y: Jahre z: Alter
Die Glättung nach Alter und Jahre kann eingesetzt werden, wenn die Besetzung von einigen Altersgruppen so dünn ist, dass auch das geglättete Ergebnis zweifelhaft ist. Bei der 2D-Glättung werden neben den benachbarten Altergruppen noch die benachbarten Altergruppen von benachbarten Jahren verwendet.
Für den Altersbereich der Glättung wird nur ein Intervall, z.B.
0:99
oder 15:44
(aber nicht 0:19,80:99
)
unterstützt.
Für diese Glättung in SIKURS gibt es noch sehr wenig Erfahrung, so dass es sich emfiehlt das Ergebnis sehr sorgfältig auf Plausibilität zu prufen.
Dies sind z.B. die Eingabedateien fur die Erzeugung der SIKURS-Raten/Quoten-Dateien, die SIKURS-Ausgabedateien (AGG.CSV, BnGM.CSV, BEWAGG.CSV, STROM.CSV, EGZUG.CSV) oder die Ausgabe des Zeitreihenprogramms (mit Option Spalten untereinander).
Variante b) zeigt mehr Information in einer Graphik als Variante a), benötigt dafur aber mehr Rechenzeit + Arbeitspeicher.
Bei Gleitfenster 0 werden die Originaldaten ungeglättet visualisiert. Fehlende Werte können bei Variante a) mit der Option ohne Ersatz fehlender Werte in der Visualisierung von Null-Werten unterschieden werden.
Bei Gleitfenster Uniform-n und Pyramid-n werden die Werte aus der zweidimensionalen Umgebug geglättet, d.h. es werden die Werte der benachbarten Alterklassen und Jahre berucksichtigt.
Fur die Besetzung fehlender Werte gibt es die Optionen der 1D-Glättung, d.h. Null oder Interpolation von Nachbarwerten. Als weitere Option gibt es die Möglichkeit den Mittelwert über die besetzten 8 Nachbarfelder zu verwenden. Wenn keines der Nachbarfelder besetzt ist, dann wird die Suche schrittweise erweitert: 24, 48, 80, ... Nachbarfelder.
Bei der Glättung werden die 8 oder 15 angrenzenden Felder ohne (Uniform) oder mit (Pyramid) Gewichtung herangezogen. Die Gewichtung bei Pyramid-3
1 2 1 2 4 2 1 2 1
und bei Pyramid-5
1 2 3 2 1 2 4 6 4 2 3 6 9 6 3 2 4 6 4 2 1 2 3 2 1Die Visualisierung mit GNUPLOT kann mit <Strg>-Taste und linker Maustaste gedreht werden.
_roh.csv
, die man dann für die Prognose aufbereiten
(z.B. visualisieren und glätten) kann.[1 ] Glätten der Prognose-Roh-Eingabedaten [v] Rohdaten nach Glättung löschenwerden alle Dateien
*_roh.csv
im Verzeichnis
strb2010_roh.csv
in strb2010.csv
)gem2016_roh.csv
, zuvolK1_roh.csv
)
werden einfach kopiert (in gem2016.csv
, zuvol.csv
), dies entspricht einer Glättung mit Fensterbreite 0