Aufbereitung<meta http-equiv="Content-type" content="text/html; charset=utf-8"> <link rel="shortcut icon" href="../../favicon.ico"><link rel="stylesheet" href="../../wikistatic.css"></head> <body><div id=topbar><table width='98%' border=0><tr><td><a href="../../h/ha/hauptseite.html" title="Hauptseite">Hauptseite</a> | <b><a href="http://de.wikipedia.org/wiki/Aufbereitung" title="Aufbereitung">Aktueller Wikipedia-Artikel</a></b></td> <td align=right nowrap><form name=search class=inline method=get action="../../../search/search.html"><input name=search size=19><input type=submit value=Search></form></td></tr></table></div> <div id=article><h1>Aufbereitung</h1>Die <strong>Aufbereitung</strong> stellt der dritte Prozess einer <A HREF="../../s/st/statistik.html" title="Statistik">Statistik</A> dar, der nach der <A HREF="../../d/da/datengewinnung.html" title="Datengewinnung">Datengewinnung</A> abläuft. Wesentliches Ziel der Aufbereitung ist die Bereitstellung auswertbarer, (teil-)plausibler Datenbestände für die nachfolgende Analyse.<p> Die Aufbereitung kann mit der Umwandlung der Angaben aus den <A HREF="../../f/fr/fragebogen.html" title="Fragebogen">Fragebogen</A> in Rohdaten durch ein Einscannen von Fragebogen mit Texterkennungsverfahren oder durch eine Datenerfassung beginnen. Weitere wesentliche Aktivitäten der Aufbereitung stellen dar:<p> <ul><li> die Codierung von offenen Angaben, wie z.B. Berufsbezeichnungen, in auswertbare Codierziffern, </li><li> die Erkennung von Fehlern mit Hilfe von Plausibilitätsprüfungen in vorliegenden Rohdaten und ihre manuelle Beseitigung (Datenbereinigung, Korrekturen) oder computergestützte Beseitigung, </li><li> ggf. das Ersetzen von fehlenden Angaben mit Hilfe von anspruchsvollen, mathematisch-statistischen Imputationsmethoden, </li><li> ggf. das Zusammenfassen von Daten zu neuen Merkmalen/Variablen (Typisierungen, Merkmalszusammenfassungen), die häufig für nachfolgende Analysen benötigt werden (z.B. Erstellung der Variable "Familientyp" aus den Angaben über die Familienmitglieder) und </li><li> die Berechnung von Hochrechnungsfaktoren (nur bei Strichproben-Erhebungen).<p> </li></ul>Die eingangs erwähnte Umwandlung der Angaben kann durch den Einsatz elektronischer <A HREF="../../f/fr/fragebogen.html" title="Fragebogen">Fragebogen</A> entfallen. Im Idealfall sollte die Umwandlung im Rahmen der <A HREF="../../d/da/datengewinnung.html" title="Datengewinnung">Datengewinnung</A> stattfinden, weil dabei in der Regel auch Vollständigkeits- und Vollzähligkeitskontrollen durchgeführt werden.<p> Die genannten Aktivitäten zeigen, dass die Aufbereitung im Wesentlichen die Genauigkeit statistischer Daten zu Lasten der Aktualität der Ergebnisse fördert (Trade-off zwischen Aktualität und Genauigkeit). Eine wesentliche Aufgabe des Statistikers ist daher die Klärung der Genauigkeits- und Aktualitätsanforderungen der Nutzer. Der Konflikt kann durch die Bereitstellung von vorläufigen Ergebnissen gelöst werden. Vorläufige Ergebnisse sind in der Regel aktueller aber dafür auch fehlerhafter. Plausibilitätsprüfungen und der Einsatz von Imputationsmethoden können entfallen, wenn die Angaben möglichst plausibel und mit Hilfe von elektronischen Fragebogen gewonnen werden können.<p> Nach der Aufbereitung folgt die <A HREF="../../a/au/auswertung.html" title="Auswertung">Auswertung</A>.<p> <p> <A NAME="Weblinks"><H2>Weblinks</H2> Methoden der Aufbereitung <ul><li><A HREF="http://www.unece.org/stats/archive/02.02.e.htm" class="external">Eine Seite mit Hyperlinks zu Worksessions on Statistical Data Editing (Arbeitskonferenzen über Datenprüfungen)</A> </li><li><A HREF="http://amrads.jrc.cec.eu.int/k-base/" class="external">Eine Seite mit Begriffen aus dem Bereich der Fehler in Daten und Datenprüfungen</A> </li><li><A HREF="http://amrads.jrc.cec.eu.int/" class="external">Methoden der Statistikerstellung</A> </li><li><A HREF="http://www.destatis.de/mv/methueb.htm" class="external">Eine Seite mit Methodenberichten</A> </li><li><A HREF="http://www.destatis.de/allg/d/veroe/proser42_d.htm" class="external">"Methoden-Verfahren-Entwicklungen" des Statistischen Bundesamtes</A><p> </li></ul>Software für Imputationen <ul><li><A HREF="http://www.stat.psu.edu/~jls/misoftwa.html#top" class="external">Kostenlose Software von Joseph Schafer für multiple Imputationen</A> </li><li><A HREF="http://www.isr.umich.edu/src/smp/ive/" class="external">IVEWare: Kostenlose Software für Imputationen und Varianzschätzungen</A> </li><li><A HREF="http://www.statsol.ie/" class="external">SOLAS Eine kommerzielle Software für Imputationen</A></li></ul></div><br><div id=footer><table border=0><tr><td> <small>Dies ist ein Artikel aus der freien Enzyklopädie <a href="http://de.wikipedia.org">Wikipedia</a>. Stand: August 2004. Der Artikel steht unter der <a href="http://www.gnu.org/licenses/fdl.txt">GNU Free Documentation License</a>.</small></td></tr></table></div>