Statistik
aus Freepedia, der freien Wissensdatenbank
Als eine Statistik bezeichnet man:
- namengebend (v. lat.: status = Staat, Zustand; mit griechischer Endung) die (vergleichende) Staatsbeschreibung (eingeführt wurde der Begriff vom Göttinger Kameralisten Gottfried Achenwall um 1749);
- die heute als amtliche Statistik fortlebt;
- die aber auch unabhängig von der Namensgebung schon seit über 5000 Jahren als Bevölkerungsstatistik und Wirtschaftsstatistik existiert;
- davon verallgemeinernd quantitative Erhebungen aller Art, wie zum Beispiel für Markt- und Meinungsforschung (siehe Quantitative Methoden );
- deren Ergebnisse, deren Darstellung u.a. die deskriptive Statistik besorgt;
- die mathematische Statistik;
- gewisse Zufallsvariablen, z.B. eine »Teststatistik«;
- gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung, Fermi-Dirac-Statistik, Bose-Einstein-Statistik
Inhaltsverzeichnis |
Übersicht und Einteilung
Die Statistik ist die Zusammenfassung bestimmter Methoden um Massenerscheinungen zu quantifizieren und interpretieren.
Die Statistik wird in die folgenden drei Teilbereiche eingeteilt:
- deskriptive Statistik (beschreibende Statistik, empirische Statistik)
- mit der vorliegende Daten in geeigneter Weise beschrieben und zusammengefasst werden. Mit ihren Methoden verdichtet man quantitative Daten zu Tabellen, graphischen Darstellungen und Kennzahlen. Bei einigen Institutionen, z. B. bei der amtlichen Statistik, ist die Erstellung solcher Statistiken die Hauptaufgabe.
- induktive Statistik (schließende Statistik, mathematische Statistik)
- In der induktiven Statistik leitet man aus den Daten einer Stichprobe Eigenschaften einer Grundgesamtheit ab. Die Wahrscheinlichkeitstheorie liefert die Grundlagen für die erforderlichen Schätz- und Testverfahren.
- explorative Statistik (hypothesen-generierende Statistik, Data Mining)
- Methodisch eine Zwischenform der beiden vorgenannten Teilbereiche, bekommt als Anwendungsform jedoch zunehmend eine eigenständige Bedeutung. Mittels deskriptiver Verfahren und induktiver Test-Methoden werden mögliche Zusammenhänge (oder Unterschiede) zwischen Daten in vorhandenen Datenbeständen systematisch gesucht und zugleich in ihrer Stärke und Ergebnissicherheit zu bewerten versucht. Die so gefundenen Ergebnisse können als Hypothesen verstanden werden, die erst dann als statistisch abgesichert betrachtet werden können, nachdem sie von darauf aufbauenden, induktiven Testverfahren mit entsprechenden (prospektiven) Versuchsplanungen bestätigt wurden.
Induktive Statistik und Wahrscheinlichkeitstheorie werden unter dem Oberbegriff Stochastik zusammengefasst.
Schritte der Statistik
Die Schaffung und Datenanalyse empirischer Daten besteht im Idealfall aus folgenden Schritten:
- Versuchsplanung / Erhebungsvorbereitung (Erhebungskonzept, Fragebogenentwicklung, Stichprobenziehung),
- Datengewinnung / Erhebung (von Stichproben) / Nutzung von Betriebsdaten / Erhebung von Bestands- u. Ereignismassen,
- Datenaufbereitung (Datenprüfungen, Typisierungen / Merkmalszusammenfassungen),
- Auswertung (Tabellierung, Modellierung, Hoch- und Fehlerrechnung, Wahrscheinlichkeit, Fehler 1. und 2. Art, Schätzen und Testen) sowie
- Ergebnispräsentation (Tabellen, Grafiken, Ergebnisinterpretation, Veröffentlichungen, CD-ROMs, Statistische Datenbanken).
Während sich die univariate Statistik mit der Beschreibung der Verteilung
eines Untersuchungsmerkmals beschäftigt, wird in der
multivariaten Statistik die gemeinsame Verteilung von mehreren Untersuchungsmerkmalen betrachtet.
Schulen und Denkrichtungen
Es wird in Lehrbüchern oft der Eindruck vermittelt es gäbe nur die eine, sich ständig weiterentwickelnde Statistik. Im Gegensatz dazu kann man verschiedene Denkschulen ausmachen, die ein Problem durchaus unterschiedlich analysieren, bewerten und numerisch berechnen:
- Kausalbeziehungen: Ronald Fisher
- Gedächtnisleistungen, ROC-Kurven: Jerzy Neyman und Karl Pearson
- Urteile aufgrund unsicherer Annahmen: Karl Pearson
- Induktion und Änderung der Meinung: Thomas Bayes
Software
Die moderne Statistik ist, unterstützt durch leistungsfähige Computer, in der Lage, mit teilweise rechenintensiven Methoden sehr große Datenmengen zu analysieren. Ganze Teilbereiche der Statistik haben ihren Einzug in die Datenanalyse neuer Software zu verdanken, zu nennen ist hier die Bayessche Statistik und deren Implementation in Markov Chain Monte Carlo Verfahren, üblicherweise abgekürzt durch MCMC-Verfahren.
Im folgenden sind einige gebräuchliche statistische Softwarepakete aufgelistet:
- SAS
- S-Plus basierend auf der S Programmiersprache
- Statistiklabor
- R (GNU R) ist eine Open Source Variante der S Programmiersprache (Im Netz: The R project for statistical computing)
- SPSS
- Almo (umfangreiches deutschsprachiges Statistiksystem)
- Statistica
- Dataplot: frei, plattformunabhängig
- Stata
- MiniTab
- Mondrian (Software zur explorativen statistischen Datenanalyse (EDA))
- BUGS (Bayesian inference Using Gibbs Sampling) eine Open Source Software zur Analyse von komplexen statistischen Modellen mit Hilfe von MCMC-Verfahren
- qs-STAT: Statistiksoftware für Industrielle Daten,- und Prozessanalyse
- XploRe
- WinIDAMS: kostenfrei zur Verfügung gestellt von der UNESCO.
Zitate
| Bild:Wikiquote-logo.png | Wikiquote: Statistik – Zitate |
- „Die Statistik ist so etwas wie die Physik der Mathematik“ (Urheber unbekannt)
- „Traue keiner Statistik, die du nicht selber gefälscht hast.“ Von der Nazipropaganda im Zweiten Weltkrieg erfunden und Winston Churchill zugeschrieben.
- „There are three kinds of lies: Lies, Damned Lies and Statistics.“ (Benjamin Disraeli, häufig fälschlicherweise Mark Twain zugeschrieben, der dieses Disraeli-Zitat in seiner Autobiografie bringt.) Deutsche Übersetzung: „Es gibt drei Arten der Lüge: Lüge, verdammte Lüge und Statistiken.“
- „Statistics are like bikinis. What they reveal is suggestive, but what they conceal is vital“. (Aaron Levenstein) Deutsche Übersetzung: „Statistik ist wie ein Bikini: Sie enthüllt eine Menge, aber das Wesentliche bleibt doch verborgen.“
- „Kann man mit der Statistik auch die Statistik beweisen?“ (Urheber unbekannt)
- „Statistik ist für mich das Informationsmittel der Mündigen. Wer mit ihr umgehen kann, kann weniger leicht manipuliert werden. Der Satz "Mit Statistik kann man alles beweisen" gilt nur für die Bequemen, die keine Lust haben, genau hinzusehen.“ Elisabeth Noelle-Neumann
- „Manche benutzen die Statistik, wie der Betrunkene die Straßenlaterne: zum Festhalten, nicht zur Erleuchtung!“ (Urheber unbekannt)
- „Eine neue Statistik belegt, dass 73% aller Statistiken rein erfunden sind“ (J.J.A. Weber)
Literatur
- Bleymüller, Gehlert, Gülicher: Statistik für Wirtschaftswissenschaftler. Verlag Franz Vahlen München 2004. ISBN 3-8006-3115-6
- Volker Oppitz/Volker Nollau: Taschenbuch Wirtschaftlichkeitsrechnung, Carl Hanser Verlag 2003, 400 S., ISBN 3-446-22463-7
- Newbold, Carlson, Thorne: Statistics for Business and Economics, New Jersey 2003
- Dietrich, Schulze: "Statistische Verfahren zur Maschinen- und Prozessqualifikation", 4. Auflage, Carl Hanser Verlag, München 2003. ISBN 3-446-22077-1
- Fahrmeir, Künstler, Pigeot, Tutz: Statistik. Der Weg zur Datenanalyse. Springer Verlag Berlin 2002. ISBN 3-540-44000-3
- Hartung, Elpelt, Klösener: Statistik: Lehr- und Handbuch der angewandten Statistik. R.Oldenbourg Verlag München 2002. ISBN 3-486-25905-9
Empfehlenswert für Praktiker. - Lambacher-Schweizer: Stochastik Leistungskurs, Für die Sekundarstufe II. LS Mathematik. Hrsg. v. August Schmid u. Wilhelm Schweizer. KLETT. Nachdr. 1999. ISBN 3-12-739370-9
Didaktisch gut gemacht, viele Aufgaben mit Lösungen in einem separaten Lösungsband. - Levine, Berenson, Stephan: Statistics for Managers, New Jersey 1999
- Freedman, Pisani, Purves: Statistics 1998 (Third Edition) ISBN 0-393-97121-x
- Volker Oppitz: Gabler Lexikon Wirtschaftlichkeitsberechnung, Gabler-Verlag 1995, 629 S., ISBN 3-409-19951-9
- Lindgren, Bernard W.: Statistical Theory, New York 1993
- Dolic, Dubravko: Statistik mit R, Oldenbourg 2004, ISBN 3-486-27537-2
- Walter Krämer: So lügt man mit Statistik, 7. überarb. Auflage, Campus Verlag, Frankfurt/New York 1997. ISBN 3-593-35689-9
- Rönz, Strohe: Lexikon Statistik, Gabler-Verlag 1994, ISBN 3-409-19952-7
Siehe auch
| Bild:Wikibooks-logo.png | Wikibooks: Einführung in Statistik – Lern- und Lehrmaterialien |
- Zufall, Kausalität, Korrelation, Durchschnitt, Median, Standardabweichung, Mittelwert, Wahrscheinlichkeit und Statistik, Varianz, Statistische Signifikanz, Fragebogen, Absolute Häufigkeit, Faktorenanalyse, Power, Parameter, Volkszählung, Altersverteilung, Clusteranalyse
- These, Deduktion, Induktion (Logik), Abduktion, Fehlschluss, Nullhypothese, Rhetorik, Dialektik, Fehler 1. und 2. Art, Prozentrang, Umweltstatistikgesetz
Weblinks
- http://www.emilea.de/index.html Multimediale, internetbasierte und interaktive Lehr- und Lernumgebung EMILe@-stat
- http://www.statsoft.com/textbook/stathome.html guter Überblick der wichtigsten statistischen Verfahren (Englisch)
- http://www.statistik.tuwien.ac.at/public/dutt/vorles/inf_bak/node1.html Zusammenhängender Text über die Grundlagen
- http://socr.stat.ucla.edu/ Statistics Online Computational Resources (SOCR) - Sammlung statistischer Methoden zur Online Datenanalyse u.v.m. (engl.)
- http://www.statistik-portal.de/ Statistische Ämter des Bundes und der Länder, Deutschland
- http://www.statistik.admin.ch/ Bundesamt für Statistik der Schweiz
- http://www.statistik.at Statistik Austria, Österreich
- http://www.rosuda.org/Software/ Software zur interaktiven statistischen Datenanalyse
- http://www.klein-singen.de/statistik/ Die Kunst mit Statistik zu lügen: Mit zahlreichen Beispielen aus Politik, Gesellschaft, Medizin und Wissenschaft wird das Verständnis des Lesers geschärft, zukünftig skeptischer Zahlenspielereien von (falschen) Experten zu begegnen.



