2 2" + 3 3"2 􀀀 : : : : Dieser Wert würde mit  sehr groß werden, wenn " nicht sehr groß auch gegen  wäre. Nun wird aber schon das Verhältnis des dritten zum zweiten Gliede dem absoluten Werte nach = 2 3  " : Dies ist ein sehr kleiner Wert. Wir können uns also auf die zwei ersten Glieder beschränken und finden ln () = ln c 􀀀 2 2" woraus folgt () = ce􀀀 2 2" oder () = ce􀀀h2 0 2 (C) für h2 0 = 2" = m0 2w(1 􀀀 w)(1 􀀀 ) : Näherungsformeln. 173 Es ist aber h0 eine sehr große,  eine sehr kleine Zahl. Zu berechenbaren Werten gelangen wir, wenn wir x = m0 pn0 = x pn0 ; h = pn0 m0 h0 einführen. Dann wird die Verteilungsfunktion (x) = h p e􀀀h2x2 ; genau wie früher, und angenähert h2 = 1 2w(1 􀀀 w) . Dies war zu erwarten, denn wir sahen schon, daß, wenn die Anzahl der herausgegriffenen Kugeln klein ist im Verhältnis zu der Anzahl der in der Urne enthaltenen Kugeln, der Fall genau so liegt, als ob die Kugeln einzeln gezogen und nach der Ziehung jedesmal zurückgelegt würden. In dem anderen Falle, wo weder w noch  nahe an 0 oder 1 liegen, können wir in den beiden Faktoren des Nenners  gegen das erste Glied vernachlässigen und erhalten dann sofort d ln () d = 􀀀 m0 w(1 􀀀 w)(1 􀀀 ) und daraus durch Integration () = ce􀀀h2 02 ; d. h. dieselbe durch die Ga u ßsche Funktion gegebene typische Verteilung wie vorhin und wie in dem Falle, wo die Kugeln einzeln gezogen und nach der Ziehung jedesmal zurückgelegt werden. Nur hat die frühere Größe r n 2w(1 􀀀 w) , in welcher wir m0 Achtes Kapitel. 174 statt n geschrieben zu denken haben, sich jetzt verwandelt in h0 = s m0 2w(1 􀀀 w)(1 􀀀 ) : Es tritt also noch ein Faktor hinzu, der am kleinsten ist, wenn die herausgegriffenen Kugeln die Hälfte von den in der Urne enthaltenen Kugeln betragen, und um so größer wird, je mehr sich die Anzahl der herausgegriffenen Kugeln von diesem Wert entfernt. Damit die Funktionswerte in den Grenzen der Berechenbarkeit liegen, muß h, d. h. auch x : pn0 einen berechenbaren Wert haben und x : n0 daher einen sehr kleinen Wert. Das Mischungsverhältnis p0 n0 = w + x n0 des herausgegriffenen Kugelhaufens weicht also wenig von dem Mischungsverhältnis w der Kugeln in der Urne ab. Aus allen bisherigen Betrachtungen hat sich uns für den Fall, daß sich die Verteilungsreihe einer kontinuierlichen Verteilungsfunktion nähert, immer eine bestimmte Funktion, die Ga u ßsche Funktion, ergeben. Diese Funktion ist ganz besonderer Art, unter anderem ist sie wesentlich symmetrisch. Es gibt aber eine Erweiterung des Urnenschemas, durch die eine wesentlich unsymmetrische Verteilung entspringt und die sich als von großer Bedeutung erwiesen hat, weil sie den Weg zeigt, wie man zu viel allgemeineren Verteilungsfunktionen gelangen kann. Diese Verallgemeinerung des Urnenschemas besteht darin, daß wir uns nicht bloß eine, sondern eine ganze Anzahl von Urnen denken, und zunächst durch das Los bestimmen, aus welcher Urne wir ziehen wollen. Für die Anzahl Male, die wir auf diese Näherungsformeln. 175 Weise die ite Urne treffen, ergibt sich hierbei eine bestimmte relative Häufigkeit wi derart, daß, wenn wir die Summation über alle Urnen ausdehnen, Pwi = 1 wird. Denken wir uns nun die Ziehungen an der iten Urne vollzogen, so möge uiz die relative Häufigkeit der Fälle bezeichnen, wo das Verhältnis der Anzahl der gezogenen weißen Kugeln zu der Anzahl der überhaupt gezogenen Kugeln gleich z ist. Wir haben dann eine typische stationäre Reihe vor uns und es gelten die früher abgeleiteten Beziehungen Pz uiz = 1; Pz uizz = ui; Pz uiz(z 􀀀 ui)2 = ui(1 􀀀 ui) n : Betrachten wir nun aber die Ziehungen so, daß wir alle Urnen berücksichtigen, daß also von vornherein nicht entschieden ist, aus welcher Urne wir ziehen, so müssen wir das zusammengesetzte Ereignis ins Auge fassen, dessen erster Teil die Bestimmung der Urne ist, aus welcher gezogen werden soll, und dessen zweiter Teil in den Ziehungen aus der Urne selbst besteht. Für dieses zusammengesetzte Ereignis wird nun die relative Häufigkeit wiuiz und daraus ergibt sich der Mittelwert w = Pi Pz wiuizz = Pi wiui: Die mittlere Ausweichung haben wir durch den Ausdruck zu bestimmen 2 = Pi Pz wiuiz(z 􀀀 w)2: Achtes Kapitel. 176 Diesen Ausdruck haben wir nun weiter auszurechnen. Zu dem Zweck beachten wir zunächst, daß Pi Pz wiuiz(z 􀀀 ui)2 = Pi wi ui(1 􀀀 ui) n = w n 􀀀 Pwiu2 i n wird. Wir finden dann weiter: 2 = Pi wi Pz uizz2 􀀀 2Pz uizz  w + w2 = Pi Pz wiuizz2 􀀀 w2: Nun wird, da Pz uizz2 = Pz uiz(z 􀀀 ui)2 + u2 i , Pi Pz wiuizz2 = Pi Pz wiuiz(z 􀀀 ui)2 +Pi wiu2 i = w n 􀀀 Pwiu2 i n +Pwiu2 i = w n + n 􀀀 1 n Pwiu2 i = w n + n 􀀀 1 n Pwi(ui 􀀀 w)2 + n 􀀀 1 n w2; also ergibt sich: 2 = w(1 􀀀 w) n + n 􀀀 1 n Pwi(ui 􀀀 w)2: So gelangen wir zu dem Resultat, daß die mittlere Ausweichung  = rw(1 􀀀 w) n + n 􀀀 1 n Pwi(ui 􀀀 w)2 Näherungsformeln. 177 wird, also in diesem Falle ( )  > rw(1 􀀀 w) n ist. Läßt man die Anzahl der jedesmal aus einer Urne gemachten Ziehungen unbegrenzt zunehmen, so wird die relative Häufigkeit (oder Wahrscheinlichkeit) der Fälle, wo das Mischungsverhältnis der gezogenen Kugeln zwischen z und z + dz liegt, wenn feststeht, daß aus der iten Urne gezogen wird, = e􀀀h2 i (z􀀀ui)2 hi dz p für hi = r n 2ui(1 􀀀 ui) und damit wird die Wahrscheinlichkeit, daß überhaupt das Ziehungsverhältnis zwischen z und z + dz liegt, (D) (z) dz = Pi wihi p e􀀀h2 i (z􀀀ui)2 dz: Daraus folgt sofort Z +1 􀀀1 (z) dz = 1; ferner Z +1 􀀀1 z(z) dz = Pi wiui = w: Endlich wird Z +1 􀀀1 z2(z) dz = Pwi ui(1 􀀀 ui) n +Pwiu2 i ; Achtes Kapitel. 178 entsprechend dem oben gefundenen Wert für 2. Wir sind so zu einer Verteilungsfunktion (z) = Pi wihi p e􀀀h2 i (z􀀀ui)2 (Pwi = 1) gelangt, die eine sofort einleuchtende Verallgemeinerung der einfachen Ga u ßschen Funktion bildet. Es ist allerdings keine ganz leichte Aufgabe, eine vorliegende empirische Verteilungsfunktion auf diese Form zu bringen. Was die Lösung dieser Aufgabe anbetrifft, so erinnert sie auf den ersten Anblick stark an die viel einfachere Aufgabe der Entwickelung einer gegebenen periodischen Funktion in eine Fo u - r i e rsche Reihe, aber bei näherem Zusehen bemerkt man doch bald die tiefgreifende Verschiedenheit beider Entwickelungen. Zwar kann man in beiden Fällen sagen, daß die wirklich vorhandene Funktion aus gewissen Teilfunktionen, im einen Falle die wirkliche Schwingung aus Sinusschwingungen, im anderen Falle die wirkliche Dispersion aus typischen (der Ga u ßschen Verteilungsfunktion folgenden) Dispersionen zusammengesetzt wird. Aber während im Falle der Fo u r i e rschen Reihe die nähere Bestimmung der Teilschwingungen durch einfache Teilung der ganzen Periode in gleiche Teile gewonnen wird, sind im Falle der Entwickelung einer Verteilungsfunktion nach Ga u ßschen Funktionen in jeder von diesen zwei zu bestimmende Konstanten, hi und ui, enthalten. Will man diese Konstanten nicht von vornherein, sondern so bestimmen, daß eine möglichste Annäherung an die wirkliche Verteilung bei einer möglichst geringen Anzahl von Entwickelungsgliedern erreicht wird, so erhält man schon in dem Falle, wo die Entwickelung aus nur zwei Gliedern besteht, eine ziemlich schwierige Rechnung. Es liegt daher naNäherungsformeln. 179 he, die Reihenentwickelung einer vorgelegten Verteilungsfunktion auf ganz anderem Wege zu versuchen. Der einfachste Weg wäre der, daß man nicht von der Funktion selbst, sondern von ihrer logarithmischen Derivierten ausgeht und diese in eine gewöhnliche Potenzreihe entwickelt. Für die Verteilungsfunktion selbst ergibt sich dann ein Ausdruck (z) = ea0+a1z+a2z2+a3z3+:::: Ein anderer, anscheinend besserer Weg ist der, daß das Produkt der gegebenen Verteilungsfunktion und einer Funktion eh2(z􀀀c)2 in eine Potenzreihe a0 + a1z + a2z2 + : : : entwickelt wird. Für die Verteilungsfunktion selbst ergibt sich dann ein Ausdruck (z) = e􀀀h2(z􀀀c)2 (a0 + a1z + a2z2 + : : : ): Man kann diese Entwickelung auch so fassen, daß man von der Funktion '(z) = e􀀀h2(z􀀀c)2 die sukzessiven Derivierten '1(z); '2(z); : : : einführt und dann setzt (z) = b0'(z) + b1'1(z) + b2'2(z) + : : : : Was diese Form der Entwickelung betrifft, so sei insbesondere auf H. Br u n s,Wahrscheinlichkeitsrechnung und Kollektivmaßlehre (Leipzig und Berlin 1906) verwiesen, wo die allgemeine Lösung in einer allerdings nicht ganz leicht zu übersehenden Weise gegeben ist. Neuntes Kapitel. Die statistische Theorie des Zufalls. Es handelt sich nun darum, aus den Entwickelungen der letzten Kapitel sozusagen die Nutzanwendung zu ziehen, indem wir in dem ganzen Bereich der Wirklichkeit die Erscheinungen suchen, die dem Schema der Zufallsspiele entsprechen. Dieses Entsprechen kann sich zunächst nur dadurch kundgeben, daß die Verteilung der empirisch festgestellten Zahlenwerte dieselbe ist, wie sie sich bei der Aufzeichnung der statistischen Ergebnisse im Falle häufiger Wiederholung des Zufallsspiels, im besonderen bei der Aufzeichnung der Ziehungsresultate, wenn das Zufallsspiel in den Ziehungen aus einer Urne besteht, ergeben würde. Wir wollen die Frage, inwieweit die äußere Übereinstimmung der statistischen Ergebnisse auch auf eine innere Gleichartigkeit der verglichenen Vorgänge schließen läßt, einstweilen beiseite lassen und vielmehr nur danach fragen, inwieweit die Übereinstimmung der statistischen Ergebnisse erreicht werden kann und wie man beurteilen soll, ob sie in hinreichender Weise vorhanden ist. Dies ist nicht so ganz einfach zu entscheiden, weil man bei der verhältnismäßig geringen Anzahl von Beobachtungen, die man meistens nur zur Verfügung hat, nicht eine völlige Regelmäßigkeit erwarten darf, vielmehr müssen die so gefundenen Werte mehr oder minder beträchtlich von den Zahlen abweichen, die sich bei unendlicher Häufung der Beobachtungen herausstellen würden. Die statistischen Ergebnisse der Ziehungen aus der Urne werden nicht wirklich aufgezeichnet, sie erscheinen ersetzt durch Die statistische Theorie des Zufalls. 181 die Formeln, welche wir bereits abgeleitet haben, und welchen die Bedeutung zukommt, daß sie den aus bestimmten theoretischen Erwägungen gefolgerten Ersatz für eine die wirklichen Ziehungsergebnisse bei einer sehr großen Zahl von Ziehungen registrierende Tabelle liefern. Wir haben so bestimmte Formeln, denen die aus der Gesamtheit alles Geschehens herauszugreifenden Vorgänge in ihren statistischen Ergebnissen zu entsprechen haben, d. h. wenn wir diese Ergebnisse graphisch auftragen, muß die Formel eine Kurve liefern, die verhältnismäßig nahe an den die statistischen Ergebnisse darstellenden Punkten vorbeiläuft. Wir können dies auch so ausdrücken, daß wir sagen: die Unterschiede zwischen den empirisch festgestellten und den aus der Formel folgenden Werten müssen eine stationäre Reihe bilden, die sich um den Mittelwert 0 gruppiert. Die sich so ergebende stationäre Reihe läßt sich aber meistens nicht mit genügender Sicherheit beurteilen, teils weil ihre Gliederzahl zu gering ist, teils weil die Genauigkeit der bestimmten Unterschiede verhältnismäßig zu klein ist. So ist eine exakte Beurteilung der vorliegenden Verteilungsreihe auf diesem Wege meistens nicht möglich. Deswegen ist es von Wichtigkeit, bestimmte zahlenmäßige Feststellungen zu haben, die wenigstens eine vorläufige Beurteilung, inwieweit die vorliegende Verteilungsreihe sich dem abgeleiteten Schema anpaßt, ermöglichen. Diese zahlenmäßigen Feststellungen ergeben sich aus dem Gedanken, daß, wenn die gefundene Verteilungsreihe die Form einer aus dem Urnenschema folgenden Verteilungsreihe hat, auch für sie die Beziehungen gelten müssen, die wir bei dem Urnenschema fanden. Von solchen Beziehungen war die erste die Relation, die wir bei dem ersten Urnenschema, den Ziehungen einer Kugel aus einer Urne, zwischen dem Mischungsverhältnis Neuntes Kapitel. 182 und der mittleren Ausweichung der entstehenden Verteilungsreihe erhielten. Diese Relation hat Le x i s 1) benutzt, um einen ersten Anhaltspunkt dafür zu gewinnen, inwiefern die Dispersionen, die sich bei statistischen Verhältniszahlen ergeben, sich mit der aus dem einfachen Urnenschema folgenden Verteilungsreihe vergleichen lassen. Zur Aufstellung der Relation ist notwendig, daß zuerst der Durchschnittswert y0 der sämtlichen beobachteten r Verhältniszahlen yi berechnet wird. Daraus wird der Wert für die mittlere Ausweichung 1 in folgender Weise bestimmt (indem y0 an die Stelle von w tritt): (1) 1 = ry0(1 􀀀 y0) n ; wenn n die Durchschnittsanzahl der Fälle bezeichnet, auf die sich die einzelnen Verhältniswerte beziehen. Dieses Verfahren bezeichnet Le x i s als die s t a t i s t i s ch e Me t h o d e. Ihr steht die sogenannte p hy s i ka l i s ch e Me t h o d e gegenüber, bei welcher die mittlere Ausweichung nach der Formel (2) 2 = rP(yi 􀀀 y0)2 r 􀀀 1 bestimmt wird, indem der Fehlertheorie entsprechend r 􀀀 1 statt r genommen wird, was an sich belanglos ist (vgl. S. 88). Entspricht die Verteilungsreihe dem einfachen Urnenschema, so müssen die beiden gefundenen Werte gleich sein. Le x i s setzt daher (3) Q = 2 1 ; 1) Vgl. die grundlegende Schrift Zur Theorie der Massenerscheinungen in der menschlichen Gesellschaft, Freiburg 1877. Die statistische Theorie des Zufalls. 183 und spricht von einer n o rma l e n Di s p e r s i o n, wenn wenigstens angenähert Q = 1 ist. Wird dagegen Q > 1, so spricht er von einer ü b e r n o rma - l e n Di s p e r s i o n und im Falle Q < 1 von einer u nt e r n o r - ma l e n Di s p e r s i o n. DerWert Q wird neuerdings als Di ve r - g e n z ko e f f i z i e nt bezeichnet. Zu beachten ist von vornherein, daß seine Bildung nur dann einen Sinn hat, wenn 1 und 2 nicht zu klein sind, weil sonst aus der geringsten Abweichung in 1 oder 2 eine große Schwankung im Werte von Q entstehen würde. Insbesondere darf also y0 weder nahe an 0 noch nahe an 1 liegen. Um einen Begriff davon zu geben, wie sich die Werte des Divergenzkoeffizienten Q in der Wirklichkeit gestalten können, wollen wir mit Le x i s 1) das Beispiel des Ve r h ä l t n i s s e s d e r S t e r b l i ch ke i t e n f ü r d a s mä n n l i ch e u n d we i b l i ch e Ge s ch l e cht i n d e n ve r s ch i e d e n e n Le b e n s a l t e r n nehmen. Die Zahlen entstammen der belgischen Statistik für die Jahre 1841 bis 1860. Die Kolumne unter z gibt an die Anzahl der gestorbenen männlichen Individuen auf 1000 weibliche. Aus dieser Tabelle geht hervor, daß während des ersten Lebensjahres die Dispersion als eine normale angesehen werden kann, ja sogar während der ersten fünf Jahre, da der einzige zu große Wert 1; 53 in den Mängeln der Statistik begründet sein kann. Während der folgenden Jahre finden wir dagegen zum Teil sehr weitgehende Abweichungen von dem Normalwert 1. 1) Conrads Jahrbücher für Nationalökonomie und Statistik, Bd. 32 (1879), S. 60. Neuntes Kapitel. 184 Alter z Q Alter z Q Totgeboren 1348 0; 99 15–20 Jahre 770 2; 1 0– 1 Monat 1359 0; 84 20–25 ” 1095 1; 7 1– 2 Monate 1323 1; 15 25–30 ” 905 1; 5 2– 3 ” 1253 0; 91 30–40 ” 826 2; 1 3– 4 ” 1224 1; 14 40–45 ” 943 2; 3 4– 5 ” 1284 1; 04 45–50 ” 1143 3; 4 5– 6 ” 1257 1; 06 50–55 ” 1124 4; 3 6– 9 ” 1179 1; 13 55–60 ” 1055 4; 3 9–12 ” 1085 1; 12 60–65 ” 962 3; 5 1– 2 Jahre 1028 1; 53 65–70 ” 913 4; 3 2– 3 ” 990 1; 06 70–75 ” 906 4; 1 3– 5 ” 947 1; 16 75–80 ” 903 2; 1 5–10 ” 878 1; 66 80–85 ” 866 1; 26 10–15 ” 713 2; 5 85–90 ” 800 1; 29 In der Tat läßt sich eine solche Übereinstimmung, wie sie für die normale Dispersion gefordert wird, nur aus einer vermuteten Gemeinsamkeit gewisser allgemeiner Eigenschaften des vorliegenden Ereignisses mit den Vorgängen bei den Ziehungen aus einer Urne erklären. Daß eine solche Gemeinsamkeit aber nur in sehr vereinzelten Fällen angenommen werden kann, liegt auf der Hand, und so finden sich nur wenige Fälle, in denen wirklich angenähert Q = 1 wird. Wir haben aber nachgewiesen, daß auch die Fälle, wo Q 6= 1 wird, sich auf Grund eines abgeänderten Urnenschemas erklären lassen. Nahmen wir nämlich an, daß das Mischungsverhältnis der schwarzen und weißen Kugeln in der Urne nicht von Die statistische Theorie des Zufalls. 185 vornherein feststeht, sondern während der Ziehungen sich ändert (wir setzten voraus, es sei eine ganze Reihe von Urnen mit allen möglichen Mischungsverhältnissen vorhanden, und ließen die einzelnen Ziehungen aus je einer durch das Los oder sonstwie bestimmten Urne stattfinden), dann zeigte sich, daß die Verteilung der Ziehungsergebnisse wohl noch, wenn die Reihenfolge der gewählten Urnen von der einen zur anderen Ziehungsreihe festgehalten wurde, der gleichen Verteilungsfunktion wie früher, nämlich der Ga u ßschen Funktion folgte, aber die Beziehung 2 = 1 zwischen den oben angegebenen Werten (1) und (2) aufhörte zu bestehen und in die Ungleichheit 2 < 1 überging, so daß sich Q < 1, also eine unternormale Dispersion ergibt. Nennen wir also das Mischungsverhältnis der Kugeln in der Urne jedesmal die dem Ereignis (d. h. der Ziehung) zugrunde liegendeWahrscheinlichkeit, so würde sich das allgemeine Resultat herausstellen: Di e u nt e r n o rma l e Di s p e r s i o n l ä ß t s i ch e r k l ä - r e n d u r ch e i n e d em Er e i g n i s z u g r u n d e l i e g e n d e , vo n Fa l l z u Fa l l we ch s e l n d e Wa h r s ch e i n l i ch ke i t . Andererseits hatten wir gefunden, daß, wenn die Ziehungen einer Reihe immer aus derselben Urne stattfinden, aber unter den Urnen mit allen möglichen Mischungsverhältnissen diejenige, aus welcher gezogen werden soll, erst durch das Los bestimmt wird, dann sich eine Verteilung ergibt, bei der 2 > 1; die Dispersion also eine übernormale ist. Neuntes Kapitel. 186 Di e ü b e r n o rma l e Di s p e r s i o n l ä ß t s i ch a l s o d a d u r ch e r k l ä r e n , d a ß d i e d em Er e i g n i s z u g r u n d e l i e g e n d e Wa h r s ch e i n l i ch ke i t wo h l b e i a l l e n d e n Fä l l e n , d i e z u r Bi l d u n g d i e s e s We r t e s d e r r e l a - t i ve n Hä u f i g ke i t b e nu t z t wu r d e n , d i e s e l b e i s t , a b e r n i cht d i e s e l b e b e i d e n ve r s ch i e d e n e n Gr u p - p e n vo n Fä l l e n , d i e z u d e r Bi l d u n g d e r e i n z e l n e n r e l a t i ve n Hä u f i g ke i t swe r t e b e nu t z t s i n d . Damit ist in der Tat eine gewisse Erklärung für das Auftreten und die Unterscheidung der drei verschiedenen Dispersionsarten gefunden 1). Man darf aber die Bedeutung dieser Erklärung nicht überschätzen. Vor allem ist schwer einzusehen, wie sich in der Wirklichkeit eine von Fall zu Fall wechselnde, aber bei jeder Gruppe von Fällen in der gleichen Weise wiederkehrende Wahrscheinlichkeit ergeben soll. Nicht viel natürlicher ist die Annahme, daß bei jeder Gruppe von Fällen eine andere, aber bei den einzelnen Fällen einer Gruppe dieselbe Wahrscheinlichkeit vorhanden sein soll, denn die Einteilung der Fälle in Gruppen, an denen man die relative Häufigkeit bestimmt, ist doch meist eine an sich willkürliche, und die Fälle schließen sich örtlich und zeitlich kontinuierlich aneinander an. Man wird sich daher darauf beschränken müssen, zu sagen: e i n We ch s e l d e r Wa h r - 1) Der Grundgedanke und ein Teil der analytischen Entwickelung bei dieser Erklärung geht auf Po i s s o n zurück; die Deutung der übernormalen Dispersion, die Le x i s ausführlich erörtert hatte, hat insbesondere v. Bo r t kewi t s ch (Das Gesetz der kleinen Zahlen, 1898, S. 29) noch weiter ausgestaltet. Man vgl., was allgemein die Anwendung der Wahrscheinlichkeitsrechnung auf Statistik betrifft, desselben Verfassers Kritische Betrachtungen zur theoretischen Statistik, Conrads Jahrbücher (3), Bd. 8, S. 641; Bd. 10, S. 321; Bd. 11, S. 671 (1894–1896). Die statistische Theorie des Zufalls. 187 s ch e i n l i ch ke i t i n n e r h a l b e i n e r Gr u p p e vo n Fä l l e n ve r r i n g e r t d i e Di s p e r s i o n , e i n We ch s e l vo n e i n e r Gr u p p e z u r a n d e r e n e r h ö ht s i e . Es bleibt noch übrig, kurz der anderen Deutungsart zu gedenken, wo die Kugeln aus der Urne nicht einzeln, sondern auf einmal gezogen werden. In diesem Falle tritt in dem Ausdruck für die mittlere Ausweichung unter der Wurzel zu w(1 􀀀 w)=n noch ein Faktor (1􀀀) hinzu, der immer < 1 ist, es ergibt sich also 2 < 1 und demnach wird Q < 1; die Dispersion ist also unternormal. Diese Erklärung der unternormalen Dispersion scheint an sich sehr einleuchtend. Aber wieder erhebt sich der Einwand, daß es meistens durchaus nicht der Wirklichkeit entspricht, wenn die Fälle einer Gruppe als eine natürliche Gesamtheit angesehen werden, wie es doch geschieht, wenn sie durch die mit e i n em Griff aus der Urne herausgeholten Kugeln illustriert werden. Immerhin könnte man ja vermuten, daß gerade da die unternormale Dispersion sich einstellt, wo die Verhältniszahlen sich in gewisser Weise auf solche natürliche Gruppen beziehen. Das bekannteste Beispiel für eine vermutliche normale Dispersion bildet das Ge s ch l e cht s ve r h ä l t n i s d e r Ge b o - r e n e n. Auch dieses hat Le x i s ausführlich behandelt (Conrads Jahrbücher für Nationalökonomie und Statistik, Bd. 27 (1876), S. 206; Abhandlungen zur Theorie der Bevölkerungs- und Moralstatistik, 1903, S. 130), indem er die Zahlen für die verschiedenen preußischen Regierungsbezirke in den einzelnen Monaten Neuntes Kapitel. 188 der Jahre 1868 und 1869 zugrunde legte. Wir wollen seine Resultate nur für die größten Bezirke anführen. Es ergibt sich: Bezirk n Q Königsberg . . . . . 3426 1; 06 Potsdam . . . . . . . 3028 0; 96 Frankfurt. . . . . . . 3211 0; 98 Posen . . . . . . . . . . 3738 1; 01 Breslau. . . . . . . . . 4766 0; 89 Oppeln . . . . . . . . . 4855 0; 92 Magdeburg . . . . . 3650 1; 02 Düsseldorf. . . . . . 4305 1; 12 Die Zahlen n beziehen sich auf die Geburten während eines Monates. DieWerte von Q kommen hier der Einheit so nahe, wie man es überhaupt erwarten kann, so daß wir hier in der Tat mit ziemlicher Sicherheit von einer normalen Dispersion sprechen können. Trotzdem wäre der Schluß übereilt, daß wir mit Gewißheit annehmen können, in dem Geschlechtsverhältnis der Geborenen liege der Typus einer rein zufälligen Verteilung vor. Abgesehen davon, daß die bloße Bestimmung des Divergenzkoeffizienten Q allein dafür nicht ausreichend ist, beruht die Annäherung an den Wert 1, die Le x i s gefunden hat, wie es scheint, auf der günstigen Auswahl der Beobachtungsbezirke und der verhältnismäßig kurz genommenen Beobachtungsdauer. Jedenfalls gelangt man zu anderen Ergebnissen, wenn man als Beobachtungsdauer statt eines Monates je ein Jahr und als Beobachtungsbezirk das Königreich Sachsen nimmt 1). Es ergeben sich folgende Werte für 1) Vgl. E. Bl a s ch ke, Vorlesungen über mathematische Statistik, LeipDie statistische Theorie des Zufalls. 189 das Verhältnis y der männlichen Geburten zu der Gesamtzahl der Geburten: Jahr y Jahr y Jahr y Jahr y 1891 0; 512 14 1896 0; 513 01 1901 0; 511 77 1906 0; 511 14 1892 0; 513 94 1897 0; 512 83 1902 0; 512 43 1907 0; 512 35 1893 0; 512 13 1898 0; 511 85 1903 0; 510 19 1908 0; 511 04 1894 0; 510 36 1899 0; 512 90 1904 0; 512 86 1909 0; 513 21 1895 0; 512 14 1900 0; 514 87 1905 0; 513 20 1910 0; 512 02 Für die Periode 1891 bis 1900 findet man hieraus den Wert Q = 0; 904, für die Periode 1901 bis 1910 den Wert Q = 0; 705. Diese Übereinstimmung ist weit weniger gut als die von Le x i s gefundene. Daß die Verschiedenheiten der Verhältniszahlen für die einzelnen Jahre nicht auf bloßen Zufälligkeiten beruhen, kann man aus den Zahlen für das gesamte Deutsche Reich während der letzten Jahre ersehen. Es entfallen auf 100 Mädchengeburten an Knabengeburten: 1906 . . . . . . . . . . . 106; 0 1910 . . . . . . . . . . . 105; 9 1907 . . . . . . . . . . . 106; 3 1911 . . . . . . . . . . . 106; 1 1908 . . . . . . . . . . . 106; 1 1912 . . . . . . . . . . . 106; 5 1909 . . . . . . . . . . . 105; 9 Dabei erscheint auffallend die Steigerung im letzten Jahre 1912. Sieht man nun zu, wie sie zustande gekommen ist, so erkennt man merkwürdigerweise, daß sie wesentlich von den süddeutschen Staaten herrührt. Die Zahl hat sich in Preußen von zig 1906; H. Fo r ch e r, Die statistische Methode als selbständige Wissenschaft, Leipzig 1913. Neuntes Kapitel. 190 106; 4 für 1911 nur auf 106; 5 für 1912 bewegt, während wir für die süddeutschen Staaten finden: 1911 1912 Bayern. . . . . . . . . . . . . . . 105; 9 106; 8 Württemberg . . . . . . . . 103; 6 106; 4 Baden . . . . . . . . . . . . . . . 105; 3 106; 0 Elsaß-Lothringen. . . . . 105; 3 106; 5 Es ist danach kein Zweifel, daß wesentlich auf diesen verhältnismäßig bedeutenden Verschiebungen auch die Änderung in der Gesamtziffer beruht. Der starke Einfluß des Landes auf das Geschlechtsverhältnis der Geborenen ist bekannt. Es kamen z. B. auf 100 Mädchengeburten während des Zeitraumes 1887 bis 1891 an Knabengeburten in England . . . . . 103; 6 in Spanien. . . . . .108; 3 Nach Be r t i l l o n (Anhang zum Annuaire statistique de la ville de Paris für 1905, Paris 1907) übt das Alter der Mutter einen deutlich erkennbaren Einfluß auf das Geschlecht des Kindes aus. Nach den Erhebungen in Paris 1891 bis 1905 ergeben sich auf 100 Mädchengeburten folgende Zahlen von Knabengeburten: Alter der Mutter: 15–19 20–24 25–29 30–34 35–39 40–44 45–49 Eheliche 107; 1 106; 2 106; 4 106; 5 106; 6 113; 0 105; 0 Uneheliche 104; 5 105; 3 102; 2 105; 0 103; 7 112; 1 102; 1 Es zeigt sich also eine deutliche Zunahme der Knabengeburten für die mittleren Lebensjahre der Mutter. Die statistische Theorie des Zufalls. 191 Die Bestimmung des Divergenzkoeffizienten Q ist gewissermaßen der erste Schritt zur Beurteilung der Dispersion. Sie gibt z. B. noch keinen Anhaltspunkt für die Beurteilung einer vorhandenen Asymmetrie. Hierfür ist, wie wir bereits gesehen haben, von Wichtigkeit, daß außer dem arithmetischen Mittel auch der Zentralwert, unter dem und über dem gleich viel der Beobachtungswerte liegen, und der Normalwert, für den sich in der aus der Urreihe abgeleiteten Verteilungsreihe die größte relative Häufigkeit ergibt, gebildet werden. Fallen diese drei Werte zusammen, so liefert dies einen Anhaltspunkt dafür, daß die Dispersion eine symmetrische ist. Wir haben also folgende drei Werte zu bestimmen: 1. Den Durchschnittswert der Beobachtungswerte y0 = Pyi r oder, wenn wir die Verteilungsfunktion '(y) einführen, (4) y0 = Z +1 􀀀1 '(y)y dy : Z +1 􀀀1 '(y) dy: 2. Den Zentralwert yz, für den (5) Z yz 􀀀1 '(y) dy = Z +1 yz '(y) dy wird. 3. Den Normalwert ya, für den (6) '(ya) = Max. Neuntes Kapitel. 192 wird. Dann muß, wenn eine symmetrische Verteilung vorliegt, y0 = yz = ya werden. Dieser Wert kann als der ty p i s ch e We r t bezeichnet werden. Man wird sich nun aber schwer entschließen, mit dieser Bestimmung die Beurteilung der Verteilungsreihe abzuschließen. Der letzte Zielpunkt muß vielmehr sein, ein „Gesetz“ für die Verteilung selbst herauszufinden. Auch dazu kann die Betrachtung des Urnenschemas dienen. Hierbei hat sich uns überall, wo die Anzahl der beobachteten Fälle sehr groß war, die Ga u ßsche Verteilungsfunktion ergeben, und wenn wir eine allgemeinere Verteilungsfunktion erstrebten, so mußten wir sie uns aus der Übereinanderlagerung Ga u ßscher Funktionen hervorgegangen denken (ähnlich wie man sich die allgemeine Schwingung aus der Superposition von Sinuswellen hervorgegangen denkt). Das legt es nahe, zunächst zu versuchen, wie weit man mit der einfachen Ga u ßschen Verteilungsfunktion kommt. In diesen Fällen kann, wie wohl nicht mehr besonders hervorgehoben zu werden braucht, die Dispersion sowohl eine normale als auch eine unter- oder übernormale sein, die Gültigkeit des Ga u ßschen Verteilungsgesetzes und die Le x i ssche Beurteilung der normalen Dispersion fallen keineswegs zusammen. Es zeigt sich nun, daß unter der Voraussetzung einer ty p i s ch e n Dispersion, die der Ga u ßschen Funktion '(x) = h p e􀀀h2x2 folgt, sich für die Konstante h in dieser Funktion eine dreifache Bestimmung ergibt. Die eine Bestimmung benutzt die Werte, Die statistische Theorie des Zufalls. 193 unter oder über denen ein Viertel der beobachteten Zahlenwerte liegt. Nennt man  den Unterschied dieser Werte, so wird (7) 1 h1 =  0; 9539 : Die zweite Formel benutzt die Summe der Abweichungen y aller Beobachtungswerte, d. h. aller Glieder y der Urreihe, die über oder unter dem Mittelwert liegen, von diesem Mittelwert. Ist r die Gesamtzahl aller bestimmten Werte, so folgt (8) 1 h2 = 2p P+ (yi 􀀀 y0) r = 􀀀2p P􀀀 (yi 􀀀 y0) r ; wenn P+ , P􀀀 bedeutet, daß die Summation über alle positiven oder alle negativen Werte der Differenz yi 􀀀y0 erstreckt werden soll. Die dritte Bestimmung beruht auf der Quadratensumme aller vorkommenden Abweichungen vom Mittelwert und liefert (9) 1 h3 = r2P(yi 􀀀 y0)2 r 􀀀 1 : Der letzte Wert stimmt bis auf den Faktor p2 mit der mittleren Ausweichung 2 überein. Wenn man im vorliegenden Falle diese Bestimmungen verwerten will, so muß man alle überhaupt vorliegenden Bestimmungen, die sich auf die einzelnen Monate der Jahre 1868 und 1869 beziehen, zusammenfassen und erhält dann eine Gesamtheit von 816 Einzelbestimmungen. Le x i s zieht es aber vor, zunächst eine Gruppe aus den 17 größten Bezirken zu wählen, zu denen auch die oben angeführten gehören. Es liegen dann nur 408 Einzelbestimmungen vor, für die sich in der Tat Neuntes Kapitel. 194 nach den drei möglichen Methoden derselbe Mittelwert 1065; 8 und folgende Verteilungsreihe ergibt: Abweichung Beobachtete Fälle + 􀀀 + 􀀀 0– 20 82 73 20– 40 57 65 40– 60 41 43 60– 80 16 9 80–100 5 9 Über 100 3 5 Führt man nun die drei Bestimmungen von h aus, so ergeben sich die Werte h1 = 0; 018; h2 = 0; 019; h3 = 0; 019; also eine gute Übereinstimmung. Rechnet man aber mit Hilfe des bestimmten Normalwertes und des Wertes von h nach der Ga u ßschen Funktion die Häufigkeitszahlen aus, so findet man die folgenden Zahlenreihen: Berechnet . . . . . . 82 61 37 17 5 2 Beobachtet : : :+ 􀀀 82 57 41 16 5 3 74 65 43 9 9 5 Bei der Beurteilung der so erreichten Übereinstimmung muß man die Unsicherheit bedenken, die an sich wegen der verhältnismäßig geringen Zahl beobachteter Fälle vorhanden ist. Dann muß in der Tat die gefundene Übereinstimmung als eine sehr gute gelten. Die statistische Theorie des Zufalls. 195 Um noch ein Beispiel zu haben, das von vornherein jeder solchen Bestimmung zu spotten scheint, wollen wir mit Pe a r - s o n das Verhältnis der unionistischen Stimmen zur Gesamtzahl der Stimmen bei den englischen Wahlen im Jahre 1891 nehmen. Wir haben die herauskommende Verteilungsreihe graphisch auf- Fig. 8. Verhältnis der unionistischen Stimmen zur Gesamtzahl der Stimmen bei den englischen Wahlen 1891. gezeichnet, indem für die Abszisse die Prozente der Stimmenzahl und für die Ordinate die zugehörigen Anzahlen von Wahlbezirken genommen sind. Für den zugrunde zu legenden typischen Wert ergibt sich 0; 51 = 51 Proz. und die drei Bestimmungen von hi liefern: h1 = 0; 09; h2 = 0; 11; h3 = 0; 12: Die Verteilung, die sich nach der Ga u ßschen Funktion ergibt, ist durch die eingezeichnete Kurve angedeutet. Neuntes Kapitel. 196 Die Übereinstimmung, die man hier erhält, darf man aber nicht so deuten, als ob die herauskommenden Prozentsätze der Stimmenzahl mit den Ziehungsverhältnissen des Urnenschemas direkt verglichen werden könnten. Die überhaupt möglichen Prozentsätze von 0 bis 100 Proz. entsprechen vielmehr alle einem nur zwischen sehr engen Grenzen schwankenden Ziehungsverhältnis. Es werden gar nicht mehr die Verhältniswerte als solche verglichen, sondern nur die herauskommenden Verteilungsreihen. Die Vergleichung wird damit viel äußerlicher. Wir vergleichen nicht mehr den wirklichen Vorgang selbst mit dem Vorgang bei den Ziehungen aus einer Urne. Wir versuchen nur, die aus dem Urnenschema theoretisch abgeleitete Verteilungsfunktion der wirklich beobachteten Verteilungsreihe anzupassen. Wir können höchstens die Vorgänge bei der Ziehung aus der Urne symbolisch fassen, indem wir sie als den Ausdruck für beliebige Zufallsvorgänge deuten, die wir so einer Berechnung zugänglich machen. Es würde in dem vorliegenden Beispiel etwa das Ziehen einer weißen Kugel einen sehr kleinen Ausschlag der Stimmen nach der unionistischen Seite bedeuten. Man kann aber auch von der Herleitung der Formel aus dem Urnenschema, nachdem sie einmal gewonnen ist, völlig absehen und sich darauf beschränken, die Vorgänge zu suchen, die sich dieser Formel anpassen und damit einen gemeinsamen Charakter zeigen, den man definitionsmäßig als den des Zufälligen ansehen kann. Sehr wichtig erscheinen hierbei zunächst die Fälle, wo die Gültigkeit der Ga u ßschen Verteilungsfunktion als eine physikalische Hypothese erscheint. Dies gilt vor allen Dingen für die Bewegungen der kleinsten Teile der Materie, zunächst der Moleküle. Die Bewegungen der Moleküle sind unbeobachtbar und Die statistische Theorie des Zufalls. 197 daher ist eine unmittelbare Kontrolle durch die Erfahrung in diesem Falle unmöglich. Eine solche gelingt jedoch bei sehr kleinen, in einer Flüssigkeit suspendierten Teilchen, die den Molekularbewegungen ähnliche und, wie man glaubt, durch die Molekularbewegungen (nämlich die Stöße der Flüssigkeitsmoleküle auf die festen Teilchen) unmittelbar veranlaßte Bewegungen, die sogenannten Br ownschen Bewegungen, ausführen. J. Pe r r i n (Die Atome, deutsch von Lo t t e rmo s e r, Dresden und Leipzig 1914) hat in einem Falle die Verschiebungen der Teilchen in Zwischenräumen von 30 Zeitsekunden notiert und daraus folgende Tabelle gefunden, in der den beobachteten die nach der Ga u ßschen Verteilungsfunktion für die 500 Beobachtungen berechneten Anzahlen hinzugefügt sind. Der Wert von " beträgt 1; 96 Mikron. Verschiebungen, die enthalten sind zwischen Anzahl berechnet Anzahl beobachtet 0 und " 32 34 " ” 2" 83 78 2" ” 3" 107 106 3" ” 4" 105 103 4" ” 5" 75 75 5" ” 6" 50 49 6" ” 7" 27 30 7" ” 8" 14 17 8" ” 1 7 9 Die Tabelle ist zugleich lehrreich dafür, welche Übereinstimmung man erwarten darf, wo die Gültigkeit der Ga u ßschen VerNeuntes Kapitel. 198 teilungsfunktion von vornherein so gut wie sicher ist 1). Ein weiteres besonders hervorragendes Beispiel besteht in der Messung der Körperlänge erwachsener Personen. Hierfür hat Pe a r s o n 2) ausgezeichnetes Material in den Messungen der Körpergröße von 25 875 Rekruten der Armee der Vereinigten Staaten angeführt. Die Körpergrößen sind in Zoll und daneben die Anzahlen der Rekruten von der betreffenden Größe angeführt. Wir beginnen damit, daß wir den Mittelwert auf die drei angegebenen Weisen bestimmen. Wir finden dann mit ziemlich genauer Übereinstimmung den Mittelwert oder Normalwert y0 = 66; 7: Hierauf berechnen wir die Größe h nach den angegebenen drei 1) Man vergleiche des weiteren L. v. Bo r t kewi t s c h, Die radioaktive Strahlung als Gegenstand wahrscheinlichkeitstheoretischer Untersuchungen, Berlin 1913. 2) Man vgl. die Aufsätze von Pe a r s o n in den Transactions of the Royal Society 1894 bis 1903 (Vol. 185 bis 198) und Philosophical Magazine 1900, 1901 (Vol. 50, 1), ferner seine Schrift The chances of death etc., London 1897. Daneben ist es interessant, die Arbeiten von Ed g ewo r t h einzusehen, besonders Journal of the Royal Statistical Society, Vol. 60 bis 62 (1897 bis 1899), und als besondere Schrift unter dem Titel The representation of Statistics by mathematical formulae, London 1900. An zusammenfassenden Darstellungen kann man außer den bereits angeführten etwa vergleichen Ki n g, Elements of statistical method, New York u. London, Macmillan, Dave n p o r t, Statistical Methods, New York, Wiley & Son. Ferner die Schriften von We s t e r g a a r d, Grundzüge der Theorie der Statistik, Jena 1890, Lehre von der Mortabilität und Morbidität, 2. Aufl. 1901. Unter den Lehrbüchern der Wahrscheinlichkeitsrechnung hat besonders das von Cz u b e r (Leipzig 1902) die statistischen Anwendungen ausführlich behandelt. Die statistische Theorie des Zufalls. 199 Körpergröße Anzahl Körpergröße Anzahl 78–77 2 64–63 1947 77–76 6 63–62 1237 76–75 9 62–61 526 75–74 42 61–60 50 74–73 118 60–59 15 73–72 343 59–58 10 72–71 680 58–57 6 71–70 1485 57–56 7 70–69 2075 56–55 3 69–68 3133 55–54 1 68–67 3631 54–53 2 67–66 4054 53–52 1 66–65 3475 52–51 1 65–64 3019 Methoden und finden so h1 = 0; 27; h2 = 0; 27; h3 = 0; 28: Wir erhalten dann das Bild, das in Fig. 9 auf der folgenden Seite dargestellt ist. Die Übereinstimmung ist recht gut, so daß wir in der Tat annehmen können, daß die Verteilung der Körpergrößen erwachsener Personen dem Ga u ßschen Verteilungsgesetz folgt. Dagegen haben Messungen an gleichaltrigen Kindern gezeigt, daß die Verteilung bei nicht erwachsenen Personen eine andere, nämlich eine wesentlich unsymmetrische ist, indem ein Zurückbleiben des Wachstums gegen den normalen Wert häufiger als ein Vorauseilen ist. Die Auffassung, daß man in dem Ga u ßschen VerteilungsNeuntes Kapitel. 200 gesetz das Symptom für eine auf bloßen Zufälligkeiten beruhende Verteilung zu sehen habe, ist lange Zeit durchaus herrschend gewesen. Ihr ist z. B. Qu é t e l e t durchaus gefolgt, sie findet sich auch in dem englischen Werke von Ve n n, The logic of chance (London 1876) konsequent vertreten. Diese Ansicht ist aber, wie wir gesehen haben, weder in dem Sinne richtig, daß, wo die Verteilung mit hinreichender Annäherung dem Ga u ßschen Verteilungsgesetz folgt, die Abweichungen bestimmt in jedem einzelnen Falle nur auf Zufälligkeiten beruhen, noch in dem Sinne, daß sich immer die Ga u ß sche Verteilungsfunktion ergibt, wo wir zufällige Schwankungen anzunehmen haben. Dies geht aus der Verallgemeinerung hervor, die wir an das Urnenschema angeknüpft haben, indem wir annahmen, daß erst durch das Los bestimmt wird, aus welcher von mehreren vorhandenen Urnen gezogen wird. Wir haben dabei im Gegensatz zu der Symmetrie der Ga u ßschen Verteilungsfunktion eine wesentlich unsymmetrische Verteilung gefunden, und es scheint von Interesse, auch dafür ein Beispiel zu finden. Der einfachste Fall, den wir hierbei annehmen können, ist der, wo nur zwei Urnen vorhanden sind, wo also nur zwei Wahrscheinlichkeiten w1 und w2 dafür, daß aus der einen oder anderen Urne gezogen wird, in Betracht kommen. Die Relation w1 + w2 = 1 kommt weiter nicht in Frage, da noch mit einer Konstanten c multipliziert werden muß. Wir können dann (indem wir c1 = cw1, c2 = cw2 setzen) die Verteilungsfunktion schreiben: (10) (z) = c1h1 p e􀀀h2 1 (z􀀀u1)2 + c2h2 p e􀀀h2 2 (z􀀀u2)2 : Für diese Verteilungsfunktion wollen wir, wiederum nach Die statistische Theorie des Zufalls. 201 Fig. 9. Pe a r s o n, ein Beispiel geben. Dieses Beispiel hat eine gewisse Berühmtheit erlangt, weil es den Ausgangspunkt weitergehender Untersuchungen gebildet hat.Wenn eine solche Streuung wie die angeführte besteht, so liegt der Fall genau so, als ob die beobachteten Individuen aus zwei Gattungen gemischt seien, für deren Verteilung einzeln die gewöhnliche Ga u ß sche Verteilungsfunktion gilt. Man beobachtet nun eine entsprechende Verteilung bei biologischen Individuen auch dann, wenn nicht sie selbst, wohl aber ihre Vorfahren aus zwei verschiedenen Arten gemischt sind. Es wird also das Bestehen einer solchen Verteilung das Kennzeichen für eine stattgefundene Bastardierung. Neuntes Kapitel. 202 Das Beispiel, das wir geben wollen, bezieht sich auf die „Stirnbreite“ von 1000 Krabben aus dem Golf von Neapel. Die zugrunde liegende Tabelle ist die auf folgender Seite. Um die in der graphischen Darstellung (Fig. 10) eingezeichnete Kurve zu erhalten, die sich den beobachteten Werten möglichst anschmiegt, sind für die Konstanten in der Formel folgende Werte genommen (für den Durchschnittswert ist z = 0, woraus 􀀀c1u1 = c2u2): c1 = 414; 5; u1 = 􀀀3; 517; h1 = 0; 159; c2 = 585; 5; u2 = 2; 490; h2 = 0; 228 1): 1) Außer den hier angeführten Verteilungsfunktionen, die alle auf die Ga u ß sche Funktion zurückgehen, gibt Pe a r s o n (Transactions of the Royal Society, London 1895) noch eine Anzahl anderer an, die er ebenfalls an das Urnenschema anknüpft. Es wird hierbei das Urnenschema aber nur als heuristisches Prinzip benutzt, indem in der abgeleiteten Formel die Grenzen, in denen die Konstanten bleiben müssen, und notwendige Voraussetzungen, die bei der Ableitung zu machen sind, außer acht gelassen werden. Dieses Verfahren ist gewiß berechtigt, wenn es sich um nichts anderes handelt als darum, passende Annäherungsfunktionen für die empirisch gefundenen Verteilungen zu gewinnen. Es ist dann die Aufgabe, an möglichst zahlreichen Beispielen die angesetzten Funktionen zu erproben. In dieser Hinsicht ist eine Durchsicht der Zeitschrift Biometrika, A Journal for the statistical study of biological problems (Cambridge, seit 1901, herausgegeben von We l d o n, Pe a r s o n, Dave n p o r t und Ga l t o n) zu empfehlen, in deren ersten Bänden sich zahlreiche solche Beispiele finden. Durch die Art aber, wie die Pe a r s o nschen Untersuchungen auch in der letzten Zeit (z. B. bei Fo r ch e r, Die statistische Methode, Leipzig 1913) wiedergegeben worden sind, wird nur zu leicht der Anschein erweckt, als ob es sich um eine wirkliche Ableitung der entstehenden Verteilungen aus dem Urnenschema handle. Die Darstellung bei Fechner (Kollektivmaßlehre, Die statistische Theorie des Zufalls. 203 Maßzahlen Anzahl Individuen 1 1 2 3 3 5 4 2 5 7 6 10 7 13 8 19 9 20 10 25 11 40 12 31 13 60 14 62 15 54 16 74 17 84 18 86 19 96 20 85 21 75 22 47 23 43 24 24 25 19 26 9 27 5 28 — 29 1 30 — Fig. 10. Neuntes Kapitel. 204 Es bleibt noch übrig, die Anwendung der Formel, die für verhältnismäßig seltene Ereignisse gilt, durch ein Beispiel zu erläutern. L. v. Bo r t kewi t s ch hat in seiner Schrift Das Gesetz der kleinen Zahlen (Leipzig 1898) die Bedeutung dieser Formel besonders hervorgehoben. Es erscheint beinahe a priori einleuchtend, daß die störenden Einwirkungen, die sonst das Zustandekommen einer regulären Verteilung verhindern, indem in den einzelnen verglichenen Bezirken verschiedene Verhältnisse obwalten, sich am wenigsten geltend machen, wenn an den verschiedensten Stellen durch ein verhältnismäßig seltenes Ereignis einzelne Fälle, sozusagen Stichproben, herausgegriffen werden. Wir hatten gesehen, daß in diesem Falle die Formel gilt: (11) 'p = mpe􀀀m p! ; wobei die Beziehungen bestehen müssen: (12) P'p = 1; m = Pp'p; m0 = P(p 􀀀 m)2'p; m0 = m: Es ist zunächst zu prüfen, ob diese Beziehungen erfüllt sind. Wir wollen nun hierfür ein Beispiel nehmen und wählen mit Bo r t kewi t s ch die Anzahl der Soldaten, die während der Jahre 1875 bis 1894 innerhalb der Armeekorps II bis V, VII bis X, XIV und XV des preußischen Heeres durch Hufschlag eines Pferdes getötet wurden. Die einzelnen Zahlen pi usw. bedeuten dann die innerhalb eines Armeekorps während eines Jahres Getöteten. herausgegeben von G. F. Li p p s, Leipzig 1899), der auf andere Weise eine Verallgemeinerung der Ga u ßschen Funktion anstrebt, ist darin durchsichtiger. Die statistische Theorie des Zufalls. 205 Es ergeben sich dabei: 0 1 2 3 4 5 und mehr Getötete in 109 65 22 3 1 0 Fällen, und daraus folgt der Wert m = 65  1 + 22  2 + 3  3 + 4  1 200 = 0; 61: Übereinstimmend damit ergibt sich auch für m0 der Wert 0; 61. Rechnet man nun mit Hilfe des Ausdruckes z0 mp p! die zu erwartenden Häufigkeiten von p Todesfällen aus, indem man z0 (die Häufigkeit für p = 0) daraus bestimmt, daß die Summe aller Häufigkeiten gleich 200 sein muß, woraus z0 = 200  e􀀀m folgt, so findet man statt der obigen Werte die Zahlen: 109 66 20 4 1 0: Die Übereinstimmung ist außerordentlich gut. Daß sie auf einem bloßen Zufall beruht, ist nicht anzunehmen. Vielmehr haben wir uns zu denken, daß alle örtlichen und zeitlichen Besonderheiten, die sonst als systematische Abweichungen hervortreten, dadurch unwirksam werden, daß eine rein zufällige Auswahl durch das betrachtete seltene Ereignis getroffen wird und daß wir deswegen annähernd dieselben Verhältnisse haben müssen, wie sie bei der Begründung aus dem Urnenschema vorausgesetzt werden 1). 1) An kurz zusammenfassenden Darstellungen mit reichen LiteraturNeuntes Kapitel. 206 angaben vgl. man den Artikel von Bo r t k i ewi c z, Anwendungen der Wahrscheinlichkeitsrechnung auf Statistik, Enzyklopädie der math. Wissenschaften, Bd. I, 2. Teil, Leipzig 1900–1904, Cz u b e r, Die Entwickelung der Wahrscheinlichkeitstheorie und ihrer Anwendungen, Jahresbericht der Deutschen Math.-Ver., Bd. VII, Leipzig 1899, ferner die Artikel Geschlechtsverhältnis der Geborenen und Gestorbenen (v. May r), Gesetz (L e x i s), Sterblichkeit (v. Bo r t k i ewi c z) im Handwörterbuch der Staatswissenschaften von Le x i s und El s t e r. Zehntes Kapitel. Die genetische Theorie des Zufalls. Die statistische Theorie des Zufalls offenbart einen gemeinschaftlichen Charakter in der Verteilung der statistischen Ergebnisse bei solchen Ereignissen, die wir als zufällige anzusehen gewohnt sind. Wir erhalten aber keinen unmittelbaren Aufschluß darüber, wie wir uns das Zustandekommen einer solchen Verteilung in der Wirklichkeit denken können. Es bleibt daher das Bedürfnis bestehen, sozusagen in den inneren Mechanismus des Geschehens einzudringen und sich klar zu machen, wie die als typisch für die Zufallsereignisse angesehene Verteilung auch auf einer inneren Übereinstimmung der in Betracht kommenden Ereignisse beruht. Als die am sichersten als zufällig zu bezeichnenden Ereignisse gelten nun die Ereignisse, die in dem Begehen eines bestimmten Beobachtungsfehlers bei sehr sorgfältig ausgeführten Beobachtungen bestehen, d. h. sich der in der Abweichung der in der gleichen Weise und mit der gleichen Sorgfalt bestimmten Werte voneinander kundgeben. Für diese Fehler hat die Erfahrung mit hinreichender Gewißheit die Geltung des sogenannten Ga u ßschen Fehlergesetzes, das durch die Funktion '(x) = h p e􀀀h2x2 geliefert wird, ergeben. Zehntes Kapitel. 208 Man kann es nun als die Aufgabe hinstellen, eine Erklärung dafür zu suchen, wie dieses eigentümliche Gesetz für die Verteilung der Fehler zustande kommt. Der Astronom Be s s e l ist der erste gewesen, der diese Frage zu beantworten gesucht hat (Untersuchungen über die Wahrscheinlichkeit der Beobachtungsfehler, Astron. Nachrichten, Bd. 15, 1838). Er dachte sich, daß jeder Fehler das Resultat des Zusammentreffens einer großen Anzahl von Elementarfehlern ist, die einzeln bestimmten Fehlerquellen entstammen. Die einfachste Annahme ist dabei die, die Elementarfehler alle als dem absoluten Betrag nach gleich vorauszusetzen, etwa gleich e, und weiter zu sagen, jeder einzelne Elementarfehler gehe gleich oft mit dem positiven und dem negativen Vorzeichen in das Resultat ein. Dieses Resultat entspricht dann einer bestimmten Vorzeichenkombination der Elementarfehler. Man kann diesen Vorgang sehr einfach auf das Urnenschema zurückführen, indem man eine Urne voraussetzt, in der gleich viele schwarze und weiße Kugeln gemischt enthalten sind. Das Ziehen einer weißen Kugel bedeutet denn das Begehen des Elementarfehlers +e, das Ziehen einer schwarzen Kugel das Begehen des Elementarfehlers 􀀀e. Wenn nun eine große Anzahl n = p+q Male eine Kugel aus der Urne gezogen ist, so wird, wenn hierbei p mal eine weiße und q mal eine schwarze Kugel gefunden wurde, x = (p 􀀀 q)e der begangene Gesamtfehler. Die relative Häufigkeit dieses Gesamtfehlers wird (p + q)! p! q! 1 2p 1 2q Die genetische Theorie des Zufalls. 209 oder wenn man p = n 2 + u; q = n 2 􀀀 u setzt, wu = n! n 2 + u! n 2 􀀀 u!  1 2n : Es handelt sich nun darum, hierfür einen Näherungswert zu finden, indem man n sehr groß und u als verhältnismäßig klein gegen n annimmt. Wir bilden zu dem Zweck wu wu􀀀1 = n 2 􀀀 u n 2 + u ; dividieren Zähler und Nenner dieses Bruches durch 1 2n und setzen 2 u n = z; dann wird wu wu􀀀1 = 1 􀀀 z 1 + z : Wir erhalten also, indem wir weiter setzen z = x ne ; woraus x = 2ue; Zehntes Kapitel. 210 da z ein sehr kleiner Bruch ist, wu 􀀀 wu􀀀1 wu = 􀀀 2z 1 􀀀 z = 􀀀2z = 􀀀 2x ne ; also, wenn wir berücksichtigen, daß wu = '(x) und demnach wu 􀀀 wu􀀀1 wu = d ln '(x) wird, d ln '(x) = 􀀀 2x ne ; ferner dx = 2e, da einer Vermehrung von u um 1 eine Vermehrung von x um 2e entspricht, und somit schließlich '(x) = Ce􀀀h2x2 entsprechend dem ursprünglichen Ansatz, wenn wir noch h = 1 p2ne machen. Es ist aber wichtig, sich von der Be s s e lschen Annahme frei zu machen, daß jede Fehlerquelle nur Fehler von bestimmtem absoluten Betrage liefern könne, und dafür die allgemeinere Voraussetzung einzuführen, daß jede Fehlerquelle 1. gleich große positive und negative Fehler mit gleich großer relativer Häufigkeit ergebe und 2. nur sehr kleine Fehler, aber 3. innerhalb gewisser Grenzen jeden beliebigen Fehler liefern könne 1). 1) Vgl. Cr o f t o n, On the proof of the law of errors of observations, Philosophical Transactions, Vol. 159 (1869), Artikel Probability, Encyclopaedia Britannica, 9. ed., Vol. 19 (1885). Die genetische Theorie des Zufalls. 211 Sogar von der Voraussetzung 1. können wir, wie wir sehen werden, Abstand nehmen. Wir nehmen an, die Aufgabe sei bereits gelöst, wenn die Zahl der Fehlerquellen n beträgt. Man habe die Fehlerfunktion gefunden, die durch das Zusammenwirken dieser n Fehlerquellen entsteht, und man nenne diese Fehlerfunktion 'n(x). Dann komme noch eine Fehlerquelle hinzu, zu der die Fehlerfunktion n+1(x) gehöre, und man suche die nun entstehende neue Fehlerfunktion 'n+1(x) zu bestimmen. Wir haben dann, da, wenn die letzte Fehlerquelle den Fehler u liefert, die übrigen Fehlerquellen den Fehler x􀀀u liefern müssen, damit der Gesamtfehler x werde, 'n+1(x) = Z +r 􀀀r 'n(x 􀀀 u)n+1(u) du; wo +r und 􀀀r die Extremwerte sind, bis zu denen die Argumente der Funktion n+1(u) reichen. Wir entwickeln unter dem Integralzeichen 'n(x 􀀀 u) nach dem Tay l o rschen Lehrsatze, und finden 'n+1(x) = Z +r 􀀀r 'n(x) 􀀀 u'0n(x) + 1 2u2'00 n(x)n+1(u) du: Die höheren Potenzen von u können wir vernachlässigen. Es ist nun Z +r 􀀀r n+1(u) du = 1; und setzen wir ferner Z +r 􀀀r un+1(u) du = jn+1; Z +r 􀀀r u2n+1(u) du = kn+1; Zehntes Kapitel. 212 so wird jetzt 'n+1(x) = 'n(x) 􀀀 jn+1'0n(x) + 1 2kn+1'00 n(x): Wir erkennen daraus, daß es gleichgültig ist, welche Form wir der Funktion n+1(u) geben, wenn sie nur die richtigen Werte von jn+1 und kn+1 liefert. Wir wollen deshalb insbesondere für die Funktion den Ansatz machen: n+1(u) = n+1 p e􀀀2 n+1(u􀀀un+1)2 ; es ergibt sich dann: jn+1 = Z +r 􀀀r un+1(u) du = un+1; kn+1 = Z +r 􀀀r u2n+1(u) du = 1 22 n+1 + u2 n+1: Wir können nun bestätigen, daß unter dieser Voraussetzung für die Verteilungsfunktion sich ebenfalls die Form 'n(x) = hn p e􀀀h2 n(x􀀀xn)2 ergibt. Wir zeigen dies, indem wir nachweisen, daß durch das Hinzutreten einer neuen Fehlerquelle sich diese Form nicht ändert. Da diese Form aber für e i n e Fehlerquelle als gültig angenommen werden kann, gilt sie nach dem Bewiesenen dann auch für zwei, weiter für drei, vier usw. Fehlerquellen und damit allgemein. Die genetische Theorie des Zufalls. 213 Setzen wir also voraus, in der Formel n+1(x) = Z +r 􀀀r 'n(x 􀀀 u)n+1(u) du seien die obigen Ausdrücke für 'n(x 􀀀 u) und n+1(u) eingesetzt, dann wird, wenn wir noch für die Grenzen 􀀀r und +r 􀀀1 und +1 schreiben, 'n+1(x) = Z +1 􀀀1 ce􀀀h2 n(x􀀀u􀀀xn)2 e􀀀2 n+1(u􀀀un+1)2 du; wo c eine Konstante ist. Die beiden Potenzen von e vereinigen sich zu einer einzigen, deren Exponent = 􀀀h2 n(x 􀀀 u 􀀀 xn)2 􀀀 2 n+1(u 􀀀 un+1)2 = 􀀀(h2 n + 2 n+1)u2 + 2h2 n(x 􀀀 xn) + 2 n+1un+1u 􀀀h2 n(x 􀀀 xn)2 + 2 n+1u2 n+1 = 􀀀(h2 n + 2 n+1)(u 􀀀 u0n)2 􀀀 2 n+1h2 n h2 n + 2 n+1 (x 􀀀 xn 􀀀 un+1)2 ist, wenn u0n = h2 n(x 􀀀 xn) + 2 n+1un+1 h2 n + 2 n+1 gesetzt wird. Hieraus folgt: 'n+1(x) = Ce􀀀 2 n+1h2 n h2 n+2 n+1 (x􀀀xn􀀀un+1)2 ; wo C eine neue Konstante ist. Zehntes Kapitel. 214 Setzen wir mithin 'n+1(x) = Ce􀀀h2 n+1(x􀀀xn+1)2 ; so wird 1 h2 n+1 = 1 h2 n + 1 2 n+1 ; xn+1 = xn + un+1: Also ist (1) 1 h2 n = 1 2 1 + 1 2 2 +    + 1 2 n und (2) xn = u1 + u2 +    + un: Nun ist, wie wir oben (S. 158) gefunden hatten, (3) ui = Z +1 􀀀1 ui(u) du: Also wird ui der Mittelwert, um den sich die aus der iten Fehlerquelle fließenden Fehler gruppieren, und die resultierende Fehlerfunktion ist auf einen Mittelwert bezogen, der die Summe aus den Mittelwerten aller einzelnen Fehlerquellen ist. Diesen Wert können wir als den s y s t ema t i s ch e n Fe h l e r der Beobachtungen ansehen. Ferner ergibt sich: (4) 1 22 i = Z +1 􀀀1 (u 􀀀 ui)2i(u) du; Die genetische Theorie des Zufalls. 215 also gleich dem Quadrat 2 i des mi t t l e r e n z u f ä l l i g e n Fe h l e r s bei der iten Fehlerquelle, und wir finden für den mittleren Fehler  bei der resultierenden Fehlerfunktion: (5) 2 = 2 1 + 2 2 +    + 2 n: Die Resultate, die wir so für den besonderen Fall gefunden haben, wo die zugrunde gelegte Messungsreihe aus verschiedenen Messungen einer und derselben physikalischen Größe besteht, lassen sich auch sofort auf den Fall übertragen, wo eine Reihe an verschiedenen Objekten ausgeführter Beobachtungen in ihrer Verteilung der Ga u ßschen Funktion folgt. Wir finden, daß eine solche Verteilung entstehen muß, wenn die an den Objekten beobachteten Verschiedenheiten auf zufälligen Abweichungen von einem bestimmten Normaltypus beruhen, d. h. wenn eine große Anzahl an sich sehr geringfügiger und voneinander unabhängiger Umstände zusammenwirken, um die beobachtete Abweichung zu erzeugen. In diesem Sinne könnten wir von einem objektiven Zufalle sprechen, der Zufall würde dann in dem Zusammentreffen einer großen Anzahl von Umständen bestehen, die untereinander in keiner unmittelbaren kausalen Beziehung stehen, und deren Zusammentreffen den beobachteten Erfolg herbeiführt. Hierdurch wird der Bereich des Zufälligen aber außerordentlich eingeschränkt, denn gerade daß eine große Menge von gegenseitig unabhängigen Einzelumständen zusammentreffen soll, scheint in der Wirklichkeit selten erfüllt. Wohl findet man, wenn man ein Zufallsereignis in den Einzelheiten seines Zustandekommens verfolgt, eine Reihe von Umständen, die zusammen das Ereignis hervorgerufen haben, aber diese Umstände stehen nicht Zehntes Kapitel. 216 außer Zusammenhang, sie bilden vielmehr die Glieder in wenigen Ketten von kausalen Zusammenhängen. Meistens wird man sogar nur zwei solcher Ketten feststellen können. So wird man, um auf das Beispiel des von einem herabfallenden Ziegel getöteten Passanten zurückzukommen, die zwei Ketten von Ursache und Wirkung verfolgen, die auf der einen Seite das Vorübergehen des Menschen gerade an dieser Stelle und auf der anderen Seite das Herabfallen des Ziegels gerade zu dieser Zeit erklären. Damit aber wird die Anwendung der in diesem Kapitel angestellten Analyse, wie es scheint, in den meisten Fällen illusorisch. Es soll diese Analyse jedoch auch gar nicht eine allgemeine genetische Erklärung der Zufallsereignisse geben. Sie liefert nur e i n Beispiel dafür, wie die für die Zufallsereignisse typische Verteilung zustande kommen kann. Dieses Beispiel ist deshalb von besonderer Bedeutung, weil die gegebene Erklärung in einem sehr wichtigen Falle, nämlich bei gleich sorgfältigen Beobachtungen einer und derselben physikalischen Größe, tatsächlich zu stimmen scheint. Daß die typische Verteilung auch auf ganz andere Art zustande kommen kann, lehrt schon das Beispiel der Urnenziehungen. Es ist gerade das Merkwürdige an der Ga u ßschen Verteilungsfunktion, daß sie sich auf ganz verschiedene, anscheinend voneinander völlig unabhängige Arten ergibt. Wenn wir nun zum Schluß die Ergebnisse unserer Betrachtungen kurz zusammenfassen, so ist der Gewinn, den wir erzielt haben, nicht darin zu suchen, daß die Auffassung des einzelnen zufälligen Ereignisses eine Vertiefung erfahren hat. Dagegen haben wir gesucht, den Nachweis zu führen, daß auch die zufälligen Ereignisse nicht die Regelmäßigkeit und Ordnung des allgemeinen Geschehens durchbrechen, daß vielmehr auf eine bestimmte Weise bei diesen zufälligen Ereignissen ein Ausgleich stattfindet Die genetische Theorie des Zufalls. 217 für das, was sie als störendes Element in die Gesetzmäßigkeit des Geschehens hineintragen. Hierin liegt an sich nichts Neues und Überraschendes, vielmehr etwas nahezu Selbstverständliches. Wir brauchen ja bloß zu bedenken, daß die Vorgänge in den kleinsten Teilen der Materie als Zufallsereignisse anzusehen sind, und daß sonach, wofern überhaupt in dem physikalischen Geschehen eine Regelmäßigkeit zu erkennen sein soll, diese auf einem Ausgleich der Zufälligkeiten in den Veränderungen der kleinsten Elemente beruhen muß. Wir verlassen uns auf diesen Ausgleich wie auf ein Naturgesetz, z. B. ist der sogenannte zweite Hauptsatz der mechanischen Wärmetheorie, nämlich der Satz, daß die Wärme nicht von selbst vom kälteren zum wärmeren Körper strömt, nichts wie ein Ausdruck für den Ausgleich, der in den molekularen Bewegungen stattfindet. Es ist aber wichtig, sich klar bewußt zu sein, daß hiermit ein neues Moment in die Naturerklärung hineingetragen wird, das von anderer Art ist wie die eine regelmäßige kausale Verknüpfung aussagenden Naturgesetze. Das Wesentliche an allen zufälligen Ereignissen ist eben das, daß sie allein aus der Regelmäßigkeit kausaler Verknüpfungen nicht zu erklären sind.Wenn daher sich in der Gesamtheit der Zufallsereignisse einer bestimmten Gruppe eine Regelmäßigkeit wiederfindet, so ist diese von anderer Art als die kausalen Zusammenhänge, und die Voraussetzung einer unverbrüchlichen Kausalität in allem Naturgeschehen mag wohl aufrecht erhalten werden, sie reicht allein aber nicht hin, um die Regelmäßigkeit des Weltgeschehens vollständig zu erklären. Es gehört vielmehr die Tatsache hinzu, die wir als das Gesetz der großen Zahlen bezeichnen und die bewirkt, daß die Unregelmäßigkeiten, die sonst durch die zufälligen Ereignisse in die Welt hineingetragen würden, in dem Zehntes Kapitel. 218 Gesamtergebnis doch wieder verschwinden. Wenn wir diese Elimination des Zufalls als eine allgemeine Tatsache hinstellen, so müssen wir uns bewußt sein, daß wir für diese Tatsache keine bestimmte Erklärung geben können, daß wir sie vielmehr nur insoweit behaupten können, wie sie uns durch die Erfahrung bestätigt wird. Unser Verstand sträubt sich allerdings dagegen, ein so allgemeines Prinzip nur deshalb anzunehmen, weil hier und dort seine Richtigkeit bezeugt wird, vielmehr drängt er dahin, auch einen inneren Grund für einen solchen Ausgleich zu finden. Ein solcher innerer Grund läßt sich aber nicht ermitteln. Würden wir zu ihm gelangen können, so müßte uns eine Einsicht in den Mechanismus des Geschehens zu Gebote stehen, wie wir sie nicht haben.Was uns gegeben ist, sind die einzelnen Erfahrungen. Nur indem wir diese zusammenhalten, miteinander vergleichen, Gleichartiges zusammenschließen und die dabei sich herausstellenden regelmäßigen Zusammenhänge aufdecken, gelangen wir dazu, das zu erreichen, was wir eine Erklärung des Naturgeschehens nennen. Auf diesem Wege können wir aber nicht den Ausgleich erklären, der in dem Gesetz der großen Zahlen ausgedrückt sein soll. Deshalb müssen wir uns damit begnügen, diesen Ausgleich, indem wir seine Wirklichkeit von vornherein voraussetzen, in seinen einzelnen Erscheinungsformen selbst zu verfolgen. Auf diese Weise kann natürlich die Tatsache des Ausgleichs, weil wir sie von Anfang an vorausgesetzt haben, nicht erst erklärt werden. Wir können aber diese Tatsache uns sozusagen näher bringen, indem wir solche Vorgänge herausgreifen, über deren inneren Charakter wir glauben von vornherein Klarheit zu haben. Diese Vorgänge sind die Glücksspiele, und unter den Glücksspielen wählten wir noch insbesondere einen typischen Vorgang aus, der Die genetische Theorie des Zufalls. 219 in den Ziehungen aus einer Urne besteht. Alle Ergebnisse, die aus diesen typischen Vorgängen gewonnen werden und die sich in der Ableitung gewisser Formeln für die bei häufiger Wiederholung des Vorganges zu erwartenden statistischen Ergebnisse vollenden, können auf andere Vorgänge, deren inneres Zustandekommen unserer Beobachtung verschlossen ist, nur so angewendet werden, daß wir die statistischen Ergebnisse vergleichen. Das ist es, was wir als die statistische Methode bezeichnet haben. Welches Recht haben wir nun, Ereignisse, deren Verteilung mit der aus dem Urnenschema folgenden Verteilung eine gewisse Übereinstimmung zeigt, auch innerlich als gleichartig anzusehen? Dadurch, daß wir überhaupt über die innere Natur eines Vorganges urteilen, gehen wir aus dem rein phänomenologischen Gebiet in das ontologische Gebiet über. Die innere Natur eines Vorganges, das eigentlicheWarum und Wieso liegt außerhalb des Bereiches der bloßen Erfahrung. Was uns dazu hinführt, sind im Grunde immer Analogieschlüsse. Auf das Bedenkliche solcher Schlüsse braucht nicht besonders hingewiesen zu werden. Die Analogie verführt uns nur zu leicht, aus einer gefundenen Übereinstimmung in einzelnen Punkten eine Übereinstimmung auch in anderen Punkten zu erschließen, ohne daß dieser Schluß logisch zwingende Kraft hätte. Trotzdem können wir ohne solche Analogieschlüsse nicht auskommen. Sie sind es im wesentlichen, die uns die Dinge als begreiflich erscheinen lassen. Das bloße Sammeln und Ordnen von Erfahrungen würde uns unbefriedigt lassen. Wir würden das innere Band vermissen. Dieses Band eben finden wir häufig durch Analogieschlüsse. So beruht z. B. der Kraftbegriff, durch den uns die physikalischen Vorgänge begreiflich erscheinen solZehntes Kapitel. 220 len, auf einer Analogie mit physiologischen Vorgängen, nämlich dem Gefühl der Anstrengung beim Heben einer Last, und daß uns die Dinge auf diese Weise innerlich begreiflich erscheinen, liegt daran, daß wir sie in Zusammenhang bringen mit persönlichen Empfindungen. Wir bringen sie uns „menschlich nahe“. Etwas Ähnliches können wir nun auch in der Analyse der zufälligen Vorgänge finden. Auch hier ist es die persönliche Stimmung dem ungewissen Ereignis gegenüber, die das Verfahren bestimmt hat und aus der heraus man ein inneres Verstehen der Vorgänge zu erreichen geglaubt hat. Hierhin gehört es, wenn in der klassischen Wahrscheinlichkeitsrechnung die gleich möglichen Fälle dadurch definiert werden, daß wir keinen Grund haben, das Eintreten des einen eher als das Eintreten des anderen zu erwarten. Hierhin gehört es ferner, wenn angenommen wird, daß ein Ereignis, dessen mathematische Wahrscheinlichkeit der Einheit sehr nahe kommt, als gewiß angesehen werden kann, weil wir in unserem Leben fortwährend gezwungen sind, wegen der Unsicherheit aller unserer Lebensumstände als gewiß hinzunehmen, was im Grunde nur sehr wahrscheinlich ist. Die Analogie geht sogar tiefer, indem wir die Unentschiedenheit eines künftigen Ereignisses mit der Unentschiedenheit eines Menschen vergleichen, der zwischen zwei Möglichkeiten zu wählen hat. Wenn wir von dem blinden Zufall sprechen, so beruht dies darauf, daß die Entscheidung verglichen wird mit der Entscheidung eines Menschen, der eine Möglichkeit ohne Überlegung ergreift. Diese Eindeutung innerer Erlebnisse in die äußeren Vorgänge ist dem menschlichen Geiste durchaus natürlich, sie ist aber auch mit großen Gefahren verknüpft. Das tritt tatsächlich in der Geschichte der Wahrscheinlichkeitsrechnung deutlich zutage. Bei aller Großartigkeit der Entwickelung krankt z. B. das Werk von Die genetische Theorie des Zufalls. 221 La p l a c e daran, daß der Bereich des Ungewissen ohne eine sichere empirische Grundlage allein aus dem Denken heraus mit Hilfe der mathematischen Rechnung einer bestimmten Analyse unterworfen werden soll. Rein äußerlich gibt sich das darin zu erkennen, daß zu viel mathematische Entwickelungen und zu wenig statistisches Material gegeben wird. Die mathematische Ableitung ist aber nur ein formales Hilfsmittel. Aus ihr allein läßt sich keine reale Erkenntnis schöpfen, wenn sie nicht mit wirklicher Beobachtung gepaart wird. Es werden daher bei La - p l a c e eigentlich nur Methoden gegeben, ohne daß überhaupt feststeht, wie weit diese Methoden sich auf Probleme der Wirklichkeit überhaupt anwenden lassen. Wo solche Anwendungen aufzutreten scheinen, beruhen sie nur auf unbestimmten Vermutungen und unberechtigten Annahmen. Qu é t e l e t gebührt das große Verdienst, mit der Anwendung der Wahrscheinlichkeitsrechnung auf die Wirklichkeit Ernst gemacht zu haben 1). Aber auch er beging den Fehler, daß er zu selbstverständlich die Übereinstimmung der Wirklichkeit mit den aus dem einfachen Urnenschema folgenden Formeln der Wahrscheinlichkeitsrechnung voraussetzte und sie häufig da zu sehen glaubte, wo sie tatsächlich nicht vorhanden ist. Daher liegt ein ungeheurer Vorteil in dem Aufkommen der eigentlich empirischen Methoden, die sich eine unbefangene und sichere Feststellung der tatsächlichen Verhältnisse zur Aufgabe machen und um deren Entwickelung sich in Deutschland besonders W. Le x i s und G. Th. Fe ch n e r und in England K. Pe a r s o n verdient gemacht haben. Hier wird in der Tat die 1) Vgl. insbesondere seine Lettres sur la théorie des probabilités appliquée aux sciences morales et politiques (Bruxelles 1846). Zehntes Kapitel. 222 mathematische Entwickelung nur ein Hilfsmittel, um das statistische Material systematisch zu verarbeiten. Die Verarbeitung besteht einerseits darin, daß die statistischen Ergebnisse über solche Ereignisse, die in ihrer Verteilung eine gewisse Gemeinsamkeit zeigen, vereinigt werden, und andererseits darin, daß man in bestimmten Verteilungen eine einfache mathematisch ausdrückbare Regelmäßigkeit nachzuweisen versucht. Das Bezeichnende der Methode darf man vielleicht darin sehen, daß gerade die Rücksichtnahme auf den ursächlichen Zusammenhang, die sonst den Kern der Naturerklärung bildet, vollständig in Wegfall kommt. Es ist wohl gut, nochmals hervorzuheben, daß nach der in Rede stehenden Methode zwischen den einzelnen Fällen keinerlei ursächlicher Zusammenhang, sondern nur eine Gleichartigkeit der Bedingungen bei ihnen allen angenommen wird. Die bei dem Urnenschema herauskommende Verteilung wird ausdrücklich unter der Voraussetzung abgeleitet, daß eine Ziehung mit der anderen außer allem kausalen Zusammenhang steht, daß es für das Resultat einer Ziehung völlig gleichgültig ist, welche Resultate die vorhergehenden Ziehungen ergeben haben. Die Ziehung einer weißen Kugel bleibt in der Sprache der Wahrscheinlichkeitsrechnung gleich wahrscheinlich, auch wenn schon zehn- oder zwanzigmal hintereinander eine weiße Kugel gezogen worden ist. Der Ausgleich zwischen den Resultaten der einzelnen Ziehungen ist kein mechanischer, er beruht nicht auf einer Wirkung, welche die Resultate der einen Ziehung auf das Resultat der anderen ausüben. Er ist nur ein statistischer, d. h. wir haben uns zu denken, daß er da zustande kommt, wo die Bedingungen des Geschehens, soweit sie festliegen, unverändert bleiben. Wenn es eine Ordnung des Geschehens in dem Sinne gibt, daß für das Die genetische Theorie des Zufalls. 223 Resultat des einen Falles es nicht gleichgültig ist, welches die Resultate der vorhergehenden Fälle waren, so bleibt diese Ordnung hier unberücksichtigt, sei es nun, daß sie in einer gewissen Neigung der gleichartigen Resultate, sich räumlich oder zeitlich zusammenzuschließen oder in einer bestimmten prädestinierten Verteilung der verschiedenen Resultate bestehen soll. Das ganze Schwergewicht der Betrachtung ruht darauf, daß eine Erklärung der stattfindenden Verteilung auch möglich ist, ohne einen inneren Zusammenhang der Einzelergebnisse vorauszusetzen. Wenn die Beiseiteschiebung des kausalen Zusammenhanges das Bezeichnende an den angestellten Betrachtungen sein soll, so scheint dieses Prinzip nur bei der genetischen Erklärung des Zufalls durchbrochen zu sein. Es ist aber leicht zu erkennen, daß auch hier nicht das Zufallsereignis aus einer großen Menge voneinander unabhängiger Einzelursachen kausal erklärt werden soll, sondern daß es vielmehr als zusammengesetzt erscheint aus einer großen Menge voneinander unabhängiger Einzelmomente. Das Wesentliche ist auch hier wieder gerade das Fehlen des kausalen Zusammenhanges zwischen den einzelnen Bestandteilen des Zufallsereignisses. Es bleibt also immer das Fehlen des kausalen Zusammenhanges das Bezeichnende für die genetische Erklärung der Zufallsereignisse, gleichgültig, ob wir dieses Fehlen als ein absolutes oder als ein relatives, d. h. als das Fehlen einer engeren kausalen Verknüpfung, ansehen wollen. Aber die genetische Erklärung des einzelnen Zufallsereignisses war nicht das, worauf die angestellten Betrachtungen hauptsächlich abzielten. Im Gegenteil kann man ihr Wesen darin erblicken, daß sie von der Betrachtung des Zufalls im einzelnen Ereignisse ablenken, daß sie die Fragestellung vielmehr auf die Gesamtheit der Erscheinungen hinwenden. Zehntes Kapitel. 224 Auch von vornherein wird man zugeben, daß das einzelne Zufallsereignis nicht das ist, was im Grunde unsere Teilnahme erweckt, daß vielmehr die wirkliche Aufgabe in der Beantwortung der Frage liegt, wie die Zufallsereignisse in ihrer Gesamtheit auf das Getriebe der Welt einwirken. Die Antwort ist klipp und klar die, daß das, was im einzelnen Ereignis als zufällig und unberechenbar erscheint, in der Totalität der Erscheinungen durch einen gewissen Ausgleich beseitigt wird. Allerdings eine Erklärung, die im tieferen Sinne befriedigt, für diesen Ausgleich zu finden, ist uns nicht gelungen. Unsere Betrachtung blieb auch hier auf die Beobachtung des Tatsächlichen und die Feststellung der darin liegenden Regelmäßigkeiten beschränkt, genau so wie sie es da ist, wo die mit einer durchgängigen Kausalität des Naturgeschehens in Zusammenhang stehenden „Naturgesetze“ den Gegenstand der Untersuchung bilden. Daß eine allgemeine genetische Erklärung des Zufalls nicht geliefert ist, gibt sich auch darin zu erkennen, daß nach der statistischen Theorie ein Ereignis als zufällig nur innerhalb einer bestimmten Gesamtheit erscheint. So ergab sich die Verteilung der Körpergröße unter den durch die Aushebungen in einem großen Gebiete herausgegriffenen erwachsenen männlichen Individuen als die typische Zufallsverteilung. Dabei können wir die Körpergröße, die ein Mensch erreicht, doch nicht als rein zufällig hinstellen. Im Gegenteil sind uns bestimmte Momente, z. B. die Körpergröße der Eltern, bekannt, die einen Einfluß auf das körperliche Wachstum ausüben. Diesen und ähnlichen Einflüssen nachzugehen, war hier nicht unsere Aufgabe. Es scheint aber nötig, zum Schluß auf ihr Bestehen noch nachdrücklich hinzuweisen, damit nicht der Eindruck entsteht, als solle aus dem Vergleich mit dem Schema der Glücksspiele, der uns für die maDie genetische Theorie des Zufalls. 225 thematische Behandlung die Handhabe gegeben hat, eine innere Gleichartigkeit gefolgert werden, als solle verkannt werden, wie ungleich verwickelter in ihrer inneren Beschaffenheit die Vorgänge in der menschlichen Gesellschaft sind, als die wenigstens beim ersten Anblick sehr einfach scheinenden Vorgänge der Urnenziehungen. Namenverzeichnis. (Die Zahlen bedeuten die Seiten.) Abbe, 120 d’Alembert, 67 f. Aristoteles, 74 Bernoullische Theorem, 88 Bertillon, 190 Bessel, 19 f., 208 f. Blaschke, 188 Borel, 88 Bortkewitsch (Bortkiewicz), Lad. v., 69, 186, 198, 204 ff. Boylesches (Mariottesches) Gesetz, 42 Brömse, 69 Brownsche Bewegung, 197 Bruns, 87, 179 Cardano, 77 Carvallo, 88 Cournot, 5 Crofton, 210 Czuber, 198, 206 Davenport, 198, 202 Edgeworth, 198 Elster (Herausgeber), 205 Fechner, 204, 221 Fechnersches Lagengesetz, 109 Forcher, 189, 202 Fries, J. F., IV Galilei, 77 f. Galton, 202 Gauß, 125 Gaußsche Verteilungsfunktion, 147 u.o. Goethe, 8 Goldschmidt, 71 Grimsehl, 69 Helmert, 120 Hume, 6 Huygens, 79 Iterson, 42 Kant, 4, 10 King, 198 Kozak, VII Kries, Joh. v., 80 Namenverzeichnis. 227 Lange, Friedr. Albert, 63, 75, 81 f. Laplace, 61 f., 73, 80, 221 Lexis, 53 f., 182 ff., 202, 206, 221 Lipps, G. F. (Herausgeber), 204, 205, 221 Lottermoser (Übersetzer), 197 Lourié, 82 Marbe, 69 Maxwell, 57 Mayr, v., 206 Mill, John Stuart, 1 f. Pearson, 43, 195 ff., 221 Perrin, 197 Poisson, 60, 73, 150, 186, 197 f. Quételet, 31, 200, 221 Rhumbler, 42 Sabudski-Eberhard, VI Schnuse (Übersetzer), 61 Schopenhauer, 3 Siebeck, 8 Sigwart, 21, 63, 84 f. Spinoza, 5, 8 f. Sterzinger, 70 Stirlingsche Formel, 148 Stumpf, 84 Trendelenburg, 75 Ueberweg, 74 Valla, Laurentius, 76 Venn, 200 Wagner, Ad., 51 Weldon, 202 Westergaard, 198 Windelband, 51, 59 Wolf, R., 90 Wundt, Wilh., 18 f., 62 --- Provided by LoyalBooks.com ---