Regression – für nicht lineare Zusammenhänge
Schlagwörter: Regression, Regressionsanalyse, Auswertung von Messwerten, mathematisches Verfahren, Korrelation, Bestimmtheitsmaß, nicht linear, exponentiell, potentiell, Linearisierung, nichtlineare Zusammenhäng
Was ist Regression?
Eine Regression bzw. eine Regressionsanalyse ist ein Verfahren, bei dem versucht wird, zwischen zwei oder mehreren Größen einen mathematischen Zusammenhang darzustellen. Wir werden uns hier auf den Zusammenhang von zwei Größen beschränken.
Der mathematische Zusammenhang von zwei Größen kann im einfachsten Fall linear sein. Es gibt aber auch nicht lineare Zusammenhänge. Diese werden im Fokus dieser Seite stehen.
Auch für nicht lineare Zusammenhänge ist es möglich, mit Hilfe der Regression einen mathematischen Zusammenhang zu finden. Dabei werden wir die folgenden Zusammenhänge überprüfen:
- quadratischer Zusammenhang
- potentielle Zusammenhänge
- exponentielle Zusammenhänge
- Überprüfung mit Linearisierung
Diese mathematischen Zusammenhänge können von EXCEL und den meisten Taschenrechnern in einer Regression bearbeitet werden.
Zur Anleitung – Trendlinien in EXCEL einzeichnen und formatieren – geht es hier.
Basis für die Überprüfung eines mathematischen Zusammenhangs zwischen zwei Größen ist eine Messwerttabelle. Um seriöse Aussagen zu einem mathematischen Zusammenhang treffen zu können, sollten mindestens 5 Wertepaare vorliegen, besser mehr.
Wir betrachten dazu drei konkrete Beispiele. Dabei geht es hier schwerpunktmäßig um die Regression. Die fachlichen Inhalte findet ihr auf den Inhaltsseiten (Link in der jeweiligen Klammer):
- den freien Fall – (Inhaltsseite)
- Abschirmung von Licht durch Glasplatten – (Inhaltsseite)
- Abhängigkeit der radioaktiven Strahlung in Abhängigkeit vom Abstand – (Inhaltsseite)
Beispiel 1: Freier Fall
Mithilfe einer Fallröhre soll die Fallgeschwindigkeit eines Körpers bestimmt werden. Dabei wurden die folgenden Werte aufgenommen. (zum Experiment)
Messwerte und Auswertung
Wir nehmen an, dass zwischen der Zeit und dem zurückgelegten Weg ein quadratischer Zusammenhang besteht. Daher wählen wir eine quadratische Regression. Quadratische Regressionen in ECXEL und den meisten Taschenrechnern haben die Form eines Polynoms 2. Grades. Diese genügen der allgemeine Form y = ax2 + bx + c
Einsetzen der Parameter a, b und c liefert die Gleichung:
y=4,702 x2 +1,104 x +0,051
bzw.
{\large s(t)\,=\frac{g}{2}{{t}^{2}}\,+\,{{v}_{0}}\cdot t\,+\,{{s}_{0}}}
Ist der gewählte Zusammenhang physikalisch sinnvoll?
Ja, der Zusammenhang ist sinnvoll. Die Vermutung des quadratischen Zusammenhangs konnte bestätigt werden. Die quadratische Parabel wird weiter ansteigen. Das entspricht auch unserer Beobachtung. Mit zunehmender Zeit, werden in gleichen Zeitintervallen größere Strecken zurückgelegt.
Passen die Messwerte zum gefundenen Zusammenhang – Korrelation?
Die Korrelation von 1 stellt hier eine Idealform dar. Eine bessere Passung der Messwerte zum gefundenen mathematischen Zusammenhang können wir nicht finden.
Sind beide Fragen an die Regression positiv beantwortet können wir feststellen, dass zwischen der Zeit und dem zurückgelegten Weg ein quadratischer Zusammenhang besteht. Es gilt:
{\large s(t)\,=\frac{g}{2}{{t}^{2}}\,+\,{{v}_{0}}\cdot t\,+\,{{s}_{0}}}
Beispiel 2: exponentielle Zusammenhänge
Eine Lampe wird vor einem Sensor für Helligkeit, einem LDR platziert. Zwischen die Lampe und den Sensor werden nacheinander mehrere Objektträger eingeführt. Die Helligkeit wird in Abhängigkeit von der Anzahl der Objektträger gemessen.
Der LDR ist ein lichtempfindlicher Widerstand. Je stärker die Beleuchtung, desto geringer der Widerstand. Der LDR wird mit einer konstanten Spannung (hier 6 V) versorgt. In Abhängigkeit von der Anzahl der Objektträger wird der Strom als Maß für die Helligkeit gemessen. Da die Objektträger direkt auf dem LDR liegen, muss das Umgebungslicht nicht ausgeblendet werden.
Der Abstand zwischen Lampe und LDR bleibt während der Messreihe unverändert. Auch die Spannung, mit der die Lampe versorgt wird bleibt konstant.
Wir stellen die Werte in einem Diagramm dar und lassen EXCEL die drei Regressionen (quadratisch, potentiell und exponentiell) anfertigen.
Fragen an die Regression
Fragen an die Regression:
- Passen die Messwerte zum gefundenen Zusammenhang – Korrelation?
- Ist der gewählte Zusammenhang physikalisch sinnvoll?
Potenzregression
Es ist schnell zu erkennen, dass die Potenzregression (Bild 05) die schwächste Korrelation (R2=0,846) liefert.
Aber wie sieht es mit der Sinnhaftigkeit der Potenzregression aus? Bei der Potenzregression mussten wir den Wert (x=0) ausschließen. Das ist bei diesem Experiment wenig sinnvoll. Für x->0 würden wir eine Stromstärke berechnen, die gegen ∞ strebt. Das ist auch physikalisch nicht sinnvoll, da der LDR auch ohne eine Verdunklung durch die Objektträger einen endlichen Widerstand hat und damit den Strom begrenzt.
⇒ Die Potenz Regression können wir verwerfen.
exponentielle oder quadratische Regression
Beide Regressionen liefern eine hervorragende Korrelation (R2 = 0,996 bzw. 0,995). Der Unterschied in der dritten signifikanten Stelle kann also kein Entscheidungskriterium sein.
Welcher der Zusammenhänge (quadratisch vs. exponentiell) ist physikalisch sinnvoll?
Im interpolierten Bereich zeigen beide Graphen eine hohe Deckung mit den aufgenommenen Messwerten. Wie sieht es aber aus, wenn wir die Graphen jenseits der Messwerte verlängern (Extrapolation)?
Bei der quadratischen Regression ist der Graph eine Parabel. Diese hat bei ca. 42 Platten einen Tiefpunkt und steigt dann wieder. Das würde bedeuten, dass wir bei ca. 84 Platten unseren Ausgangsstrom erreicht hätten und bei 100 Objektträgern einen höheren Strom messen würden, als bei 0 Platten. Das ist weder zu unseren Beobachtungen kompatibel, noch ist das physikalisch sinnvoll.
⇒ Damit können wir auch die quadratische Regression verwerfen.
Die exponentielle Regression stimmt auch extrapolativ mit unseren Erwartungen überein. An der Stelle 0 haben wir einen festen Wert, der um ca. 1 % von unserem Messwert abweicht.
Wir können daher davon ausgehen, dass der Zusammenhang von der Dicke der Abschirmung und der registrierten Helligkeit einem exponentiellen Zusammenhang genügt. Es gilt:
y(n) = 98,9 · e-0,057 ·n
Mit Hilfe der Logarithmen Gesetze, können wir die Gleichung so umstellen, dass wir in der Basis statt der EULERschen Zahl e eine 2 oder ein ½ haben. Dann können wir auch die Halbwertdicke direkt ablesen.
Beispiel 3: Abstandsgesetz
Ein Americium-241 Präparat wird vor einem Geiger-Müller-Zählrohr platziert. Ziel ist es, die Abhängigkeit der Zählrate N vom Abstand r zu bestimmen. Dabei wurden die folgenden Messwerte aufgenommen.
Wir stellen die Werte in einem Diagramm dar und lassen EXCEL die drei Regressionen (quadratisch, potentiell und exponentiell) anfertigen.
Die Korrelationen, die alle größer sind als 0,94, liefern keinen eindeutigen Ausschluss.
Wie schon im Beispiel 2 erkennen wir schnell, dass die quadratische Regression hier nicht geeignet ist. Dass die Zählrate für Abstände über 40 cm wieder ansteigt, ist nicht sinnvoll.
⇒ Damit können wir auch die quadratische Regression verwerfen.
Bei der exponentiellen Regression weichen die Messwerte speziell im nahen Bereich von der Ausgleichskurve ab. Hier ist bei der Potenzregression eine größere Deckung gegeben.
Was ist physikalisch sinnvoll?
Die Strahlung breitet sich in alle Richtungen aus. Die Dichte der Strahlen nimmt mit zunehmendem Radius ab. In jedem Abstand bilden die umlaufenden Radien eine Kugeloberfläche.
Für die Oberfläche einer Kugel gilt:
{\large {{A}_{Kugel}}\,=\,4\pi {{r}^{2}}}
Damit gilt: A ~ r2
Für die Dichte der Strahlen und somit die Zählrate N gilt:
{ \large N\,\sim \,\frac{1}{{{r}^{2}}}}
Wir können feststellen, dass sich die Zählrate antiproportional zum Quadrat des Abstandes verhält.
Gerade bei geringen Datenumfängen kann es vorkommen, dass die Potenzregression unklare Zusammenhänge liefert. (z.B. Exponenten -1,8 oder -1,2) Hier können wir nicht unmittelbar entscheiden. Bei der Auswertung derartiger Messwerte kann die Linearisierung helfen.