Regression
Regression, Regressionsanalyse, Auswertung von Messwerten, mathematisches Verfahren, Korrelation, Bestimmtheitsmaß,
Was ist Regression?
Eine Regression bzw. eine Regressionsanalyse ist ein Verfahren, bei dem versucht wird, zwischen zwei oder mehreren Größen einen mathematischen Zusammenhang darzustellen. Wir werden uns hier auf den Zusammenhang von zwei Größen beschränken.
Der mathematische Zusammenhang von zwei Größen kann im einfachsten Fall linear sein. Es gibt aber auch quadratische, kubische, exponentielle, … Zusammenhänge. Einige dieser Zusammenhänge werden im Folgenden beschrieben. Dabei wird auch geklärt, wie ihr Regressionen mit EXCEL und dem Taschenrechner durchführen könnt und wie ihr entscheidet, ob das Verfahren geeignet ist.
- lineare Zusammenhänge
- nichtlineare Zusammenhänge
- quadratische Zusammenhänge
- potentielle Zusammenhänge
- exponentielle Zusammenhänge
- Zusammenhänge selber finden
- Linearisierung
Bei jeder Regression gibt es zwei Fragen, die es zu beantworten gilt:
1. lineare Zusammenhänge
Beispiel 1
Ein Fahrrad fährt mit nahezu konstanter Geschwindigkeit. ►01
Alle 2 s wird die zurückgelegte Strecke gemessen.
Dabei wird die folgende Messwerttabelle aufgenommen. ►02
Die Tabellenwerte (B3…C8) werden markiert und im Reiter [EINFÜGEN] der Diagrammtyp „xy-Punkt“ gewählt.
Hilfe: Hinweise zum Einzeichnen und Formatieren von Trendlinien in EXCEL
Die Regression liefert das folgende Diagramm ►03 mit der Gleichung
- y = 3,9729x-0,181
- R2 = 0,9989
zu R2 weiter unten
Welche Informationen können wir dem Diagramm entnehmen?
Die Regression liefert die Gleichung y=3,9729·x-0,181
Wir haben hier den Weg s in Abhängigkeit von der Zeit t aufgetragen, also s(t).
Wenn wir die mathematische Gleichung y(x)=3,9729·x-0,181 in Physik übersetzen, dann erhalten wir:
s(t) = 3,9729 · t -0,181
Da wir bei der Zeitmessung nur auf zwei Stellen genau gemessen haben (2 signifikante Stellen), können auch unsere weiteren Ergebnisse nicht genauer sein. Für die per Regression bestimmte Gleichung folg dann,
s(t) = 4,0 · t – 0,18
Für die Einheiten der Größen folgt dann:
- s(t) haben wir in der Einheit 1 m gemessen.
- t haben wir in der Einheit 1 s gemessen.
Da das konstante Glied 0,18 per Subtraktion mit der Gleichung verbunden ist, muss es die gleiche Einheit wie s(t) haben, also 0,18 m.
Eine Einheitenbetrachtung liefert die Einheit k des Faktors 4,0.
{\large\begin{array}{l}s(t)\,=\,4,0\,\cdot \,t\,-\,0,18\\\\\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\downarrow \,\,\,Einheiten\\\\1\,m\,=\,4,0\,k\,\cdot \,1\,s\,-\,0,18\,m\end{array} }
{\large\begin{array}{l}1\,m\,=\,1\,k\,\cdot \,1\,s\,\,\,\,\,\,\left| :\,1\,s \right.\\1\,\frac{m}{s}\,=\,1\,k\end{array} }
Die gesuchte Einheit von k ist { 1\,\frac{m}{s}}
{\large s(t)\,=\,4,0\,\frac{m}{s}\,\cdot \,t\,-0,18\,m }
Welchen Einfluss hat der Subtrahend?
Der Subtrahend -0,18m bzw. 18cm gibt die Position des Fahrrades zum Zeitpunkt t=0 an. Es ist gleichzeitig die Position, an der der Graph die y-Achse schneidet.
Jeder Messwert ist mit einem Fehler behaftet. Da wir hier mit einer Stoppuhr händisch die Werte aufgenommen haben, können wir annehmen, dass es sich bei der Verschiebung der Ausgleichsgerade um 18cm um einen Messfehler handelt. Schließlich haben wir unsere Messung zum Zeitpunkt t=0 bei s=0 begonnen.
Für die gewonnene Gleichung gilt dann:
{\large s(t)\,=\,4,0\,\frac{m}{s}\,\cdot \,t}
Wie sehen, es handelt sich um eine gleichförmige Bewegung mit der Geschwindigkeit 4,0 {\frac{m}{s}}
s und t sind proportional zueinander. s~t
Ist der gewählte Zusammenhang physikalisch sinnvoll?
Beispiel ab Klasse 7/8
Wie messen, welche Zeit ein Stein benötigt, um von einer Höhe h aus auf den Boden zu fallen. Dazu nehmen wir die Messwerte für die Höhen 1 m und 2 m auf.
Abbildung ►05 zeigt die Ausgleichsgerade. Die Korrelation ist mit r=0,953 nicht schlecht.
Aber passt die gewählte lineare Form zu unseren Messwerten?
Wenn wir die Gleichung wieder „in Physik übersetzen“, dann erhalten wir:
s(t)=2,9·t
Hierbei handelt es sich um eine gleichförmige Bewegung. Das bedeutet, dass der Stein seine Geschwindigkeit nicht ändert. Das muss falsch sein! Wenn der Stein seine Geschwindigkeit beim Fallen nicht ändern würde, dann müsste er in der Luft stehen bleiben, da er ja zum Beginn der Bewegung aus der Ruhelage losgelassen wurde.
Der gefundene Zusammenhang ist physikalisch nicht sinnvoll!
Wir werden nach einem anderen Zusammenhang suchen müssen, der den experimentellen Beobachtungen nicht widerspricht.
Es gibt aber noch einen weiteren Punkt zu beachten. Regressionen aus sehr wenigen Werten sind unzuverlässig. Auch wenn es keine feste Regel für eine allgemeine Mindestanzahl von Messwertpaaren gibt, weniger als 5 sollten es i.d.R nicht sein.
Passt die gefundene Funktion zu den aufgenommenen Messwerten?
Es gibt ein mathematisch aufwendiges Verfahren, die genaue Passung der Messwerte zu überprüfen, die Methode der kleinsten Quadrate. Darauf wird hier nicht weiter eingegangen.
Diese Überprüfung leisten für uns EXCEL oder der Taschenrechner. Hier wird die Korrelation r bzw. das Bestimmtheitsmaß r2 (oder R2) angegeben. Es gilt: r·r=r2=R2
Der Korrelationskoeffizient r gibt an, wie gut der gefundene Zusammenhang zu den Messwerten passt. r nimmt dabei Werte von -1 bis +1 an. Je näher unser r an 1 oder -1, desto besser ist der gefundene Zusammenhang. Für R2 gilt das analog, wobei hier keine negativen Werte auftreten können.
R2 wird als Bestimmtheitsmaß bezeichnet.