Lineare vs. logistische Regression
Bei der statistischen Analyse ist es wichtig, die Beziehungen zwischen den betroffenen Variablen der Studie zu identifizieren. Manchmal kann dies der einzige Zweck der Analyse selbst sein. Die Regressionsanalyse ist ein wichtiges Instrument, um die Existenz einer Beziehung festzustellen und die Beziehung zu identifizieren.
Die einfachste Form der Regressionsanalyse ist die lineare Regression, bei der die Beziehung zwischen den Variablen eine lineare Beziehung ist. Statistisch wird die Beziehung zwischen der erklärenden Variablen und der Antwortvariablen hervorgehoben. Mithilfe der Regression können wir zum Beispiel die Beziehung zwischen dem Rohstoffpreis und dem Verbrauch auf der Grundlage von Daten ermitteln, die aus einer Zufallsstichprobe stammen. Die Regressionsanalyse wird eine Regressionsfunktion des Datensatzes erzeugen, bei der es sich um ein mathematisches Modell handelt, das am besten zu den verfügbaren Daten passt. Dies kann leicht durch ein Streudiagramm dargestellt werden. Die grafische Regression entspricht der Ermittlung der am besten passenden Kurve für den angegebenen Datensatz. Die Funktion der Kurve ist die Regressionsfunktion. Mit Hilfe des mathematischen Modells kann die Verwendung einer Ware zu einem bestimmten Preis vorhergesagt werden.
Daher wird die Regressionsanalyse häufig für die Vorhersage und Prognose verwendet. Es wird auch verwendet, um die Beziehungen in experimentellen Daten, auf den Gebieten der Physik, der Chemie sowie in vielen Naturwissenschaften und technischen Disziplinen herzustellen. Wenn die Beziehung oder die Regressionsfunktion eine lineare Funktion ist, wird der Prozess als lineare Regression bezeichnet. Im Streudiagramm kann es als gerade Linie dargestellt werden. Wenn die Funktion keine lineare Kombination der Parameter ist, ist die Regression nicht linear.
Die logistische Regression ist mit der multivariaten Regression vergleichbar. Sie erstellt ein Modell, um die Auswirkungen mehrerer Prädiktoren auf eine Antwortvariable zu erklären. Bei der logistischen Regression sollte die Endergebnisvariable jedoch kategorial sein (normalerweise geteilt, d. H. Ein Paar erreichbarer Ergebnisse, wie Tod oder Überleben, obwohl spezielle Techniken die Modellierung von mehr kategorisierten Informationen ermöglichen). Eine kontinuierliche Ergebnisvariable kann in eine kategoriale Variable umgewandelt werden, die für die logistische Regression verwendet wird. Es wird jedoch meist davon abgeraten, kontinuierliche Variablen auf diese Weise zusammenzufassen, da dies die Genauigkeit verringert.
Anders als bei der linearen Regression müssen die Prädiktorvariablen bei der logistischen Regression nicht zwingend in linearer Verbindung, allgemein verteilt oder in jedem Cluster die gleiche Varianz aufweisen. Daher ist die Beziehung zwischen den Prädiktor- und Ergebnisvariablen nicht wahrscheinlich eine lineare Funktion.
Was ist der Unterschied zwischen logistischer und linearer Regression??
• Bei der linearen Regression wird eine lineare Beziehung zwischen der erklärenden Variablen und der Antwortvariablen angenommen, und Parameter, die das Modell erfüllen, werden durch Analyse ermittelt, um die genaue Beziehung zu ermitteln.
• Die lineare Regression wird für quantitative Variablen ausgeführt, und die resultierende Funktion ist eine quantitative.
• In der logistischen Regression können die verwendeten Daten entweder kategorial oder quantitativ sein, das Ergebnis ist jedoch immer kategorial.