Kategoriale Daten vs. numerische Daten
Daten sind die Fakten oder Informationen, die zum Zwecke der Referenz oder Analyse erhoben werden. Oft werden diese Daten als Attribut des betroffenen Subjekts erhoben. Dieses Attribut kann von einem zum anderen variieren, daher kann dieses variierende Attribut als eine Variable betrachtet werden. Die Variablen können unterschiedliche Werte annehmen und diese sind in den gesammelten Daten enthalten.
Variablen können entweder qualitativ oder quantitativ sein; wenn die Variable quantitativ ist, sind die Antworten Zahlen und die Größe des gemessenen Attributs kann mit einem bestimmten Grad an Genauigkeit angegeben werden. Bei dem anderen Typ, den qualitativen Variablen, werden die qualitativen Merkmale gemessen, und die von den Variablen angenommenen Werte können nicht in Bezug auf Größe oder Größe angegeben werden. Die Variablen selbst werden als kategoriale Variablen bezeichnet und die mittels einer kategorialen Variablen erfassten Daten sind kategoriale Daten.
Mehr zu numerischen Daten
Numerische Daten sind im Wesentlichen die quantitativen Daten, die von einer Variablen erhalten werden, und der Wert hat einen Sinn für Größe / Größe. Die erhaltenen numerischen Daten sind weiter in drei weitere Kategorien unterteilt, basierend auf der von Stanley Smith Stevens entwickelten Theorie. Numerische Daten können entweder Ordinalzahl, Intervall oder Verhältnis sein. Die Art der Daten wird durch die Messmethode der Werte bestimmt, und die Datentypen werden als Messniveaus bezeichnet.
Das Gewicht einer Person, der Abstand zwischen zwei Punkten, die Temperatur und der Preis einer Aktie sind Beispiele für numerische Daten.
In der Statistik werden die meisten Methoden für die Analyse numerischer Daten hergeleitet. Für die Analyse numerischer Daten werden hauptsächlich grundlegende deskriptive Statistiken sowie Regressions- und andere Inferenzmethoden verwendet.
Weitere Informationen zu Kategoriedaten
Kategoriale Daten sind Werte für eine qualitative Variable, häufig eine Zahl, ein Wort oder ein Symbol. Sie bringen die Tatsache zum Ausdruck, dass die Variable im betrachteten Fall zu einer der verschiedenen verfügbaren Optionen gehört. Sie gehören daher zu einer der Kategorien; daher der Name kategorisch.
Die politische Zugehörigkeit einer Person, die Nationalität einer Person, die Lieblingsfarbe einer Person und die Blutgruppe eines Patienten sind qualitative Attribute. Manchmal kann eine Zahl als kategorialer Wert erhalten werden, die Zahl selbst repräsentiert jedoch nicht die Größe des gemessenen Attributs. Postleitzahl ist ein Beispiel.
Außerdem gehören alle kategorialen Werte zum nominalen Datentyp. Dies ist ein anderer Typ, der auf den Messebenen basiert. Die zur Analyse kategorialer Daten verwendeten Methoden unterscheiden sich von denen numerischer Daten, das zugrunde liegende Prinzip kann jedoch das gleiche sein.
Was ist der Unterschied zwischen kategorialen und numerischen Daten??
• Numerische Daten sind Werte, die für eine quantitative Variable erhalten werden, und haben einen auf den Kontext der Variablen bezogenen Sinn für Größe (daher handelt es sich immer um Zahlen oder Symbole, die einen numerischen Wert tragen). Kategoriale Daten sind Werte, die für eine qualitative Variable erhalten werden. Kategoriale Datennummern haben keinen Sinn für die Größenordnung.
• Numerische Daten gehören immer zu Ordinal-, Verhältnis- oder Intervalltypen, während kategoriale Daten zum Nenntyp gehören.
• Die zur Analyse quantitativer Daten verwendeten Methoden unterscheiden sich von den für kategoriale Daten verwendeten Methoden, selbst wenn die Prinzipien dieselben sind, zumindest weist die Anwendung erhebliche Unterschiede auf.
• Numerische Daten werden mit statistischen Methoden in der deskriptiven Statistik, Regression, Zeitreihen und vielem mehr analysiert.
• Für kategoriale Daten werden normalerweise beschreibende Methoden und grafische Methoden verwendet. Einige nichtparametrische Tests werden ebenfalls verwendet.