Hat jemand Erfahrung mit Ansätzen zur Auswahl der Anzahl der Hauptkomponenten mit geringer Dichte, die in ein Regressionsmodell aufgenommen werden
Hat jemand Erfahrung mit Ansätzen zur Auswahl der Anzahl der Hauptkomponenten mit geringer Dichte, die in ein Regressionsmodell aufgenommen werden
Angenommen, ich habe einen 2D-Punktdatensatz und möchte die Richtungen aller lokalen Varianzmaxima in den Daten ermitteln, zum Beispiel: PCA hilft in dieser Situation nicht, da es sich um eine orthogonale Zerlegung handelt und daher nicht beide Linien erkennen kann, die ich blau angezeigt habe....
Ich habe ein anwendungsbasiertes Papier gelesen, in dem es heißt, dass PCA vor der Anwendung von ICA angewendet wird (unter Verwendung des fastICA-Pakets). Meine Frage ist, erfordert ICA (fastICA), dass PCA zuerst ausgeführt wird? Dieses Papier erwähnte das ... wird auch argumentiert, dass die...
Nur weil ein Korrespondent eine interessante Frage zu Methoden zur Berechnung der Autokorrelation stellte, begann ich damit zu spielen, fast ohne Kenntnis von Zeitreihen und Autokorrelation. Der Korrespondent ordnete seine Daten ( Datenpunkte einer Zeitreihe) jeweils um eine Zeitverzögerung so an,...
Ich habe verschiedene Variablen, die innerhalb einer Population interagieren. Grundsätzlich habe ich eine Bestandsaufnahme von Tausendfüßlern durchgeführt und einige andere Werte des Geländes gemessen, wie zum Beispiel: Die Art und die Anzahl der gesammelten Exemplare Die verschiedenen Umgebungen,...
Ich versuche, die Ausgabe der Hauptkomponentenanalyse wie folgt zu verstehen: > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4...
Angenommen, ist eine Matrix von mittelzentrierten Daten. Die Matrix ist , hat verschiedene Eigenwerte und Eigenvektoren , ... , die orthogonal sind.AA\mathbf AS=cov(A)S=cov(A)\mathbf S=\text{cov}(\mathbf A)m×mm×mm\times mmmms1s1\mathbf s_1s2s2\mathbf s_2smsm\mathbf s_m Die te Hauptkomponente...
Ich nehme Dummy-Daten der Temperatur im Vergleich zu Eisverkäufen und kategorisiere sie mit K-Mitteln (n Cluster = 2), um 2 Kategorien zu unterscheiden (total Dummy). Jetzt mache ich eine Hauptkomponentenanalyse dieser Daten und mein Ziel ist es zu verstehen, was ich sehe. Ich weiß, dass das...
Ich habe die Grundlagen der Hauptkomponentenanalyse aus Tutorial1 , Link1 und Link2 gelesen . Ich habe einen Datensatz von 100 Variablen (einschließlich der Ausgabevariablen Y), möchte die Variablen durch PCA auf 40 reduzieren und dann die Variable Y unter Verwendung dieser 40 Variablen...
Ich habe einen Datensatz mit mehr als 1000 Beispielen mit 19 Variablen. Mein Ziel ist es, eine binäre Variable basierend auf den anderen 18 Variablen (binär und stetig) vorherzusagen. Ich bin ziemlich sicher, dass 6 der Vorhersagevariablen mit der binären Antwort verknüpft sind. Ich möchte jedoch...
Ich versuche, die Dimensionalität und das Rauschen eines Datensatzes zu reduzieren, indem ich eine PCA für den Datensatz durchführe und die letzten PCs wegwerfe. Danach möchte ich einige Algorithmen für maschinelles Lernen auf den verbleibenden PCs verwenden und daher die Daten normalisieren, indem...
In ihrer Arbeit über Autoencoder für die Textklassifizierung demonstrierten Hinton und Salakhutdinov die Darstellung der zweidimensionalen LSA (die eng mit PCA verwandt ist) : . Durch Anwenden von PCA auf absolut unterschiedliche, leicht hochdimensionale Daten erhielt ich ein ähnlich aussehendes...
In Anbetracht der konstanten Anzahl von Merkmalen hat Barnes-Hut t-SNE eine Komplexität von , zufällige Projektionen und PCA eine Komplexität von was sie für sehr große Datenmengen "erschwinglich" macht.O ( n )O ( n logn )O(nlogn)O(n\log n)O ( n )O(n)O(n) Andererseits weisen Verfahren, die auf...
Bei zwei mehrdimensionalen Datensätzen, und , führen einige Personen eine multivariable Analyse durch, indem sie mithilfe der Hauptkomponentenanalyse (PCA) eine ersatzabhängige Variable erstellen. Das heißt, führen Sie PCA auf Set aus, nehmen Sie Scores entlang der ersten Komponente und führen Sie...
Ich habe einen Datensatz, der nominell 16-dimensional ist. Ich habe ungefähr 100 Proben in einem Fall und ungefähr 20.000 in einem anderen. Basierend auf verschiedenen explorativen Analysen, die ich mit PCA und Wärmekarten durchgeführt habe, bin ich überzeugt, dass die wahre Dimensionalität (dh die...
Nach der PCA beschreibt die erste Komponente den größten Teil der Variabilität. Dies ist wichtig, z. B. bei der Untersuchung von Körpermaßen, bei denen allgemein bekannt ist (Jolliffe, 2002), dass die PC1-Achse Größenschwankungen erfasst. Meine Frage ist, ob PCA-Scores nach Varimax-Rotation...
Ich habe einige grundlegende Fragen zu PCA (Hauptkomponentenanalyse) und LDA (lineare Diskriminanzanalyse): In PCA gibt es eine Möglichkeit, den erklärten Varianzanteil zu berechnen. Ist es auch für LDA möglich? Wenn das so ist, wie? ldaEntspricht der von der Funktion (in der R MASS-Bibliothek)...
Ich habe einen Datensatz von 17 Personen, Rang 77 Aussagen. Ich möchte Hauptkomponenten auf einer transponierten Korrelationsmatrix von Korrelationen zwischen Personen (als Variablen) über Aussagen (als Fälle) extrahieren . Ich weiß, es ist seltsam, es heißt Q-Methodik . Ich möchte...
Ich versuche, eine Mittelebene eines 3D-Modells unter Verwendung der Mittelpunkte gepaarter Landmarken zu schätzen, um fehlende Daten zu rekonstruieren (die Mittelebene bezieht sich hier auf die mittlere / saggitale Ebene des Schädels, die den Schädel in zwei symmetrische Hälften schneidet, links...
Wenn Sie eine Faktoranalyse (z. B. durch Hauptachsen-Factoring) oder eine Hauptkomponentenanalyse als Faktoranalyse durchführen und eine Schrägdrehung der Ladungen durchgeführt haben, - welche Matrix verwenden Sie dann, um zu verstehen, welche Elemente auf welche Faktoren geladen werden und um die...