Hat jemand einen Verweis auf eine Zusammenfassung von Laufzeitanalysen für gängige Algorithmen für maschinelles Lernen (verschiedene Varianten von NN, SVM
Hat jemand einen Verweis auf eine Zusammenfassung von Laufzeitanalysen für gängige Algorithmen für maschinelles Lernen (verschiedene Varianten von NN, SVM
Angenommen, ich habe N Beobachtungen, möglicherweise mehrere Faktoren, und ich wiederhole jede Beobachtung zweimal (oder M
Wie kann in der Praxis beurteilt werden, ob ein AR (P) -Prozess stationär ist oder nicht? Wie ermittle ich die Reihenfolge für das AR- und
Die Frage, die ich stellen möchte, lautet: Wie ändert sich der Anteil der Stichproben innerhalb von 1 SD des Mittelwerts einer Normalverteilung, wenn die Anzahl der Variablen zunimmt? (Fast) jeder weiß, dass in einer eindimensionalen Normalverteilung 68% der Proben innerhalb einer...
Eigentlich schreibe ich eine Implementierung von Random Forests, aber ich glaube, die Frage ist spezifisch für Entscheidungsbäume (unabhängig von RFs). Der Kontext ist also, dass ich einen Knoten in einem Entscheidungsbaum erstelle und sowohl die Vorhersage- als auch die Zielvariable...
Ich habe einige Zeit mit der gegenseitigen Information gearbeitet. Aber ich habe in der "Korrelationswelt" ein sehr neues Maß gefunden, das auch zur Messung der Verteilungsunabhängigkeit verwendet werden kann, die sogenannte "Distanzkorrelation" (auch Brownsche Korrelation genannt):...
Alternativ zur Vorhersage von Devisenmärkten. Ich weiß, dass dies ziemlich kompliziert werden kann, daher suche ich zur Einführung einen einfachen Vorhersagealgorithmus mit einer gewissen Genauigkeit. (Es ist für ein M.Sc.-Universitätsprojekt, das vier Monate dauert) Ich habe gelesen, dass ein...
Es ist schon eine Weile her, dass ich mir das Teilen von Bäumen angesehen habe. Als ich das letzte Mal so etwas gemacht habe, mag ich Party in R (erstellt von Hothorn). Die Idee der bedingten Folgerung durch Stichproben ist für mich sinnvoll. Aber rpart hatte auch Anklang. In der aktuellen...
Es gab mehrere gute Fragen und Antworten zu Einführungsbüchern oder Lernansätzen, z . B. hier und hier . Aber ich habe ein etwas anderes Problem - die beste Möglichkeit, eine einstündige Sitzung (oder mehrere solcher Sitzungen) in einem Computerraum durchzuführen, damit die Leute mit R beginnen und...
Angenommen, ich habe ein Vorhersagemodell für das Auftreten einer bestimmten Krankheit in einem Datensatz (dem Datenbestand zur Modellbildung) erstellt und möchte nun überprüfen, wie gut das Modell in einem neuen Datensatz (dem Validierungsdatenbestand) funktioniert. Für ein mit logistischer...
Ich arbeite mit einem Datensatz mit N rund 200.000. In Regressionen sehe ich sehr kleine Signifikanzwerte << 0.001, die mit sehr kleinen Effektgrößen verbunden sind, z. B. r = 0.028. Was ich gerne wissen würde, gibt es eine grundsätzliche Möglichkeit, eine angemessene Signifikanzschwelle in...
Ich habe mich gefragt, warum LASSO- und LARS-Modellauswahlmethoden so beliebt sind, obwohl sie im Grunde genommen nur Variationen der schrittweisen Vorauswahl sind (und daher unter Pfadabhängigkeit leiden). Warum werden GETS-Methoden (General to Specific) für die Modellauswahl meist ignoriert,...
Im allgemeinen Einstellung des Gradientenabstiegsalgorithmus haben wir wobei x n ist der aktuelle Punkt, η ist die Schrittgröße und g r a d i e n t x n ist der bei x n bewertete Gradient . xn+1=xn−η∗gradientxnxn+1=xn−η∗gradientxnx_{n+1} = x_{n} - \eta *
Ich möchte den Analyseprozess kennenlernen oder Referenzen darüber haben, den die meisten statistischen Datenanalysten für jedes Datenanalyseprojekt durchlaufen. Wenn ich eine "Liste" erstelle, um das Datenanalyseprojekt abzuschließen, muss ein Analyst: Sammeln Sie zuerst die Anforderungen für das...
Ich analysiere Daten aus einem unausgeglichenen faktoriellen Experiment mit SASund R. Beide SASund Rliefern eine ähnliche Quadratsumme vom Typ I, aber ihre Quadratsumme vom Typ III unterscheidet sich voneinander. Im Folgenden sind SASund RCodes und Ausgänge. DATA ASD; INPUT Y T B; DATALINES; 20 1 1...
Ich muss auf meinem Laptop einen linearen Klassifikator mit hunderttausenden Datenpunkten und etwa zehntausenden Funktionen trainieren. Welche Möglichkeiten habe ich? Was ist der Stand der Technik für diese Art von Problem? Der stochastische Gradientenabstieg scheint eine vielversprechende Richtung...
Ich lese "Die Rolle des Schachs in der Forschung der künstlichen Intelligenz" ( pdf ) und es heißt interessanterweise: Die Erfahrung [...] zeigt, dass die Beiträge von Schachexperten zwar allgemein nützlich, aber nicht vollständig vertrauenswürdig sind. Ein gutes Beispiel dafür ist die...
Im Rahmen einer Aufgabe muss ich einen genetischen Programmieralgorithmus schreiben , der die Luftschadstoffwerte vorhersagt. Da ich keine Erfahrung habe, kann mir jemand Hinweise auf Vorschläge von Programmiersprachen geben, in denen weiterentwickelte Programme geschrieben werden . Klarstellung:...
Ich habe Antworten von 85 Personen zu ihrer Fähigkeit, bestimmte Aufgaben zu erledigen, gesammelt. Die Antworten sind auf einer Fünf-Punkte-Likert-Skala: 5 = sehr gut, 4 = gut, 3 = durchschnittlich, 2 = schlecht, 1 = sehr schlecht, Der Mittelwert liegt bei 2,8 und die Standardabweichung bei...
CARET verwendet automatisch ein vorab festgelegtes Abstimmungsraster, um verschiedene Modelle zu erstellen, bevor ein endgültiges Modell ausgewählt wird, und trainiert dann das endgültige Modell mit den vollständigen Trainingsdaten. Ich kann mein eigenes Stimmraster mit nur einer Kombination von...