Als «cross-validation» getaggte Fragen

11

Wie können Sie feststellen, ob ein Gaußscher Prozess überpasst?

Ich trainiere einen Gaußschen Prozess mit einem ARD-Kernel mit vielen Parametern, indem ich die marginale Lielihood der Daten maximiere, anstatt sie gegenseitig zu validieren. Ich vermute, dass es überpassend ist. Wie kann ich diesen Verdacht in einem Bayes'schen Kontext

machine-learning cross-validation gaussian-process

11

Aufteilen von Zeitreihendaten in Zug- / Test- / Validierungssätze

Was ist der beste Weg, um Zeitreihendaten in Zug- / Test- / Validierungssätze aufzuteilen, wobei der Validierungssatz für die Optimierung von Hyperparametern verwendet wird? Wir haben tägliche Verkaufsdaten im Wert von 3 Jahren. Unser Plan ist es, 2015-2016 als Trainingsdaten zu verwenden, dann...

time-series cross-validation validation

11

Mittelung der Präzision und des Rückrufs bei Verwendung der Kreuzvalidierung

Ich habe eine Klassifizierung unter Verwendung mehrerer Klassifizierer für Daten mit 2 Klassen durchgeführt und eine 5-fache Kreuzvalidierung verwendet. Für jede Falte berechnete ich tp, tn, fp und fn. Dann berechnete ich die Genauigkeit, Präzision, Rückruf und F-Punktzahl für jeden Test. Meine...

classification cross-validation precision-recall

11

Frage zum Subtrahieren des Mittelwerts im Zug / gültig / Testsatz

Ich mache eine Datenvorverarbeitung und werde danach ein Convonets auf meinen Daten erstellen. Meine Frage lautet: Angenommen, ich habe einen Gesamtdatensatz mit 100 Bildern. Ich habe den Mittelwert für jedes der 100 Bilder berechnet und ihn dann von jedem der Bilder subtrahiert, dann in Zug- und...

machine-learning cross-validation data-preprocessing

11

Wie verwende ich XGboost.cv mit der Optimierung von Hyperparametern?

Ich möchte die Hyperparameter von XGboost mithilfe der Kreuzvalidierung optimieren. Es ist jedoch nicht klar, wie man das Modell erhält xgb.cv. Zum Beispiel rufe ich objective(params)von an fmin. Dann wird das Modell montiert dtrainund validiert dvalid. Was ist, wenn ich KFold Crossvalidation...

cross-validation python boosting hyperparameter gradient

11

Konfidenzintervall für die kreuzvalidierte Klassifizierungsgenauigkeit

Ich arbeite an einem Klassifizierungsproblem, das eine Ähnlichkeitsmetrik zwischen zwei eingegebenen Röntgenbildern berechnet. Wenn die Bilder von derselben Person stammen (Bezeichnung "rechts"), wird eine höhere Metrik berechnet. Eingabebilder von zwei verschiedenen Personen (Bezeichnung "falsch")...

classification confidence-interval cross-validation matlab

11

Genaue Definition des Abweichungsmaßes im glmnet-Paket mit Kreuzvalidierung?

Für meine aktuelle Forschung verwende ich die Lasso-Methode über das glmnet-Paket in R für eine binomialabhängige Variable. In glmnet wird das optimale Lambda durch Kreuzvalidierung ermittelt und die resultierenden Modelle können mit verschiedenen Maßnahmen verglichen werden, z. B....

cross-validation lasso glmnet deviance lars

11

Anzahl der Hauptkomponenten bei der Vorverarbeitung mit PCA im Caret-Paket in R.

Ich verwende das caretPaket in Rfür das Training von binären SVM-Klassifikatoren. Zur Reduzierung von Funktionen verarbeite ich mit PCA die integrierte Funktion, preProc=c("pca")wenn ich anrufe train(). Hier sind meine Fragen: Wie wählt Caret Hauptkomponenten aus? Gibt es eine feste Anzahl von...

r machine-learning pca cross-validation caret

11

Wie wähle ich einen Kernel für Kernel PCA?

Wie kann ausgewählt werden, welcher Kernel zu einer guten Datentrennung bei der endgültigen Datenausgabe durch die Kernel-PCA (Hauptkomponentenanalyse) führen würde, und wie können die Parameter des Kernels optimiert werden? Wenn möglich, wären Laienbegriffe sehr willkommen, und Links zu Artikeln,...

pca cross-validation dimensionality-reduction kernel-trick manifold-learning

11

Ist die Aufteilung der Daten in Test- und Trainingssätze eine reine Statistiksache?

Ich bin ein Physikstudent, der maschinelles Lernen / Datenwissenschaft studiert, daher meine ich nicht, dass diese Frage Konflikte auslöst :) Ein großer Teil eines Physik-Bachelor-Programms besteht jedoch darin, Labore / Experimente durchzuführen, was eine Menge Daten bedeutet Verarbeitung und...

regression machine-learning cross-validation dataset experiment-design

11

Kreuzvalidierung nach LASSO in komplexen Umfragedaten

Ich versuche, mit LASSO eine Modellauswahl für einige Kandidaten-Prädiktoren mit einem kontinuierlichen Ergebnis durchzuführen. Das Ziel besteht darin, das optimale Modell mit der besten Vorhersageleistung auszuwählen, was normalerweise durch K-fache Kreuzvalidierung erfolgen kann, nachdem ein...

cross-validation survey lasso glmnet

11

Ist die Fehlerrate eine konvexe Funktion des Regularisierungsparameters Lambda?

Bei der Auswahl des Regularisierungsparameters Lambda in Ridge oder Lasso wird empfohlen, verschiedene Lambda-Werte auszuprobieren, den Fehler im Validierungssatz zu messen und schließlich den Lambda-Wert auszuwählen, der den niedrigsten Fehler zurückgibt. Es ist mir kein Problem, wenn die Funktion...

cross-validation error regularization validation optimization

10

Gute Literatur zur Kreuzvalidierung

Kennt jemand ein gutes Buch / eine gute Webseite, um die Techniken der Kreuzvalidierung zu

references cross-validation

10

Wie simuliere ich multivariate Ergebnisse in R?

In den meisten Situationen beschäftigen wir uns nur mit einer Ergebnis- / Antwortvariablen wie . In einigen Szenarien, insbesondere in den klinischen Daten, können die Ergebnisvariablen jedoch hochdimensional / multivariat sein. Beispiel: , wobei die , und enthält und diese Ergebnisse alle...

r cross-validation

10

Modellstabilität bei der Kreuzvalidierung von Regressionsmodellen

Wie sollte man bei mehreren Kreuzvalidierungsfalten einer logistischen Regression und den daraus resultierenden Mehrfachschätzungen jedes Regressionskoeffizienten messen, ob ein Prädiktor (oder eine Reihe von Prädiktoren) auf der Grundlage der Regressionskoeffizienten stabil und aussagekräftig ist...

regression model-selection cross-validation

10

Wie baue ich einen innovativen Ausreißer bei Beobachtung 48 in mein ARIMA-Modell ein?

Ich arbeite an einem Datensatz. Nachdem ich einige Modellidentifikationstechniken angewendet hatte, kam ich mit einem ARIMA (0,2,1) -Modell heraus. Ich habe die detectIOFunktion im Paket TSAin R verwendet, um bei der 48. Beobachtung meines ursprünglichen Datensatzes einen innovativen Ausreißer (IO)...

r time-series arima outliers hypergeometric fishers-exact r time-series intraclass-correlation r logistic glmm clogit mixed-model spss repeated-measures ancova machine-learning python scikit-learn distributions data-transformation stochastic-processes web standard-deviation r machine-learning spatial similarities spatio-temporal binomial sparse poisson-process r regression nonparametric r regression logistic simulation power-analysis r svm random-forest anova repeated-measures manova regression statistical-significance cross-validation group-differences model-comparison r spatial model-evaluation parallel-computing generalized-least-squares r stata fitting mixture hypothesis-testing categorical-data hypothesis-testing anova statistical-significance repeated-measures likert wilcoxon-mann-whitney boxplot statistical-significance confidence-interval forecasting prediction-interval regression categorical-data stata least-squares experiment-design skewness reliability cronbachs-alpha r regression splines maximum-likelihood modeling likelihood-ratio profile-likelihood nested-models

10

Vergleich der Verteilungen der Generalisierungsleistung

Angenommen, ich habe zwei Lernmethoden für ein Klassifizierungsproblem , und , und ich schätze ihre Generalisierungsleistung mit etwas wie wiederholter Kreuzvalidierung oder Bootstrapping. Durch diesen Prozess erhalte ich eine Verteilung der Bewertungen und für jede Methode über diese...

cross-validation model-selection

10

Sollte die Funktionsauswahl nur für Trainingsdaten (oder alle Daten) durchgeführt werden?

Sollte die Merkmalsauswahl nur für Trainingsdaten (oder alle Daten) durchgeführt werden? Ich habe einige Diskussionen und Artikel wie Guyon (2003) und Singhi und Liu (2006) durchgearbeitet, bin mir aber immer noch nicht sicher, ob ich die richtige Antwort finden soll. Mein Versuchsaufbau ist wie...

dataset cross-validation experiment-design feature-selection

10

Warum unterschätzt die CV-Schätzung des Testfehlers den tatsächlichen Testfehler?

Nach meinem Verständnis unterschätzt die k-fache Kreuzvalidierungsschätzung des Testfehlers normalerweise den tatsächlichen Testfehler. Ich bin verwirrt, warum dies der Fall ist. Ich verstehe, warum der Trainingsfehler normalerweise niedriger ist als der Testfehler - weil Sie das Modell mit...

cross-validation bias

10

Überlegenheit von LASSO gegenüber Vorwärtsauswahl / Rückwärtseliminierung in Bezug auf den Kreuzvalidierungs-Vorhersagefehler des Modells

Ich habe drei reduzierte Modelle von einem Original-Vollmodell mit erhalten Vorauswahl Rückwärtseliminierung L1 Bestrafungstechnik (LASSO) Für die Modelle, die unter Verwendung von Vorwärtsauswahl / Rückwärtseliminierung erhalten wurden, erhielt ich die kreuzvalidierte Schätzung des...

cross-validation model-selection lasso stepwise-regression