Ich verwende Caret, um eine kreuzvalidierte zufällige Gesamtstruktur über ein Dataset auszuführen. Die Y-Variable ist ein Faktor. In meinem Datensatz befinden sich keine NaNs, Infs oder NAs. Allerdings bekomme ich, wenn ich den zufälligen Wald laufen lasse
Error in randomForest.default(m, y, ...) :
NA/NaN/Inf in foreign function call (arg 1)
In addition: There were 28 warnings (use warnings() to see them)
Warning messages:
1: In data.matrix(x) : NAs introduced by coercion
2: In data.matrix(x) : NAs introduced by coercion
3: In data.matrix(x) : NAs introduced by coercion
4: In data.matrix(x) : NAs introduced by coercion
Hat jemand eine Idee, ob dieser Fehler durch die durch Zwang eingeführten NAs verursacht wird? Wenn ja, wie kann ich solchen Zwang verhindern?
r
random-forest
caret
regression
prediction
fitting
social-science
poisson-distribution
distributions
characteristic-function
bayesian
prior
regression
normal-distribution
interaction
nonparametric
skewness
svm
standard-deviation
standard-error
regression-coefficients
igraph
natural-language
word2vec
word-embeddings
regression
machine-learning
sampling
r
regression
machine-learning
random-forest
ensemble
sampling
unbiased-estimator
proof
estimators
mse
probability
conditional-probability
bayes
anova
missing-data
neural-networks
recommender-system
r
confidence-interval
sample
multiple-imputation
r
time-series
forecasting
mase
Info5ek
quelle
quelle
Wahrscheinlich haben Sie einige Zeichenvariablen in Ihrem Datenrahmen.
Konvertieren Sie alle Zeichenvariablen in einen Faktor in einer Zeile:
library(dplyr) data_fac=data_char %>% mutate_if(is.character, as.factor)
quelle
mutate_if()
dafür zu verwenden ... danke!Wie in der Warnung gezeigt, gab es 28 Fehler, die zufällig die Anzahl der Spalten mit Zeichendatentypen ("chr") waren. Erzwingen, dass diese Spalten den Faktoren entsprechen, die für den Beginn des Laufs zulässig sind.
quelle