Ich verstehe nicht, warum die Zufallsvariable "negatives Binom" diesen Namen hat. Was ist daran negativ? Was ist daran binomisch? Was ist daran
Ich verstehe nicht, warum die Zufallsvariable "negatives Binom" diesen Namen hat. Was ist daran negativ? Was ist daran binomisch? Was ist daran
Betrachten Sie das Standardmodell für die multiple Regression wobei gilt.ε ∼ N ( 0 , σ 2 I n )Y.= Xβ+ εY.=Xβ+εY=X\beta+\varepsilonε ∼ N( 0 , σ2ichn)ε∼N(0,σ2ichn)\varepsilon \sim \mathcal N(0, \sigma^2I_n) Angenommen, wir führen eine Gratregression durch, indem wir allen Elementen der Diagonale von...
Ich habe eine große Menge von Merkmalsvektoren, die ich verwenden werde, um ein Binärklassifizierungsproblem anzugreifen (mit Scikit Learn in Python). Bevor ich mich mit Imputation beschäftige, möchte ich anhand der verbleibenden Teile der Daten feststellen, ob die fehlenden Daten "zufällig" oder...
Nehmen wir der Einfachheit halber an, ich arbeite am klassischen Beispiel von Spam- / Nicht-Spam-E-Mails. Ich habe 20000 E-Mails. Davon weiß ich, dass 2000 Spam sind, aber ich habe kein Beispiel für Nicht-Spam-E-Mails. Ich möchte vorhersagen, ob es sich bei den verbleibenden 18000 um Spam handelt...
Ich habe Probleme zu verstehen, was ein Bayes-Bootstrapping-Prozess ist und wie sich dieser von Ihrem normalen Bootstrapping unterscheidet. Und wenn jemand eine intuitive / konzeptionelle Überprüfung und einen Vergleich von beiden anbieten könnte, wäre das großartig. Nehmen wir ein Beispiel....
Die Daten haben viele Funktionen (z. B. 100) und die Anzahl der Instanzen liegt bei 100.000. Die Daten sind spärlich. Ich möchte die Daten mit logistischer Regression oder SVM anpassen. Woher weiß ich, ob Features linear oder nicht linear sind, sodass ich den Kernel-Trick verwenden kann, wenn er...
Hier ist meine alte Frage Ich möchte fragen, ob jemand den Unterschied (falls vorhanden) zwischen Hidden Markov-Modellen (HMM) und Partikelfilter (PF) und folglich Kalman-Filter kennt oder unter welchen Umständen wir welchen Algorithmus verwenden. Ich bin Student und muss ein Projekt machen, aber...
Wie funktioniert die Inversionsmethode? Sagen , ich habe eine Stichprobe X1, X2, . . . , XnX1,X2,...,XnX_1,X_2,...,X_n mit der Dichte f(x;θ)=1θx(1−θ)θf(x;θ)=1θx(1-θ)θf(x;\theta)={1\over \theta} x^{(1-\theta)\over \theta} über 0 < x <
Vor kurzem habe ich mich mit dem Erlernen von Boosting-Algorithmen wie Adaboost und Gradienten-Boost befasst, und ich kenne die Tatsache, dass der am häufigsten verwendete schwache Lernende Bäume sind. Ich möchte wirklich wissen, ob es in letzter Zeit einige erfolgreiche Beispiele (ich meine einige...
Ich las den Bericht über die Siegerlösung eines Kaggle-Wettbewerbs ( Malware Classification ). Der Bericht ist in diesem Forumsbeitrag zu finden . Das Problem war ein Klassifizierungsproblem (neun Klassen, die Metrik war der logarithmische Verlust) mit 10000 Elementen in der Zugmenge, 10000...
Präambel Dies ist ein langer Beitrag. Wenn Sie dies noch einmal lesen, beachten Sie bitte, dass ich den Fragenteil überarbeitet habe, obwohl das Hintergrundmaterial das gleiche bleibt. Außerdem glaube ich, dass ich eine Lösung für das Problem gefunden habe. Diese Lösung wird unten im Beitrag...
EDIT: Da diese Frage aufgeblasen wurde, eine Zusammenfassung: Finden verschiedener aussagekräftiger und interpretierbarer Datensätze mit derselben gemischten Statistik (Mittelwert, Median, Mittlerer Bereich und die damit verbundenen Streuungen und Regressionen). Das Anscombe Quartett (siehe ?...
Was ist "logistisch" an der logistischen Verteilung im gesunden Menschenverstand? Was ist die Etymologie und die lexikalische Begründung für den Namen, nicht nur die reine mathematische
In der klassischen Statistik gibt es die Definition, dass eine Statistik TTT eines Datensatzes y1, … , Yny1,…,yny_1, \ldots, y_n für einen Parameter θθ\theta als vollständig definiert ist. Es ist unmöglich, daraus nichttrivial einen unverzerrten Schätzer von 000 zu bilden . Das heißt, hat die...
Mit Stan und Frontend - Paketen rstanarmoder brmsich kann einfach Daten für den Bayesian analysiert , wie ich zuvor mit gemischten Modellen wie lme. Obwohl ich die meisten Bücher und Artikel von Kruschke-Gelman-Wagenmakers-etc auf meinem Schreibtisch habe, verraten diese nicht, wie ich die...
Wir definieren eine Engpassarchitektur als den Typ, der im ResNet-Artikel zu finden ist, in dem [zwei 3x3-Conv-Ebenen] durch [eine 1x1- Conv-Ebene , eine 3x3-Conv-Ebene und eine weitere 1x1-Conv-Ebene] ersetzt werden. Ich verstehe, dass die 1x1-Conv-Ebenen als eine Form der Dimensionsreduktion...
Zum Beispiel ist Rdie MASS::mvrnorm()Funktion in nützlich, um Daten zu generieren, um verschiedene Dinge in der Statistik zu demonstrieren. Ein obligatorisches SigmaArgument ist eine symmetrische Matrix, die die Kovarianzmatrix der Variablen angibt. Wie würde ich eine symmetrische Matrix mit...
Warum verwenden Leute Techniken der quadratischen Programmierung (wie SMO), wenn sie mit kernelisierten SVMs arbeiten? Was ist los mit Gradient Descent? Kann man es nicht mit Kerneln benutzen oder ist es einfach zu langsam (und warum?). Hier ist ein wenig mehr Kontext: Um die SVMs ein bisschen...
Mein Verständnis ist , dass , selbst wenn nach ordnungsgemäßem Kreuzvalidierung und Modellauswahlverfahren, Überanpassung wird , wenn man sucht nach einem Modell passiert schwer genug , wenn man nicht erlegt Beschränkungen Modellkomplexität, period. Darüber hinaus wird häufig versucht, aus den...
Hintergrund: Ja, die eingeschränkte Boltzmann-Maschine (RBM) kann verwendet werden, um die Gewichte eines neuronalen Netzwerks zu initiieren. Außerdem KANN es "Schicht für Schicht" verwendet werden, um ein tiefes Glaubensnetzwerk aufzubauen (d. H. Eine te Schicht auf der ( n - 1 ) -ten Schicht zu...