Statistiken und Big Data

27

Strategie zur Bewältigung der logistischen Rückführung seltener Ereignisse

Ich möchte seltene Ereignisse in einer endlichen Population untersuchen. Da ich nicht sicher bin, welche Strategie am besten geeignet ist, würde ich mich über Tipps und Hinweise in Bezug auf diese Angelegenheit freuen, obwohl ich mir bewusst bin, dass sie weitgehend abgedeckt wurde. Ich weiß nur...

logistic rare-events

27

Warum sollte man sich in Naive Bayes mit Laplace-Glättung beschäftigen, wenn das Testset unbekannte Wörter enthält?

Ich habe heute über die Naive Bayes-Klassifikation gelesen. Ich las unter der Überschrift Parameterschätzung mit add 1 Glättung : Verweisen Sie mit ccc auf eine Klasse (z. B. Positiv oder Negativ) und mit www auf ein Token oder Wort. Der Maximum - Likelihood - Schätzer für P(w|c)P(w|c)P(w|c) ist...

machine-learning classification text-mining naive-bayes laplace-smoothing

27

Was ist los mit t-SNE vs. PCA zur Dimensionsreduktion mit R?

Ich habe eine Matrix von 336x256 Gleitkommazahlen (336 Bakteriengenome (Spalten) x 256 normalisierte Tetranukleotidfrequenzen (Zeilen), z. B. addiert sich jede Spalte zu 1). Ich erhalte gute Ergebnisse, wenn ich meine Analyse mit der Hauptkomponentenanalyse durchführe. Zuerst berechne ich die...

r pca tsne

27

Wie bestimme ich den optimalen Schwellenwert für einen Klassifikator und generiere eine ROC-Kurve?

Angenommen, wir haben einen SVM-Klassifikator. Wie generieren wir eine ROC-Kurve? (Wie theoretisch) (weil wir TPR und FPR mit jedem der Schwellenwerte generieren). Und wie ermitteln wir den optimalen Schwellenwert für diesen

machine-learning svm

27

Ist eine Zeitreihe dasselbe wie ein stochastischer Prozess?

Ein stochastischer Prozess ist ein Prozess, der sich im Laufe der Zeit entwickelt. Ist es also wirklich eine schickere Art, "Zeitreihen" zu

time-series stochastic-processes definition

27

Wie werden beim Clustering sowohl binäre als auch kontinuierliche Variablen zusammen verwendet?

Ich muss in k-means binäre Variablen (Werte 0 & 1) verwenden. K-means arbeitet aber nur mit stetigen Variablen. Ich weiß, dass einige Leute diese binären Variablen immer noch in k-means verwenden, ohne die Tatsache zu ignorieren, dass k-means nur für kontinuierliche Variablen ausgelegt ist. Das...

r clustering binary-data k-means mixed-type-data

27

Schön geschriebene Papiere

Aus David Salsburgs Buch The lady tasting tea : Obwohl der Leser es vielleicht nicht glaubt, spielt der literarische Stil in der mathematischen Forschung eine wichtige Rolle. Einige mathematische Autoren scheinen nicht in der Lage zu sein, leicht verständliche Artikel zu verfassen. Andere...

references communication

27

Ensemble verschiedener Arten von Regressoren, die Scikit-Learn (oder ein anderes Python-Framework) verwenden

Ich versuche die Regressionsaufgabe zu lösen. Ich habe herausgefunden, dass 3 Modelle für verschiedene Teilmengen von Daten gut funktionieren: LassoLARS, SVR und Gradient Tree Boosting. Mir ist aufgefallen, dass ich, wenn ich mit all diesen drei Modellen Vorhersagen mache und dann eine Tabelle mit...

regression scikit-learn ensemble

27

Was ist der Unterschied zwischen der Varianz und dem mittleren quadratischen Fehler?

Ich bin überrascht, dass dies noch nicht gestellt wurde, aber ich kann die Frage nicht auf stats.stackexchange finden. Dies ist die Formel zur Berechnung der Varianz einer normalverteilten Stichprobe: ∑(X−X¯)2n−1∑(X−X¯)2n−1\frac{\sum(X - \bar{X}) ^2}{n-1} Dies ist die Formel zur Berechnung des...

variance error

27

Wie beschreibt man Statistiken in einem Satz?

Als ich anfing, Statistiken zu lernen, schienen Verfahren wie der T-Test, die ANOVA, das Chi-Quadrat und die lineare Regression jeweils sehr unterschiedliche Wesen zu sein. Aber jetzt merke ich, dass diese Prozeduren mehr oder weniger dasselbe bewirken. Ebenso messen Werte wie Varianz, Residuen,...

definition

27

Ist die Kosinusähnlichkeit identisch mit dem 12-normalisierten euklidischen Abstand?

Gleichbedeutend damit , dass es für eine Ähnlichkeitsrangfolge zwischen einem Vektor u und einer Menge von Vektoren V zu gleichen Ergebnissen kommt . Ich habe ein Vektorraummodell, dessen Parameter Distanzmessung (euklidische Distanz, Kosinusähnlichkeit) und Normalisierungstechnik (keine, l1, l2)...

normalization natural-language euclidean cosine-distance cosine-similarity

27

Wie kann man den Unterschied zwischen linearen und nichtlinearen Regressionsmodellen erkennen?

Ich habe den folgenden Link zur nichtlinearen Regression SAS Non Linear gelesen . Mein Verständnis beim Lesen des ersten Abschnitts "Nichtlineare Regression vs. Lineare Regression" war, dass die folgende Gleichung tatsächlich eine lineare Regression ist. Ist das richtig? Wenn ja warum? y= b1x3+...

regression multiple-regression nonlinear-regression multicollinearity

27

Fläche unter Precision-Recall-Kurve (AUC der PR-Kurve) und Average Precision (AP)

Ist Average Precision (AP) der Bereich unter Precision-Recall Curve (AUC der PR-Kurve)? BEARBEITEN: Hier ist ein Kommentar zum Unterschied zwischen PR AUC und AP. Die AUC wird durch trapezförmige Interpolation der Präzision erhalten. Eine alternative und in der Regel fast äquivalente Metrik ist die...

scikit-learn precision-recall auc average-precision

27

Wann kann Korrelation ohne Ursache nützlich sein?

Ein Lieblingsspruch vieler Statistiker lautet: "Korrelation impliziert keine Kausalität." Dies ist sicherlich wahr, aber eine Sache, die hier impliziert zu sein scheint, ist, dass Korrelation wenig oder keinen Wert hat. Ist das wahr? Ist es sinnlos zu wissen, dass zwei Variablen miteinander...

correlation predictive-models causality

27

predict () -Funktion für ältere Mixed-Effects-Modelle

Das Problem: Ich habe in anderen Posts gelesen , predictdie für lmerModelle mit gemischten Effekten {lme4} in [R] nicht verfügbar sind . Ich habe versucht, dieses Thema mit einem Spielzeugdatensatz zu untersuchen ... Hintergrund: Der Datensatz ist aus dieser Quelle angepasst und als ......

r mixed-model lme4-nlme

27

Warum entspricht die Lasso-Strafe der doppelten Exponentialzahl (Laplace) vor?

Ich habe in einer Reihe von Referenzen gelesen, dass die Lasso-Schätzung für den Regressionsparametervektor dem posterioren Modus von in dem die vorherige Verteilung für jedes eine doppelte Exponentialverteilung ist (auch als Laplace-Verteilung bekannt).BBBBBBBiBiB_i Ich habe versucht, dies zu...

regression bayesian lasso prior regularization

27

Warum führen kleinere Gewichte zu einfacheren Regularisierungsmodellen?

Ich habe Andrew Ngs Maschinelles Lernen-Kurs vor ungefähr einem Jahr abgeschlossen und schreibe jetzt meine High-School-Mathematikerkunde über die Funktionsweise der logistischen Regression und Techniken zur Leistungsoptimierung. Eine dieser Techniken ist natürlich die Regularisierung. Ziel der...

regression machine-learning optimization regularization overfitting

27

Wann ist es angebracht, eine falsche Bewertungsregel anzuwenden?

Merkle & Steyvers (2013) schreiben: Um eine korrekte Bewertungsregel formal zu definieren, sei eine probabilistische Vorhersage eines Bernoulli-Versuchs mit echter Erfolgswahrscheinlichkeit . Richtige Bewertungsregeln sind Metriken, deren erwartete Werte minimiert werden, wenn .fffdddpppf=...

classification forecasting scoring-rules

27

Kann sich ein tiefes neuronales Netzwerk der Multiplikationsfunktion ohne Normalisierung annähern?

Nehmen wir an, wir möchten eine Regression für einfache f = x * yVerwendung eines standardmäßigen tiefen neuronalen Netzwerks durchführen. Ich erinnere mich, dass es Forschungsergebnisse gibt, die besagen, dass NN mit einer Hiden-Schicht jede Funktion approximieren kann, aber ich habe es versucht...

regression machine-learning neural-networks deep-learning

27

Was sind die Auswirkungen der Auswahl verschiedener Verlustfunktionen bei der Klassifizierung auf einen ungefähren Verlust von 0 bis 1?

Wir wissen, dass einige objektive Funktionen einfacher zu optimieren sind und andere schwierig. Und es gibt viele Verlustfunktionen, die wir verwenden möchten, die aber schwer zu verwenden sind, zum Beispiel 0-1-Verlust. Wir finden also einige Proxy- Verlust-Funktionen, um die Arbeit zu erledigen....

machine-learning classification optimization loss-functions