Statistiken und Big Data

9
Was zeigt eine keilartige Form des PCA-Diagramms an?

In ihrer Arbeit über Autoencoder für die Textklassifizierung demonstrierten Hinton und Salakhutdinov die Darstellung der zweidimensionalen LSA (die eng mit PCA verwandt ist) : . Durch Anwenden von PCA auf absolut unterschiedliche, leicht hochdimensionale Daten erhielt ich ein ähnlich aussehendes...

9
Sind Baumschätzer IMMER voreingenommen?

Ich mache Hausaufgaben zu Entscheidungsbäumen und eine der Fragen, die ich beantworten muss, lautet: "Warum sind Schätzer aus voreingenommenen Bäumen aufgebaut und wie hilft das Absacken, ihre Varianz zu verringern?". Jetzt weiß ich, dass überangepasste Modelle tendenziell eine sehr geringe...

9
Intuitive Erklärung von Logloss

In mehreren Kaggle-Wettbewerben basierte die Wertung auf "logloss". Dies bezieht sich auf einen Klassifizierungsfehler. Hier ist eine technische Antwort, aber ich suche nach einer intuitiven Antwort. Die Antworten auf diese Frage zur Mahalanobis-Entfernung haben mir sehr gut gefallen , aber PCA ist...

9
Power of Lady Verkostung Tee Experiment

In dem bekannten Experiment Fisher die beobachtbare ist die Anzahl der korrigierten erraten cup mit zwei Arten von Cup A und B . Normalerweise ist es interessant, den kritischen Bereich zu berechnen, um die Nullhypothese (die Dame schätzt zufällig) angesichts der Größe des Tests α abzulehnen . Dies...

9
Was ist der Unterschied zwischen

Angenommen , ich habe eine Stichprobe .{ xn, yn}}N.n = 1{xn,yn}}n=1N.\lbrace x_n ,y_n \rbrace_{n=1}^N Angenommen,yn= β0+ β1xn+ εnyn=β0+β1xn+εny_n = \beta_0 + \beta_1 x_n + \varepsilon_n undy^n= β^0+ β^1xny^n=β^0+β^1xn\hat{y}_n = \hat{\beta}_0 +\hat{\beta}_1 x_n Was ist der Unterschied zwischen und...