Data Science

12
Wie berechnet man die VC-Dimension?

Ich studiere maschinelles Lernen und möchte wissen, wie man die VC-Dimension berechnet. Zum Beispiel: h ( x ) = { 10wenn  a≤x≤bsonst h(x)={1if a≤x≤b0else h(x)=\begin{cases} 1 &\mbox{if } a\leq x \leq b \\ 0 & \mbox{else } \end{cases} ( a , b ) ∈ R 2 mit den Parametern .( a , b ) ∈ R.2(a,b)∈R2(a,b)...

12
Wie viele LSTM-Zellen soll ich verwenden?

Gibt es Faustregeln (oder tatsächliche Regeln) für die minimale, maximale und "angemessene" Anzahl von LSTM-Zellen, die ich verwenden sollte? Insbesondere beziehe ich mich auf BasicLSTMCell von TensorFlow und num_unitsEigenschaft. Bitte nehmen Sie an, dass ich ein Klassifizierungsproblem habe, das...

12
Deep Learning für Nicht-Image-Nicht-NLP-Aufgaben?

Bisher gibt es viele interessante Anwendungen für tiefes Lernen in der Bildverarbeitung oder der Verarbeitung natürlicher Sprache. Wie ist es in anderen traditionelleren Bereichen? Zum Beispiel habe ich traditionelle soziodemografische Variablen sowie möglicherweise viele Labormessungen und möchte...

12
Wie sollte der Bias initialisiert und reguliert werden?

Ich habe ein paar Artikel über die Kernel-Initialisierung gelesen und in vielen Artikeln wird erwähnt, dass sie die L2-Regularisierung des Kernels verwenden (oft mitλ=0.0001λ=0.0001\lambda = 0.0001 ). Tut irgendjemand etwas anderes, als die Verzerrung mit konstanter Null zu initialisieren und sie...

12
Merkmalsbedeutung mit kategorialen Merkmalen mit hoher Kardinalität für die Regression (numerisch abhängige Variable)

Ich habe versucht, Feature-Wichtigkeiten aus zufälligen Wäldern zu verwenden, um eine empirische Feature-Auswahl für ein Regressionsproblem durchzuführen, bei dem alle Features kategorisch sind und viele von ihnen viele Ebenen haben (in der Größenordnung von 100-1000). Da bei der One-Hot-Codierung...

12
Woher wissen Sie, dass das Modell überpasst hat?

Ich hoffe, die folgenden Auszüge geben einen Einblick in meine Frage. Diese stammen von http://neuralnetworksanddeeplearning.com/chap3.html Das Lernen verlangsamt sich dann allmählich. Schließlich hört die Klassifizierungsgenauigkeit gegen Epoche 280 so gut wie auf, sich zu verbessern. In späteren...

12
Ist Excel ausreichend für Data Science?

Ich bereite mich gerade auf einen Einführungskurs in die Datenwissenschaft mit der Programmiersprache R vor. Mein Publikum besteht aus Studenten mit Schwerpunkt Wirtschaft. Ein typischer Business-Student hat keine Computer-Programmiererfahrung, hat jedoch einige Kurse belegt, die Excel verwenden....

12
Was ist Grafikeinbettung?

Ich bin kürzlich auf das Einbetten von Graphen wie DeepWalk und LINE gestoßen. Ich habe jedoch immer noch keine klare Vorstellung davon, was unter Grafikeinbettungen zu verstehen ist und wann sie zu verwenden sind (Anwendungen). Anregungen sind

12
Was ist der Haken bei LSTM?

Ich erweitere mein Wissen über das Keras-Paket und habe mit einigen der verfügbaren Modelle gearbeitet. Ich habe ein NLP-Binärklassifizierungsproblem, das ich zu lösen versuche, und wende verschiedene Modelle an. Nachdem ich mit einigen Ergebnissen gearbeitet und mehr und mehr über LSTM gelesen...