Data Science

10
Wie man nach toten Relu-Neuronen sucht

Hintergrund: Beim Anpassen neuronaler Netze mit Relu-Aktivierung stellte ich fest, dass die Vorhersage manchmal nahezu konstant wird. Ich glaube, dass dies daran liegt, dass die Relu-Neuronen während des Trainings sterben, wie hier angegeben. ( Was ist das "sterbende ReLU" -Problem in neuronalen...

10
Was ist die Feature-Matrix in word2vec?

Ich bin ein Anfänger in neuronalen Netzen und erforsche derzeit das word2vec-Modell. Es fällt mir jedoch schwer zu verstehen, was die Feature-Matrix genau ist. Ich kann verstehen, dass die erste Matrix ein One-Hot-Codierungsvektor für ein bestimmtes Wort ist, aber was bedeutet die zweite Matrix?...

10
Beziehung zwischen Faltung in Mathematik und CNN

Ich habe die Erklärung der Faltung gelesen und verstehe sie bis zu einem gewissen Grad. Kann mir jemand helfen zu verstehen, wie diese Operation mit der Faltung in Faltungs-Neuronalen Netzen zusammenhängt? Ist eine filterähnliche Funktion, gdie Gewicht

10
Sortieren Sie Zahlen mit nur 2 versteckten Ebenen

Ich lese das Eckpfeiler Sequence to Sequence Learning mit neuronalen Netzen von Ilya Sutskever und Quoc Le. Auf der ersten Seite wird kurz erwähnt, dass: A surprising example of the power of DNNs is their ability to sort N N-bit numbers using only 2 hidden layers of quadratic size Kann jemand kurz...

10
Ist der nächste Nachbar mit t-SNE sinnvoll?

Die Antworten hier haben festgestellt, dass die Dimensionen in t-SNE bedeutungslos sind und dass die Abstände zwischen Punkten kein Maß für die Ähnlichkeit sind . Können wir jedoch etwas über einen Punkt sagen, der auf seinen nächsten Nachbarn im t-SNE-Raum basiert? Diese Antwort darauf , warum...

10
Anzahl und Größe der dichten Schichten in einem CNN

Die meisten Netzwerke, die ich gesehen habe, haben eine oder zwei dichte Schichten vor der endgültigen Softmax-Schicht. Gibt es eine prinzipielle Möglichkeit, die Anzahl und Größe der dichten Schichten zu wählen? Sind zwei dichte Schichten bei gleicher Anzahl von Parametern repräsentativer als...

10
Können GPS-Koordinaten (Längen- und Breitengrad) als Merkmale in einem linearen Modell verwendet werden?

Ich habe Datensätze, die unter anderem GPS-Koordinaten (Längen- und Breitengrad) enthalten. Ich möchte diese Datensätze verwenden, um Probleme zu untersuchen wie: (1) Berechnen der ETA, um zwischen Start- und Endpunkten zu fahren; und (2) Schätzen des Ausmaßes der Kriminalität für einen bestimmten...

10
Warum L1-Regularisierung über L2 verwenden?

ich ein lineares Regressionsmodell mit einer Verlustfunktion durchführe, warum sollte ich anstelle der Regularisierung verwenden?L.1L.1L_1L.2L.2L_2 Ist es besser, eine Überanpassung zu verhindern? Ist es deterministisch (also immer eine einzigartige Lösung)? Ist es besser bei der Auswahl von...