Als «deep-learning» getaggte Fragen

14

Vorteile des Stapelns von LSTMs?

Ich frage mich, in welchen Situationen es vorteilhaft ist, LSTMs zu

14

PyTorch vs. Tensorflow eifrig

Google hat kürzlich in tensorflow's Nightly Builds den Eager- Modus aufgenommen, eine unverzichtbare API für den Zugriff auf Tensorflow-Berechnungsfunktionen. Wie kann Tensorflow eifrig mit PyTorch verglichen werden? Einige Aspekte, die den Vergleich beeinflussen könnten, könnten sein: Vor- und...

deep-learning tensorflow pytorch

14

Gibt es eine Personenklasse in ImageNet? Gibt es irgendwelche Klassen, die sich auf Menschen beziehen?

Wenn ich mir eine der vielen Quellen für die Imagenet-Klassen im Internet anschaue, kann ich keine einzige Klasse finden, die sich auf Menschen bezieht (und nein, Harvestman ist nicht jemand, der erntet, aber ich wusste, dass es eine Art von Papa-Langbein ist Spinne :-). Wie ist das möglich? Ich...

machine-learning deep-learning dataset convnet image-classification

14

Wie verwende ich LeakyRelu als Aktivierungsfunktion in der Sequenz DNN in Keras? Wenn es besser funktioniert als Relu?

Wie verwendet man LeakyRelu als Aktivierungsfunktion in der Sequenz DNN in Keras? Wenn ich etwas Ähnliches schreiben möchte wie: model = Sequential() model.add(Dense(90, activation='LeakyRelu')) Was ist die Lösung? Setzen Sie LeakyRelu ähnlich wie Relu? Die zweite Frage lautet: Was ist die beste...

deep-learning keras activation-function

13

Visualisierung des Deep Neural Network Trainings

Ich versuche, ein Äquivalent zu Hinton-Diagrammen für mehrschichtige Netzwerke zu finden, um die Gewichte während des Trainings zu zeichnen. Das trainierte Netzwerk ähnelt in gewisser Weise einem Deep SRN, dh es hat eine hohe Anzahl von Mehrfachgewichtungsmatrizen, was die gleichzeitige Darstellung...

machine-learning neural-network visualization deep-learning

13

Wie unterscheiden sich Deep-Learning-NNs jetzt (2016) von denen, die ich vor 4 Jahren (2012) studiert habe?

In Wikipedia und deeplearning4j heißt es, dass Deep-Learning-NN (DLNN) NN sind, die> 1 verborgene Schicht haben. Diese Art von NN war für mich an der Universität Standard, während DLNN derzeit sehr hochgespielt sind. War schon da, hab das gemacht - was ist die große Sache? Ich habe auch gehört,...

neural-network deep-learning

13

Was ist eine 1D Convolutional Layer im Deep Learning?

Ich verstehe die Rolle und den Mechanismus von Faltungsebenen in Deep Learning für die Bildverarbeitung bei 2D- oder 3D-Implementierungen allgemein - sie versuchen "einfach", 2D-Muster in Bildern zu erfassen (bei 3D in 3 Kanälen). Aber kürzlich bin ich im Kontext der Verarbeitung natürlicher...

deep-learning nlp convolution

13

Warum verwenden Convolutions immer ungerade Zahlen als filter_size?

Betrachten wir 90-99% der Veröffentlichungen über ein CNN (ConvNet). Die überwiegende Mehrheit von ihnen verwendet Filtergrößen mit ungeraden Zahlen : {1, 3, 5, 7} für die am häufigsten verwendeten. Diese Situation kann zu einem Problem führen: Bei diesen Filtergrößen ist die Faltungsoperation...

deep-learning convnet computer-vision convolution

13

Ist Gradient Descent für jeden Optimierer von zentraler Bedeutung?

Ich möchte wissen, ob Gradient Descent der Hauptalgorithmus ist, der in Optimierern wie Adam, Adagrad, RMSProp und mehreren anderen Optimierern verwendet wird.

machine-learning neural-network deep-learning optimization gradient-descent

12

Deep Learning für Nicht-Image-Nicht-NLP-Aufgaben?

Bisher gibt es viele interessante Anwendungen für tiefes Lernen in der Bildverarbeitung oder der Verarbeitung natürlicher Sprache. Wie ist es in anderen traditionelleren Bereichen? Zum Beispiel habe ich traditionelle soziodemografische Variablen sowie möglicherweise viele Labormessungen und möchte...

deep-learning

12

Vorhersageintervall um die LSTM-Zeitreihenprognose

Gibt es eine Methode zur Berechnung des Vorhersageintervalls (Wahrscheinlichkeitsverteilung) um eine Zeitreihenprognose aus einem LSTM-Netzwerk (oder einem anderen wiederkehrenden neuronalen Netzwerk)? Angenommen, ich prognostiziere 10 Stichproben für die Zukunft (t + 1 bis t + 10), basierend auf...

machine-learning deep-learning time-series prediction lstm

12

Was ist eine heiße Kodierung im Tensorflow?

Ich mache gerade einen Kurs in Tensorflow, in dem sie tf.one_hot (Indizes, Tiefe) verwendeten. Jetzt verstehe ich nicht, wie sich diese Indizes in diese Binärsequenz verwandeln. Kann mir bitte jemand den genauen Ablauf erklären

machine-learning python neural-network deep-learning tensorflow

12

Deep Learning mit Spektrogrammen zur Schallerkennung

Ich habe die Möglichkeit untersucht, Geräusche (zum Beispiel Tiergeräusche) mithilfe von Spektrogrammen zu klassifizieren. Die Idee ist, ein tiefes Faltungs-Neuronales Netz zu verwenden, um Segmente im Spektrogramm zu erkennen und eine (oder mehrere) Klassenbezeichnungen auszugeben. Dies ist keine...

deep-learning multilabel-classification audio-recognition

12

Wie viele LSTM-Zellen soll ich verwenden?

Gibt es Faustregeln (oder tatsächliche Regeln) für die minimale, maximale und "angemessene" Anzahl von LSTM-Zellen, die ich verwenden sollte? Insbesondere beziehe ich mich auf BasicLSTMCell von TensorFlow und num_unitsEigenschaft. Bitte nehmen Sie an, dass ich ein Klassifizierungsproblem habe, das...

rnn machine-learning r predictive-modeling random-forest python language-model sentiment-analysis encoding machine-learning deep-learning neural-network dataset caffe classification xgboost multiclass-classification unbalanced-classes time-series descriptive-statistics python r clustering machine-learning python deep-learning tensorflow machine-learning python predictive-modeling probability scikit-learn svm machine-learning python classification gradient-descent regression research python neural-network deep-learning convnet keras python tensorflow machine-learning deep-learning tensorflow python r bigdata visualization rstudio pandas pyspark dataset time-series multilabel-classification machine-learning neural-network ensemble-modeling kaggle machine-learning linear-regression cnn convnet machine-learning tensorflow association-rules machine-learning predictive-modeling training model-selection neural-network keras deep-learning deep-learning convnet image-classification predictive-modeling prediction machine-learning python classification predictive-modeling scikit-learn machine-learning python random-forest sampling training recommender-system books python neural-network nlp deep-learning tensorflow python matlab information-retrieval search search-engine deep-learning convnet keras machine-learning python cross-validation sampling machine-learning

12

Validierungsverlust und Genauigkeit bleiben konstant

Ich versuche, dieses Papier auf einer Reihe von medizinischen Bildern umzusetzen . Ich mache es in Keras. Das Netzwerk besteht im Wesentlichen aus 4 Conv- und Max-Pool-Schichten, gefolgt von einer vollständig verbundenen Schicht und einem Soft-Max-Klassifikator. Soweit ich weiß, bin ich der in der...

machine-learning python deep-learning keras

12

Aktualisieren der Gewichte der Filter in einem CNN

Ich versuche gerade, die Architektur eines CNN zu verstehen. Ich verstehe die Faltung, die ReLU-Schicht, die Pooling-Schicht und die vollständig verbundene Schicht. Ich bin jedoch immer noch verwirrt über die Gewichte. In einem normalen neuronalen Netzwerk hat jedes Neuron sein eigenes Gewicht. In...

machine-learning neural-network deep-learning image-classification cnn

12

Gibt es eine Möglichkeit, die vom Early Stopping-Rückruf in Keras verwendete Metrik zu ändern?

Bei Verwendung des Rückrufs zum frühen Stoppen in Keras wird das Training beendet, wenn eine Metrik (normalerweise Validierungsverlust) nicht zunimmt. Gibt es eine Möglichkeit, eine andere Metrik (wie Präzision, Rückruf, f-Maß) anstelle des Validierungsverlusts zu verwenden? Alle Beispiele, die ich...

machine-learning neural-network deep-learning keras

12

Warum verbessert das Hinzufügen einer Dropout-Ebene die Tiefen- / Maschinenlernleistung, da durch das Dropout einige Neuronen aus dem Modell unterdrückt werden?

Wenn das Entfernen einiger Neuronen zu einem leistungsfähigeren Modell führt, warum nicht zunächst ein einfacheres neuronales Netzwerk mit weniger Schichten und weniger Neuronen verwenden? Warum am Anfang ein größeres, komplizierteres Modell bauen und Teile davon später

machine-learning deep-learning keras regularization dropout

12

Multi-Task-Learning in Keras

Ich versuche, gemeinsam genutzte Ebenen in Keras zu implementieren. Ich sehe, dass Keras hat keras.layers.concatenate, aber ich bin nicht sicher, Dokumentation über seine Verwendung. Kann ich damit mehrere gemeinsame Ebenen erstellen? Was wäre der beste Weg, um ein einfaches, gemeinsam genutztes...

machine-learning neural-network deep-learning keras multitask-learning

12

Warum sollte die Initialisierung von Gewichten und Bias bei 0 gewählt werden?

Ich lese das: Um unser neuronales Netzwerk zu trainieren, werden wir jeden Parameter W (l) ijWij (l) und jeden b (l) ibi (l) auf einen kleinen Zufallswert nahe Null initialisieren (sagen wir gemäß einem Normalen (0, ϵ2) Normalen (0)) , ϵ2) Verteilung für einige kleine ϵϵ, sagen wir 0,01) von...

deep-learning stanford-nlp randomized-algorithms