Warum sollte eine Aktivierungsfunktion eines neuronalen Netzwerks differenzierbar sein? Ist es unbedingt notwendig oder nur
Warum sollte eine Aktivierungsfunktion eines neuronalen Netzwerks differenzierbar sein? Ist es unbedingt notwendig oder nur
Seit ich auf Adam Geitgeys Blog über maschinelles Lernen gestoßen bin, habe ich versucht, neuronale Netze zu verstehen . Ich habe so viel wie möglich zu diesem Thema gelesen (was ich verstehen kann) und glaube, ich verstehe alle allgemeinen Konzepte und einige der Funktionen (obwohl sie in...
Ich habe gelesen, dass tiefe neuronale Netze relativ leicht getäuscht werden können ( Link ), um ein hohes Vertrauen in die Erkennung von synthetischen / künstlichen Bildern zu geben, die vollständig (oder zumindest größtenteils) außerhalb des Vertrauenssubjekts liegen. Persönlich sehe ich kein...
Wie mächtig ist die Maschine, die kürzlich den Pokerspieler-Champion geschlagen
Ich würde gerne mit der neuronalen Netzentwicklung (NEAT) experimentieren. Ich habe in den 90er Jahren GA- und neuronalen Netzcode in C ++ geschrieben, um damit herumzuspielen, aber der DIY-Ansatz erwies sich als arbeitsintensiv genug, dass ich ihn schließlich fallen ließ. Die Dinge haben sich...
Mehrere Ressourcen, auf die ich Bezug genommen habe, erwähnen, dass MSE großartig ist, weil es konvex ist. Aber ich verstehe nicht wie, besonders im Zusammenhang mit neuronalen Netzen. Nehmen wir an, wir haben Folgendes: X.XX : Trainingsdatensatz Y.YY : Ziele ΘΘ\Theta : der Parametersatz des...
Ich schreibe gerade eine Engine, um ein Kartenspiel zu spielen, da es für dieses spezielle Spiel noch keine Engine gibt. Ich hoffe, dass ich danach ein neuronales Netz in das Spiel einführen und lernen kann, das Spiel zu spielen. Ich schreibe die Engine so, dass sie für einen KI-Spieler hilfreich...
Welche Vorteile können wir durch die Anwendung von Graph Convolutional Neural Network anstelle von gewöhnlichem CNN erzielen? Ich meine, wenn wir ein Problem durch CNN lösen können, was ist der Grund, warum wir auf Graph Convolutional Neural Network umstellen sollten, um es zu lösen? Gibt es...
Ich las Hintons neues Papier "Dynamisches Routing zwischen Kapseln" und verstand den Begriff "Aktivitätsvektor" in der Zusammenfassung nicht. Eine Kapsel ist eine Gruppe von Neuronen, deren Aktivitätsvektor die Instanziierungsparameter eines bestimmten Entitätstyps wie eines Objekts oder eines...
Ist es möglich, eine Faustregel für die Größe neuronaler Netze abzugeben, die auf gängigen GPUs für Endverbraucher trainiert werden können ? Zum Beispiel: Das Papier Emergence of Locomotion (Reinforcement) trainiert ein Netzwerk unter Verwendung der Tanh-Aktivierung der Neuronen. Sie haben eine...
Derzeit mache ich ein Projekt, bei dem es darum geht, eine KI zu erstellen, um das Spiel Gomoku zu spielen (es ist wie Tic Tac Toe, wird aber auf einem 15 * 15-Brett gespielt und erfordert 5 in einer Reihe, um zu gewinnen). Ich habe bereits erfolgreich eine perfekte Tic Tac Toe-KI implementiert,...
In einem CNN ist das Empfangsfeld der Teil des Bildes, der zur Berechnung der Filterausgabe verwendet wird. Die Ausgabe eines Filters (die auch als "Feature Map" bezeichnet wird) ist jedoch die Eingabe des nächsten Filters. Was ist der Unterschied zwischen einem Empfangsfeld und einer...
Was bedeutet "Backprop"? Ist der Begriff "backprop" im Grunde der gleiche wie "backpropagation" oder hat er eine andere
Nachdem ich ungefähr ein halbes Jahr lang mit neuronalen Netzen gearbeitet habe, habe ich aus erster Hand erfahren, was oft als ihre Hauptnachteile bezeichnet wird, dh Überanpassung und Festhalten an lokalen Minima. Durch Hyperparameteroptimierung und einige neu erfundene Ansätze wurden diese...
Es scheint ziemlich unumstritten zu sein, zu sagen, dass NN-basierte Ansätze in vielen KI-Bereichen zu ziemlich leistungsfähigen Werkzeugen werden - sei es das Erkennen und Zerlegen von Bildern (Gesichter an einer Grenze, Straßenszenen in Automobilen, Entscheidungsfindung in unsicheren / komplexen...
Das Finden geeigneter Hyperparameter für ein neuronales Netzwerk ist offensichtlich eine komplexe Aufgabe und ein Problem oder domänenspezifisch. Es sollte jedoch mindestens einige "Regeln" geben, die für die Größe des Filters (oder Kernels) meistens gelten! In den meisten Fällen sollte die...
Einige Artikel sagen, dass BLEU keine geeignete Bewertungsmethode für Chatbot ist, stattdessen verwenden sie Ratlosigkeit, um Chatbot zu schätzen. Was ist Ratlosigkeit? Wie berechnet man das? Und warum ist Ratlosigkeit eine gute Bewertungsmetrik für
Gibt es neuronale Netze, die entscheiden können, Neuronen hinzuzufügen / zu löschen (oder die Neuronenmodelle / Aktivierungsfunktionen zu ändern oder die zugewiesene Bedeutung für Neuronen zu ändern), Verknüpfungen oder sogar vollständige Schichten während der Ausführungszeit? Ich vermute, dass...
Kurz gesagt: Ich möchte verstehen, warum ein neuronales Netzwerk mit einer verborgenen Schicht zuverlässiger auf ein gutes Minimum konvergiert, wenn eine größere Anzahl versteckter Neuronen verwendet wird. Nachfolgend eine detailliertere Erklärung meines Experiments: Ich arbeite an einem einfachen...
Ich bin so ziemlich ein Anfänger in Tensorflow und folge einfach einem Tutorial. Es gibt kein Problem mit meinem Code, aber ich habe eine Frage bezüglich der Ausgabe accuracy: 0.95614034 accuracy_baseline: 0.6666666 auc: 0.97714674 auc_precision_recall: 0.97176754 average_loss: 0.23083039...