Das stochastische Bergsteigen ist im Allgemeinen schlechter als das steilste Bergsteigen , aber in welchen Fällen ist das erstere
Das stochastische Bergsteigen ist im Allgemeinen schlechter als das steilste Bergsteigen , aber in welchen Fällen ist das erstere
Nach meinem besten Verständnis ist der Monte-Carlo-Baumsuchalgorithmus (MCTS) eine Alternative zum Minimax für die Suche in einem Knotenbaum. Es funktioniert, indem Sie einen Zug auswählen (im Allgemeinen den mit der höchsten Chance, der Beste zu sein) und dann während des Zuges ein zufälliges...
Was sind die Einschränkungen des Hill Climbing-Algorithmus ? Wie können wir diese Einschränkungen
Über den YouTube-Kanal von Two Minute Papers stieß ich auf einen Artikel, The Bitter Truth . Rich Sutton sagt ... Eine Sache, die aus der bitteren Lektion gelernt werden sollte, ist die große Kraft von Allzweckmethoden, von Methoden, die mit zunehmender Berechnung weiter skalieren, selbst wenn die...
Deep Mind hat in den letzten Jahren viele Arbeiten zum Thema Deep Learning veröffentlicht, von denen die meisten auf dem neuesten Stand der Technik für ihre jeweiligen Aufgaben sind. Aber wie viel von dieser Arbeit wurde tatsächlich von der KI-Community reproduziert? Zum Beispiel scheint das Papier...
Was ist die fortschrittlichste KI-Software, die Menschen bisher entwickelt haben, und was macht
Ich habe lokale Suchalgorithmen wie gieriges Bergsteigen, stochastisches Bergsteigen, simuliertes Tempern usw. untersucht. Ich habe festgestellt, dass die meisten dieser Methoden im Vergleich zu systematischen Suchtechniken nur sehr wenig Speicherplatz beanspruchen. Gibt es lokale Suchalgorithmen,...
Ich habe kürzlich gelesen, dass Google eine neue KI entwickelt hat, auf die jeder Daten hochladen kann, und die sofort Modelle generiert, dh ein Bilderkennungsmodell, das auf diesen Daten basiert. Kann mir jemand detailliert und intuitiv erklären, wie diese KI
Eine Heuristik ist zulässig, wenn sie die tatsächlichen Kosten für das Erreichen des Zielknotens niemals überschätztnnn. Wenn eine Heuristik konsistent ist , dann ist der heuristische Wert vonnnn ist nie höher als die Kosten seines Nachfolgers, n′n′n'plus den heuristischen Wert des Nachfolgers....
Die meisten Einführungen in den Bereich MDPs und Reinforcement-Lernen konzentrieren sich ausschließlich auf Bereiche, in denen Raum- und Aktionsvariablen Ganzzahlen (und endlich) sind. Auf diese Weise werden wir schnell in Value Iteration, Q-Learning und dergleichen eingeführt. Die interessantesten...