Im Kontext der KI:
Die Suche bezieht sich auf den allgemeinen Problemlöser von Simon & Newell und enthält viele (viele) Nachkommenalgorithmen. Diese Algorithmen haben folgende Form:
ein. Stellen Sie einen aktuellen Zustand eines Teils der Welt als Scheitelpunkt in einem Diagramm dar.
b. Stellen Sie, durch Kanten mit dem aktuellen Zustand verbunden, alle Zustände der Welt dar, die vom aktuellen Zustand aus durch Ändern der Welt mit einer einzigen Aktion erreicht werden können, und stellen Sie alle nachfolgenden Zustände auf dieselbe Weise dar.
c. Finden Sie algorithmisch eine Folge von Aktionen, die von einem aktuellen Zustand zu einem gewünschten Zielzustand führen, indem Sie in diesem Diagramm herumlaufen.
Ein Beispiel für eine Anwendung, die die Suche verwendet, ist Google Maps. Ein weiterer Grund ist Google Flights.
Lernen bezieht sich auf jeden Algorithmus, der einen Glauben an die Welt verfeinert, indem er Erfahrungen oder Beispielen der Erfahrungen anderer ausgesetzt wird. Lernalgorithmen haben keine eindeutigen Eltern, da sie in vielen verschiedenen Teilbereichen oder Disziplinen separat entwickelt wurden. Eine vernünftige Taxonomie ist das 5-Stämme- Modell. Einige Lernalgorithmen verwenden tatsächlich die Suche in sich selbst, um herauszufinden, wie sie ihre Überzeugungen als Reaktion auf neue Erfahrungen ändern können!
Ein Beispiel für einen heute verwendeten Lernalgorithmus ist das Q-Learning , das Teil der allgemeineren Familie von Verstärkungslernalgorithmen ist. Q-Learning funktioniert folgendermaßen:
ein. Das Lernprogramm (normalerweise als Agent bezeichnet ) erhält eine Darstellung des aktuellen Zustands der Welt und eine Liste der Aktionen, die es ausführen kann.
Q ( s , a )eins
Q ( s , a)ϵ
d. Die Aktion des Agenten bewirkt, dass sich die Welt verändert, und kann dazu führen, dass der Agent eine Belohnung von der Umgebung erhält. Der Agent notiert, ob er eine Belohnung erhalten hat (und wie hoch die Belohnung war) und wie der neue Zustand der Welt ist. Anschließend passt es seinen Glauben an die Qualität der Ausführung der Aktion in dem Zustand an, in dem es sich früher befand, so dass sein Glaube an die Qualität dieser Aktion näher an der Realität der Belohnung und an der Qualität des Ortes liegt, an dem sie durchgeführt wurde endete.
e. Der Agent wiederholt die Schritte bd für immer. Mit der Zeit werden seine Überzeugungen über die Qualität verschiedener Zustands- / Aktionspaare konvergieren, um der Realität immer näher zu kommen.
Ein Beispiel für eine Anwendung, die Lernen verwendet, sind AI.SEs Empfehlungen, die von einem Programm erstellt werden, das wahrscheinlich die Beziehungen zwischen verschiedenen Wortkombinationen in Paaren von Beiträgen und die Wahrscheinlichkeit analysiert, dass jemand darauf klickt. Jedes Mal, wenn jemand auf sie klickt, erfährt er, ob es eine gute Idee ist, einen Beitrag als verwandt aufzulisten oder nicht. Der Feed von Facebook ist ein weiteres alltägliches Beispiel.