Sie verwechseln Äpfel mit Orangen. Das ist in Ordnung, denn beide sind köstlich.
Bei der Schätzung der maximalen Wahrscheinlichkeit geht es darum, was Sie minimieren. Beim Gradientenabstieg geht es darum, wie Sie es minimieren.
Warum nicht MLE für lineare Regression?
Tatsächlich lineare Regression wird mit Maximum - Likelihood - Schätzung gelöst. Die Standardmethode "Minimieren der Summe der quadratischen Fehler" ist genau mathematisch äquivalent zur Schätzung der maximalen Wahrscheinlichkeit unter Verwendung einer bedingten Normalverteilung.
Warum nicht Gradientenabstieg für logistische Regression?
Sie können die logistische Regression vollständig lösen, indem Sie die Wahrscheinlichkeitsfunktion mithilfe des Gradientenabfalls minimieren . Tatsächlich ist es eine großartige Übung, und ich würde jedem empfehlen, sie mindestens einmal zu machen.
Gradientenabstieg ist jedoch nicht die Standardmethode. Dieser Preis geht an die iterativ neu gewichtete Methode der kleinsten Quadrate / Newtonschen Methode , die eine Verbesserung des Gradientenabfalls darstellt und auch die zweite Ableitung berücksichtigt. Diese Methode hat einfach viel bessere Eigenschaften als der Gradientenabstieg, ist jedoch schwieriger zu verstehen und zu implementieren.