Beim Studium der Data Mining-Methoden habe ich festgestellt, dass es zwei Hauptkategorien gibt:
Vorhersagemethoden:
- Einstufung
- Regression
Beschreibende Methoden:
- Clustering
- Assoziationsregeln
Da ich die Benutzerverfügbarkeit (Ausgabe) basierend auf Standort, Aktivität, Batteriestand (Eingabe für das Trainingsmodell) vorhersagen möchte, denke ich, dass es offensichtlich ist, dass ich "Vorhersagemethoden" wählen würde, aber jetzt kann ich scheinbar nicht zwischen wählen Klassifikation und Regression. Nach meinem bisherigen Verständnis kann die Klassifizierung mein Problem lösen, da die Ausgabe "verfügbar" oder "nicht verfügbar" ist.
Kann mir die Klassifizierung die Wahrscheinlichkeit (oder Wahrscheinlichkeit) geben, dass der Benutzer verfügbar oder nicht verfügbar ist?
Wie in der Ausgabe wäre nicht nur 0 (nicht verfügbar) oder 1 (für verfügbar), sondern es ist so etwas wie:
- verfügbar
- nicht verfügbar
Kann dieses Problem auch durch Regression gelöst werden?
Sie können die naive Bayes-Klassifizierung verwenden und die posterioren Wahrscheinlichkeiten unter Verwendung vorheriger Überzeugungen berechnen, oder die logistische Regression kann mit der Sigmoid-Funktion verwendet werden.
quelle