Python-Pakete für die Arbeit mit Gaußschen Mischungsmodellen (GMMs)

12

Für die Arbeit mit GMMs (Gaussian Mixture Models) in Python stehen anscheinend mehrere Optionen zur Verfügung. Auf den ersten Blick gibt es zumindest:

... und vielleicht auch andere. Sie scheinen alle die grundlegendsten Bedürfnisse für GMMs zu erfüllen, einschließlich Erstellung und Probenahme, Parameterschätzung, Clustering usw.

Was ist der Unterschied zwischen ihnen und wie sollte man herausfinden, welche für ein bestimmtes Bedürfnis am besten geeignet ist?

Ref: http://www.scipy.org/Topical_Software

Ein Mann
quelle
Sie können versuchen, mit GMMs eine wirklich einfache Version der Bildkomprimierung zu erstellen. Verwenden Sie bei einem bestimmten Bild ein GMM, um den Pixeln unterschiedliche Wahrscheinlichkeiten zuzuweisen, und erstellen Sie dann das Bild neu, indem Sie die Wahrscheinlichkeiten als Indizes für den bestimmten Gaußschen Wert verwenden, von dem ein bestimmtes Pixel am wahrscheinlichsten stammte.
Phillip Cloud
@cpcloud - Wollen Sie damit sagen: Richten Sie zu Vergleichszwecken ein vereinfachtes Experiment ein, das in jedem dieser Pakete ausgeführt werden soll? Okay, aber das ist kein geringer Aufwand. Ich hoffe auf ein paar Beiträge von Leuten, die diese Pakete benutzt haben.
Aman
2
Scikit-learn ist eine beliebte Bibliothek für maschinelles Lernen, die auch GMM-Unterstützung bietet. Ich bin mir nicht sicher, ob es Ihren Anforderungen entspricht, aber es hat den Vorteil, dass es über andere Lernalgorithmen und -rahmen verfügt (z. B. Kreuzvalidierung, Modellzusammenstellung).
Bitweise
PyPR und PyEM sind nur für Python 2 verfügbar und befinden sich anscheinend nicht mehr in der aktiven Entwicklung. PyMix scheint die beste Wahl zu sein.
Josh Milthorpe

Antworten:

3

Ich weiß nicht, wie ich im Allgemeinen feststellen soll, welches die beste ist, aber wenn Sie Ihre Anwendungseinstellung gut genug kennen, können Sie Daten simulieren und die Pakete für diese Simulation ausprobieren. Erfolgsmetriken können die Zeit sein, die die Schätzung in Anspruch nimmt, und die Qualität der Wiederherstellung Ihrer simulierten Grundwahrheit.

Gael Varoquaux
quelle