Ressourcen zum Erlernen der Markov-Kette und versteckter Markov-Modelle

57

Ich suche nach Ressourcen (Tutorials, Lehrbücher, Webcasts usw.), um mehr über Markov Chain und HMMs zu erfahren. Ich bin Biologe und arbeite derzeit in einem bioinformatischen Projekt.

Welchen mathematischen Hintergrund benötige ich, um Markov-Modelle und HMMs ausreichend zu verstehen?

Ich habe mich mit Google umgesehen, aber bisher habe ich noch kein gutes Einführungs-Tutorial gefunden. Ich bin sicher, jemand hier weiß es besser.

Bogen
quelle
2
Du solltest deinen Beitrag wahrscheinlich zu einem Community-Wiki machen, da es keine richtige Antwort gibt.
csgillespie
1
Ich habe es gerade konvertiert.

Antworten:

19

Hier sind einige Tutorials (als PDFs verfügbar):

  1. Dugad und Desai, Ein Tutorial zu Hidden Markov Modellen
  2. Valeria De Fonzo1, Filippo Aluffi-Pentini2 und Valerio Parisi (2007). Versteckte Markov-Modelle in der Bioinformatik . Current Bioinformatics , 2 , 49-61.
  3. Smith, K. Hidden Markov-Modelle in der Bioinformatik mit Anwendung auf die Gensuche in menschlicher DNA

Schauen Sie sich auch die Tutorials zu Bioconductor an .

Ich gehe davon aus, dass Sie freie Ressourcen wollen. Ansonsten bietet Bioinformatik von Polanski und Kimmel (Springer, 2007) einen schönen Überblick (§2.8-2.9) und Anwendungen (Teil II).

chl
quelle
12

Es gibt auch ein wirklich gutes Buch von Oliver Cappe et. al: Inferenz in Hidden-Markov-Modellen . Es ist jedoch ziemlich theoretisch und sehr leicht für die Anwendungen.

Es gibt ein anderes Buch mit Beispielen in R, aber ich konnte es nicht ertragen - Hidden Markov Models for Time Series .

PS: Die Spracherkennungsgemeinschaft hat auch eine Menge Literatur zu diesem Thema.

M. Tibbits
quelle
8

Es ist ziemlich überraschend, dass in keiner der Antworten das Rabiner-Tutorialpapier zu HMMs erwähnt wird.

Während sich die praktische Umsetzung (letzter Teil des Papiers) auf die Spracherkennung konzentriert, ist dieses Papier in der HMM-Literatur wahrscheinlich das am häufigsten zitierte, da es klar und übersichtlich ist.

Es beginnt mit der Einführung von Markov-Ketten und geht dann weiter zu HMMs.

Zhubarb
quelle
5

Für bioinformatische Anwendungen wäre der klassische Text zu HMMs Durbin, Eddy, Krough & Michison, " Biological Sequence Analsysis - Probabilistic Models of Proteins and Nucleic Acids", Cambridge University Press, 1998, ISBN 0-521-62971-3. Es ist technisch, aber sehr klar und ich fand es sehr nützlich.

Für MCMC gibt es ein aktuelles (Version eines) Buches von Robert und Casella, " Introducing Monte Carlo Methods with R" , Springer, das gut aussieht, aber ich hatte noch keine Gelegenheit, es zu lesen (verwendet R als Beispiele). das ist ein guter Weg, um zu lernen, aber ich muss zuerst R lernen; o)

Dikran Beuteltier
quelle
3

Hier einige Notizen von Ramon van Handel in Princeton:

Dieser Kurs ist eine Einführung in einige der grundlegenden mathematischen, statistischen und rechnerischen Methoden für Hidden-Markov-Modelle.

Der erste Abschnitt enthält eine schöne Reihe von Anwendungen von HMMs in der Biologie, Finanzen, ...

Rodrigo de Azevedo
quelle
2

Hier ist eine schöne interaktive Einführung in Markov Chains http://setosa.io/ev/markov-chains/

Galina Alperovich
quelle
Da die Frage Ressourcen zum Erlernen von Markov-Ketten erfordert, ist hier ein Link zu einem Lernprogramm angebracht. Dies ist einer der Fälle, in denen wir nicht erwarten würden, dass Ihre Antwort in sich geschlossen ist und Sie versuchen, den Inhalt des Links vollständig zusammenzufassen - aber es wäre viel besser, wenn Sie dem Link eine kurze Beschreibung darüber beifügen könnten, was diese Ressource abdeckt, z. B. auf welcher Ebene (etwaige mathematische Voraussetzungen?) und welche Themen sie abdeckt.
Silverfish