Ich bin etwas verwirrt. Kann mir jemand erklären, wie man die gegenseitige Information zwischen zwei Begriffen basierend auf einer Term-Dokument-Matrix mit dem Auftreten eines binären Terms als Gewichtung berechnet?
Vielen Dank
python
information-theory
mutual-information
numpy
pandas
user18075
quelle
quelle
Antworten:
Wie wäre es mit einer gemeinsamen Wahrscheinlichkeitstabelle, die die normalisierten Co-Vorkommen in Dokumenten enthält? Dann können Sie anhand der Tabelle gemeinsame Entropie und marginale Entropien erhalten. Schließlich ist
quelle