Ich habe den Eindruck, dass vieles, was hier getan wird, extrem heuristisch ist. Tatsächlich scheinen die meisten Leute dies auf die <120 Zeichen von Twitter-Aussagen anzuwenden. Wahrscheinlich sind die Ergebnisse (obwohl sie nicht auf diese Weise berechnet werden) nicht viel besser als das Zählen von "positiven" und "negativen" Wörtern mit einer kleinen Positionsinformation ("A besser als B" = positiv für A, negativ für B)
Wenn Sie dann sehen, dass Unternehmen einen vollständigen Twitter-Feed kaufen (wie viele MBit pro Sekunde?) Und behaupten, diesbezüglich eine Stimmungsanalyse durchzuführen, frage ich mich ernsthaft, ob es hier eine statistische Gültigkeit gibt. Kein Wunder, dass Yahoo die Vorauswahlen für South Carolina nicht gut vorhersagen konnte: http://www.technologyreview.com/web/39487/
Die Menschen sind viel zu stolz und daran interessiert, überhaupt in der Lage zu sein, die Datenmenge zu verarbeiten. Sie scheinen die ordnungsgemäße Validierung ihrer Leistung völlig zu vernachlässigen.
Tut mir leid, dass ich so pessimistisch über den Stand der Technik bin.
Hat aufgehört - Anony-Mousse
quelle