Ich arbeite mit einem großen Satz von Beschleunigungsmesserdaten, die mit mehreren Sensoren erfasst wurden, die von vielen Probanden getragen werden. Leider scheint hier niemand die technischen Spezifikationen der Geräte zu kennen, und ich glaube nicht, dass sie jemals neu kalibriert wurden. Ich habe nicht viele Informationen über die Geräte. Ich arbeite an meiner Masterarbeit, die Beschleunigungsmesser wurden von einer anderen Universität ausgeliehen und insgesamt war die Situation etwas intransparent. Vorverarbeitung an Bord des Geräts? Keine Ahnung.
Was ich weiß ist, dass es sich um dreiachsige Beschleunigungsmesser mit einer Abtastrate von 20 Hz handelt; digital und vermutlich MEMS. Ich interessiere mich für nonverbales Verhalten und Gestikulieren, das laut meinen Quellen hauptsächlich Aktivitäten im Bereich von 0,3 bis 3,5 Hz erzeugen sollte.
Das Normalisieren der Daten scheint durchaus notwendig, aber ich bin mir nicht sicher, was ich verwenden soll. Ein sehr großer Teil der Daten liegt nahe an den Restwerten (Rohwerte von ~ 1000, bezogen auf die Schwerkraft), aber es gibt einige Extreme wie bis zu 8000 in einigen Protokollen oder sogar 29000 in anderen. Siehe das Bild unten . Ich denke, das macht es zu einer schlechten Idee, durch das Maximum oder das Standard zu dividieren, um sich zu normalisieren.
Was ist der übliche Ansatz in einem solchen Fall? Durch den Median teilen? Ein Perzentilwert? Etwas anderes?
Als Nebenproblem bin ich mir auch nicht sicher, ob ich die Extremwerte abschneiden soll.
Vielen Dank für jeden Rat!
Bearbeiten : Hier ist ein Diagramm von ca. 16 Minuten Daten (20000 Beispiele), um Ihnen eine Vorstellung davon zu geben, wie die Daten normalerweise verteilt sind.
quelle
Antworten:
Die oben angezeigten Rohsignale scheinen ungefiltert und nicht kalibriert zu sein. Durch geeignete Filterung und Kalibrierung mit einer gewissen Zurückweisung von Artefakten werden die Daten tatsächlich normalisiert. Der Standardansatz mit Beschleunigungsmesserdaten ist der folgende:
Es ist ratsam, eine Artefaktunterdrückung für Trägheitssensordaten durchzuführen. Ich würde mir Sorgen machen, dass Sie die Herkunft der Daten nicht kennen und daher nicht garantieren können, dass die Sensoren korrekt und konsistent (in Bezug auf Orientierung und physische Platzierung) an allen Probanden angebracht wurden. Wenn die Sensoren nicht richtig angebracht wurden, können viele Signale in den Signalen auftreten, da sich der Sensor relativ zum Körpersegment bewegen kann. In ähnlicher Weise ist es schwierig, die Daten zwischen den Subjekten zu vergleichen, wenn die Sensoren auf verschiedene Subjekte unterschiedlich ausgerichtet sind (wie sie platziert wurden).
Angesichts der Größe der von Ihnen gemeldeten Ausreißer handelt es sich wahrscheinlich um Artefakte. Solche Artefakte würden fast sicher jede Kalibrierungsberechnung verzerren (obwohl ihre Wirkung durch geeignete Filterung verringert wird), und daher sollte die Kalibrierung nach der Zurückweisung von Artefakten durchgeführt werden.
Ein einfacher Schwellenwert kann für eine anfängliche Routine zur Zurückweisung von Artefakten gut funktionieren, dh
NaN
alle Proben oberhalb eines bestimmten empirischen Schwellenwerts entfernen (oder durch diese ersetzen ). Anspruchsvollere Techniken berechnen diesen Schwellenwert adaptiv unter Verwendung eines laufenden Mittelwerts oder eines sich bewegenden Fensters.Abhängig von der Position des Sensors möchten Sie möglicherweise auch den Einfluss der Schwerkraft auf die Beschleunigungssignale korrigieren, obwohl hier ein detailliertes Verständnis der Sensorachsen und der Positionierung von entscheidender Bedeutung ist. Die Moe-Nillson-Methode ( R. Moe-Nilssen, Eine neue Methode zur Bewertung der Motorsteuerung im Gang unter realen Umgebungsbedingungen. Teil 1: Das Instrument, Clinical Biomechanics, Band 13, Ausgaben 4–5, Juni - Juli 1998, Die Seiten 320-327 ) werden am häufigsten verwendet und eignen sich gut für Trägheitssensoren am unteren Rücken.
Ein guter Ausgangspunkt, um die Daten auf Gestenerkennung zu untersuchen, besteht darin, die gefilterten, kalibrierten Daten in Epochen (z. B. 10 Sekunden) zu unterteilen, eine Reihe von Merkmalen pro Epoche zu berechnen und diese mit den Bezeichnungen zu verknüpfen, die Sie für die Daten haben. t spezifischere Ratschläge geben, ohne mehr über den Datensatz und die zugehörigen Etiketten zu wissen.
Hoffe das hilft.
quelle