Gibt es einen besseren Namen als "Durchschnitt des Integrals"?

12

Ich teste die von meinem Unternehmen verkauften Drosselklappen-Positionssensoren (TPS) und drucke die Aufzeichnung der Spannungsantwort auf die Drehung der Drosselklappenwelle. Ein TPS ist ein Rotationssensor mit einer Reichweite von 90 ° und der Ausgang entspricht einem Potentiometer mit einer vollständigen Öffnung von 5 V (oder dem Eingangswert des Sensors) und einer anfänglichen Öffnung von einem Wert zwischen 0 und 0,5 V. Ich habe einen Prüfstand mit einem PIC32-Controller gebaut , um alle 0,75 ° eine Spannungsmessung durchzuführen, und die schwarze Linie verbindet diese Messungen.

Eines meiner Produkte tendiert dazu, lokalisierte Variationen mit geringer Amplitude von der Ideallinie (und darunter) zu entfernen. Diese Frage bezieht sich auf meinen Algorithmus zur Quantifizierung dieser lokalisierten "Einbrüche". Was ist ein guter Name oder eine Beschreibung für den Prozess der Messung der Dips? (Die vollständige Erklärung folgt.) Im folgenden Bild tritt der Einbruch im linken Drittel des Diagramms auf und ist ein Grenzfall, ob ich diesen Teil bestehen würde oder nicht:

Ausdruck eines verdächtigen Teils

Also habe ich einen Dip-Detektor ( Stapelüberlauf qa über den Algorithmus ) gebaut, um mein Bauchgefühl zu quantifizieren. Ich dachte zunächst, ich würde "Fläche" messen. Dieses Diagramm basiert auf dem obigen Ausdruck und meinem Versuch, den Algorithmus grafisch zu erklären. Für 13 Proben zwischen 17 und 31 gibt es einen Einbruch:

Abgetastete Daten werden mit vergrößertem "Eintauchen" angezeigt

delteinsdelteins

delteinsdydx

Analyse des Derivats ...?

delteinsdelteins

0,7+1.2+1.3+1.4+1.8+2.5+2.9+3.0+2.5+2,0+1.5+1,0+1.2

23

Die grüne Linie ist der Durchschnitt dieser "unterdurchschnittlichen Werte", die durch Teilen der Fläche durch die Länge des Eintauchens ermittelt wurden:

23÷13=1,77

2.63.0

|delteins-einvG|>einvG+stddev

Es ist fast 20 Jahre her, seit Calc 1, also lassen Sie es mich ruhig angehen, aber das fühlt sich sehr danach an, als hätte ein Professor mit Kalkül und der Verschiebungsgleichung erklärt, wie ein Konkurrent mit geringerer Beschleunigung, der eine höhere Kurvengeschwindigkeit beibehält, einen anderen schlagen kann Konkurrent mit größerer Beschleunigung in die nächste Kurve: Wenn er die vorherige Kurve schneller durchfährt, bedeutet die höhere Anfangsgeschwindigkeit, dass die Fläche unter seiner Geschwindigkeit (Verschiebung) größer ist.

Um das auf meine Frage zu übertragen, fühle ich mich wie eine Beschleunigung, die 2. Ableitung der Originaldaten.

Ich besuchte Wikipedia, um die Grundlagen der Analysis und die Definitionen von Ableitung und Integral neu zu lesen, und lernte den richtigen Begriff für die Addition der Fläche unter einer Kurve über diskrete Messungen als numerische Integration . Viel mehr googeln im Durchschnitt des Integrals und ich komme zum Thema Nichtlinearität und digitale Signalverarbeitung. Die Mittelung des Integrals scheint eine beliebte Metrik für die Quantifizierung von Daten zu sein .

1,77

Chris K
quelle
Ich denke, "durchschnittliches Eintauchen" ist gut genug. Es hat nicht die Dimensionen der Beschleunigung, also hat es sicherlich nichts damit zu tun.
ShreevatsaR
Und ich würde mich über Beobachtungen oder Kommentare zu diesem Thema als Ganzes freuen. Ich bin etwas beunruhigt darüber, dass diese Messung des "Bauchgefühls" nicht besser mathematisch ausgedrückt werden kann.
Chris K
Fügen Sie möglicherweise alle Datenpunkte hinzu, die Sie zum Erstellen der Ideallinie verwendet haben, oder fügen Sie ein wenig mehr Informationen dazu hinzu, wie die gepunktete rote Linie berechnet wird, um zu rechtfertigen, dass die blauen Balken die "Deltas" sind, die unter dem Durchschnitt aller liegen die Datenpunkte "? Wenn es sich moralisch gesehen um die durchschnittliche Entfernung vom Durchschnitt handelt, sollte es einen Namen im Beschleunigungsstil geben, der natürlich die Differenzierung durch die Mittelwertbildung ersetzt.
1
Migriert von Math.SE durch OP-Anforderung: meta.stats.stackexchange.com/questions/1845/…
Willie Wong
1
Ich könnte das Wort "local" hinzufügen, um zu verdeutlichen, dass Schritt 1 existiert - ich stimme @Glen_b (einem anderen Glen - hi!) Zu, dass dies wichtig ist. Daher würde ich vorläufig einen "lokalen mittleren Defekt" vorschlagen, bei dem ich gerade "Abweichung vom Ideal" zu "Defekt" verkettet habe. Scheint passend.
Glen Wheeler

Antworten:

3

Dies ist zuallererst eine gute Beschreibung Ihres Projekts und des Problems. Und ich bin ein großer Fan Ihres hausgemachten Mess-Frameworks, das super cool ist. Warum spielt es also eine Rolle, was Sie als "Mittelung der Integrale" bezeichnen?

x[n]>αSD(x[1:n-1])=>x[n] ist ausreißer
x[n]nthSD(x[1:n-1])1st(n-1)thαh
x[n]>αSD(x[n-h-1:n-1])=>x[n] ist ausreißer

x[n]

Es gibt auch andere Regeln, die Sie berücksichtigen sollten, um ein Gerät als fehlerhaft zu klassifizieren:

  • wenn eine Abweichung (Delta) größer ist als ein Vielfaches der SD aller Deltas
  • wenn die quadratische Summe der Abweichungen größer als eine bestimmte Schwelle ist
  • wenn das Verhältnis der Summe der positiven und negativen Deltas nicht ungefähr gleich ist (was nützlich sein kann, wenn Sie kleinere Fehler in beiden Richtungen anstelle einer starken Abweichung in einer Richtung bevorzugen)

Natürlich können Sie mehr Regeln finden und sie mit Hilfe der Booleschen Logik verketten, aber ich denke, Sie können mit den drei oben genannten sehr weit kommen.

Last but not least müssen Sie nach dem Einrichten den Klassifizierer testen (ein Klassifizierer ist ein System / Modell, das eine Eingabe einer Klasse, in Ihrem Fall den Daten jedes Geräts, entweder "gut" oder "gut" zuordnet). fehlerhaft"). Erstellen Sie ein Testset, indem Sie die Leistung jedes Geräts manuell kennzeichnen. Schauen Sie sich dann den ROC an , der im Grunde den Versatz zwischen der Anzahl der Geräte, die Ihr System korrekt von der Rücksendung aufnimmt, und der Anzahl der fehlerhaften Geräte, die es aufnimmt.

Mittel zur Bedeutung
quelle
Ich glaube, "warum um alles in der Welt ist es wichtig" ist eine Funktion Ihres eigenen Benutzernamens. :) Warum? Aus demselben Grund gibt es einen Beckenkamm: Wir brauchen Worte, um alles, was im Leben einzigartig ist, eindeutig zu quantifizieren. Imho, diese Qualitätssicherung ist ein Beispiel dafür, wie begrenzt der Wortschatz in der Statistik ist. Wir müssen verwirrende oder widersprüchliche Deskriptoren für das, was "für das Auge" so einfach ist, kombinieren.
Chris K
Hehe, gut gesehen, Sir! :) Wenn ich irgendwelche Unternehmungen in das Land des kreativen Markens ausließ, dann nur, weil ich mich gezwungen fühlte, den Einfallsreichtum und die Hingabe Ihrer Bemühungen und Ideen zu unterstützen, anstatt vergebliche Etiketten zu erfinden. Da Sie darauf bestehen, den Mittelwert des Integrals zu benennen, beachten Sie, dass das, was Sie als "Mittelwert des Integrals" betrachten, ein einfaches Mittel Ihrer Deltas ist. Und als solche sind Ihre Ausreißer einfach "Abweichungen vom Mittelwert" oder möglicherweise Abweichungen vom lokalen Mittelwert. Ich sehe den Vorteil des Denkens in Integralen nicht ganz, es sei denn, Sie haben nicht genügend Abtastpunkte.
Bedeutungslos