Ist es möglich, einen Codeblock zu überwachen und die Anzahl der Prozessortaktzyklen zu bestimmen, die der Code auf einem Arduino- und / oder AVR-Atmel-Prozessor ausgeführt hat? oder sollte ich lieber Mikrosekunden überwachen, die vor und nach dem Ausführen des Codes vergangen sind? Hinweis: Es geht mir nicht um Echtzeit (wie in, wie viele echte Sekunden vergangen sind), sondern um "Wie viele Taktzyklen benötigt dieser Code von der CPU?"
Die aktuelle Lösung, die ich finden kann, ist von time.c:
#define clockCyclesPerMicrosecond() ( F_CPU / 1000000L )
#define clockCyclesToMicroseconds(a) ( (a) / clockCyclesPerMicrosecond() )
Wiring.c fügt hinzu:
#define microsecondsToClockCycles(a) ( (a) * clockCyclesPerMicrosecond() )
Mit diesem Konto konnte ich Taktzyklen berechnen, die durch Überwachen der verstrichenen Mikrosekunden übergeben wurden, und diese dann an microsecondsToClockCycles () übergeben. Meine Frage ist, gibt es einen besseren Weg?
Nebenbemerkung: Gibt es gute Ressourcen für die Leistungsüberwachung des AVR? lmgtfy.com und verschiedene Forensuchen liefern keine offensichtlichen Ergebnisse, außer der Untersuchung von Timern
Vielen Dank
Was meinst du mit "Monitor"?
Es sollte nicht schwierig sein, Taktzyklen für AVR für kleine Teile des Assembler-Codes zu zählen.
Sie können auch einen Port festlegen, bevor der Code ausgeführt wird, und ihn anschließend zurücksetzen und diesen mit einem Logikanalysator oder einem Oszilloskop überwachen, um das Timing zu ermitteln.
Und Sie können die Zeit auch von einem schnell laufenden Timer ablesen, wie Sie sagen.
quelle
Dies ist ein Beispiel für Arduino, das die Funktion clockCyclesPerMicrosecond () verwendet, um die übergebenen Uhren zu berechnen. Dieser Code wartet 4 Sekunden und gibt dann die seit dem Programmstart verstrichene Zeit aus. Die linken 3 Werte sind die Gesamtzeit (Mikrosekunden, Millisekunden, Gesamttaktzyklen) und die am weitesten rechts stehenden 3 sind verstrichene Zeiten:
Ausgabe:
Ich bin sicher, es gibt eine vernünftige Erklärung dafür, warum die ersten zu-Schleifen kürzere Taktzyklen hatten als die meisten und warum alle anderen Schleifen zwischen zwei Längen von Taktzyklen umschalten.
Code:
Nebenbemerkung: Wenn Sie die Verzögerung von 4 Sekunden entfernen, werden Sie die Auswirkungen von Serial.print () viel deutlicher sehen. Beachten Sie, dass hier 2 Läufe verglichen werden. Ich habe nur 4 nahe beieinander liegende Proben aus ihren jeweiligen Protokollen aufgenommen.
Lauf 1:
Lauf 2:
Die verstrichene Zeit erhöht sich über die Gesamtlaufzeit. Nach Ablauf einer Sekunde steigen die Uhren im Durchschnitt von 40.000 auf 44.000. Dies geschieht konstant einige Millisekunden nach 1 Sekunde und die verstrichenen Uhren bleiben mindestens die nächsten 10 Sekunden bei 44.000 (ich habe es nicht weiter getestet). Aus diesem Grund ist die Überwachung nützlich oder erforderlich. Vielleicht hat die verminderte Effizienz mit Konfiguration oder Fehlern in der Serie zu tun? Oder der Code verwendet den Speicher möglicherweise nicht richtig und weist ein Leck auf, das sich auf die Leistung usw. auswirkt.
quelle
Da jede Ihrer Quelle hinzugefügte Codezeile sich auf die Leistung auswirkt und die angewendeten Optimierungen ändern kann. Die Änderungen sollten das Minimum sein, das zur Ausführung der Aufgabe erforderlich ist.
Ich habe gerade ein Atmel Studio-Plugin namens "Annotated Assembly File Debugger" gefunden. http://www.atmel.com/webdoc/aafdebugger/pr01.html Es scheint, als würde man durch die tatsächlich generierte Assemblersprache gehen, während wahrscheinlich mühsam Ihnen genau gezeigt wird, was passiert. Möglicherweise müssen Sie noch dekodieren, wie viele Zyklen für jede Anweisung erforderlich sind, aber es würde viel näher kommen als einige der anderen veröffentlichten Optionen.
Für diejenigen, die nicht wissen, im Ausgabeordner Ihres Projekts ist eine Datei mit einer LSS-Erweiterung. Diese Datei enthält Ihren gesamten ursprünglichen Quellcode als Kommentare. Unter jeder Zeile befindet sich die Assemblersprache, die basierend auf dieser Codezeile generiert wurde. Das Generieren der LSS-Datei kann deaktiviert werden. Überprüfen Sie daher die folgende Einstellung.
Projekteigenschaften | Toolchain | AVR / GNU Common | Ausgabedateien
Kontrollkästchen ".lss (lss-Datei generieren)
quelle
Sie können einen der eingebauten Timer verwenden. Richten Sie vor dem Block alles für prescaller = 1 und TCNT = 0 ein. Aktivieren Sie dann den Timer in der Zeile vor dem Block und deaktivieren Sie ihn in der Zeile nach dem Block. Der TCNT enthält nun die Anzahl der Zyklen, die der Block benötigt hat, abzüglich der festen Zyklen für den Aktivierungs- und Deaktivierungscode.
Beachten Sie, dass die TNCT nach 65535 Taktzyklen auf einem 16-Bit-Timer überläuft. Mit dem Überlauf-Flag können Sie die Laufzeit verdoppeln. Wenn Sie noch länger brauchen, können Sie einen Prescaler verwenden, erhalten jedoch eine geringere Auflösung.
quelle