Die exakte Kopie des Maschinencodes läuft 50% langsamer als die ursprüngliche Funktion

Ich habe ein bisschen mit der Ausführung von RAM und Flash-Speicher auf eingebetteten Systemen experimentiert. Für Rapid Prototyping und Tests verwende ich derzeit einen Arduino Due (SAM3X8E ARM Cortex-M3). Soweit ich sehen kann, sollten die Arduino-Laufzeit und der Bootloader hier keinen...