Ich habe mich inspiriert von entwickelt hier einen Bare-Metal-Startcode für Arm Cortex M3 entwickelt. Ich stoße jedoch auf das folgende Problem: Angenommen, ich deklariere eine nicht initialisierte globale Variable, z. B. vom Typ unsigned char in main.c.
#include ...
unsigned char var;
...
int main()
{
...
}
Dadurch beginnt die .bss-Region in STM32 f103 bei _BSS_START = 0x20000000 und endet bei _BSS_END = 0x20000001. Nun der Startcode
unsigned int * bss_start_p = &_BSS_START;
unsigned int * bss_end_p = &_BSS_END;
while(bss_start_p != bss_end_p)
{
*bss_start_p = 0;
bss_start_p++;
}
versucht, die gesamte .bss-Region auf Null zu initialisieren. Innerhalb dieser while-Schleife erhöht sich der Zeiger jedoch mit 4 Bytes, daher ist er nach einem Schritt bss_start_p = 0x20000004 immer anders als bss_end_p, was zu einer Endlosschleife usw. führt.
Gibt es dafür eine Standardlösung? Soll ich die Dimension der .bss-Region irgendwie auf ein Vielfaches von 4 "zwingen"? Oder sollte ich einen Zeiger auf vorzeichenloses Zeichen verwenden, um durch die .bss-Region zu gehen? Vielleicht so etwas wie:
unsigned char * bss_start_p = (unsigned char *)(&_BSS_START);
unsigned char * bss_end_p = (unsigned char *)(&_BSS_END);
while(bss_start_p != bss_end_p)
{
*bss_start_p = 0;
bss_start_p++;
}
```
Antworten:
Wie Sie vermuten, geschieht dies, weil der vorzeichenlose int-Datentyp 4 Byte groß ist. Jede
*bss_start_p = 0;
Anweisung löscht tatsächlich vier Bytes des BSS-Bereichs.Der bss-Speicherbereich muss korrekt ausgerichtet sein. Sie können einfach _BSS_START und _BSS_END so definieren, dass die Gesamtgröße ein Vielfaches von vier ist. Dies wird jedoch normalerweise dadurch erledigt, dass das Linker-Skript die Start- und Stopppositionen definieren kann.
Als Beispiel ist hier der Linker-Abschnitt in einem meiner Projekte:
Die
ALIGN(4)
Aussagen kümmern sich um die Dinge.Möglicherweise möchten Sie auch ändern
while(bss_start_p != bss_end_p)
zu
while(bss_start_p < bss_end_p)
.Dies wird das Problem nicht verhindern (da Sie möglicherweise 1-3 Bytes mehr löschen, als Sie möchten), aber es könnte die Auswirkungen minimieren :)
quelle
while(bss_start_p < bss_end_p - 1)
gefolgt von einem byteweisen Löschen des verbleibenden Speicherbereichs würde die letzte Sorge beseitigen.Die Standardlösung lautet
memset()
:Wenn Sie die Standardbibliothek nicht verwenden können, müssen Sie entscheiden, ob es in Ihrem Fall in Ordnung ist, die Größe des Speicherbereichs auf 4 Byte zu runden und die Verwendung fortzusetzen
unsigned int *
. oder wenn Sie streng sein müssen, in welchem Fall müssten Sie verwendenunsigned char *
.Wenn Sie die Größe wie in Ihrer ersten Schleife aufrunden ,
bss_start_p
kann dies zwar größer als sein,bss_end_p
aber es ist einfach, einen Vergleich mit weniger als<
anstelle eines Ungleichheitstests durchzuführen.Natürlich können Sie auch den größten Teil des Speicherbereichs mit 32-Bit-Übertragungen und nur die letzten Bytes mit 8-Bit-Übertragungen füllen, aber das ist mehr Arbeit für wenig Gewinn, insbesondere hier, wenn es sich nur um einen Teil des Startcodes handelt.
quelle
memset()
. Die Ausrichtung auf 4 Bytes ist jedoch mehr oder weniger ein Muss. Warum also nicht?memset()
, und C ist das, worauf sie zu programmieren scheinen. Die einfache Implementierung vonmemset()
ist auch so ziemlich nur diese Schleife, es ist nicht so, als ob sie von viel anderem abhängt. Da dies ein Mikrocontroller ist, gehe ich davon aus , dass es keine dynamische ist die Verknüpfung oder so geht (und Blick auf den Link, gibt es nicht, es ist nur ein Aufrufmain()
nach , dass Nullstellen - Schleife), so sollte der Compiler des Fallenlassens der Lage sein ,memset()
dort zusammen mit allen anderen Funktionen (oder um es inline zu implementieren).Wechseln Sie einfach
!=
zu<
. Das ist normalerweise sowieso ein besserer Ansatz, da es sich um solche Probleme handelt.quelle
Es gibt unzählige andere Websites und Beispiele. Viele Tausende, wenn nicht Zehntausende. Es gibt die bekannten c-Bibliotheken mit Linkerskripten und Boostrap-Code, insbesondere newlib, glibc, aber es gibt auch andere, die Sie finden können. Bootstraping C mit C macht keinen Sinn.
Ihre Frage wurde beantwortet. Sie versuchen, Dinge, die möglicherweise nicht genau sind, genau zu vergleichen. Sie beginnen möglicherweise nicht an einer bekannten Grenze oder enden möglicherweise nicht an einer bekannten Grenze. Sie können also weniger als das tun, aber wenn der Code nicht mit einem exakten Vergleich funktioniert hat, bedeutet dies, dass Sie nach .bss in den nächsten Abschnitt zurückkehren, was dazu führen kann, dass schlimme Dinge passieren oder nicht. Ersetzen Sie ihn einfach durch einen weniger als isnt die Lösung.
Also hier geht TL; DR ist in Ordnung. Sie booten keine Sprache mit dieser Sprache, Sie können sicher damit durchkommen, aber Sie spielen mit dem Feuer, wenn Sie das tun. Wenn Sie nur lernen, wie man das macht, müssen Sie vorsichtig sein, nicht dummes Glück oder Fakten, die Sie noch nicht entdeckt haben.
Das Linker-Skript und der Bootstrap-Code haben eine sehr enge Beziehung, sie sind verheiratet, an der Hüfte verbunden, man entwickelt keine ohne die andere, was zu einem massiven Misserfolg führt. Und leider wird das Linker-Skript vom Linker und die Assembler-Sprache vom Assembler definiert, sodass beim Ändern von Toolchains erwartet wird, dass beide neu geschrieben werden müssen. Warum Assemblersprache? Es benötigt keinen Bootstrap, kompilierte Sprachen im Allgemeinen. C tut dies, wenn Sie die Verwendung der Sprache nicht einschränken möchten. Ich beginne mit etwas sehr Einfachem, das nur minimale Anforderungen an die Toolchain hat. Sie gehen nicht davon aus, dass .bss-Variablen Null sind (macht den Code weniger lesbar, wenn die Variable nie in dieser Sprache initialisiert wird , versuchen Sie dies zu vermeiden, gilt nicht für lokale Variablen, also müssen Sie am Ball sein, wann Sie es verwenden. Leute meiden sowieso Globals, Warum reden wir über .bss und .data? (Globale sind gut für diese Level-Arbeit, aber das ist ein anderes Thema)) Die andere Regel für die einfache Lösung ist, Variablen in der Deklaration nicht zu initialisieren, sondern im Code. Ja, es brennt mehr Flash, Sie haben im Allgemeinen viel, nicht alle Variablen werden sowieso mit Konstanten initialisiert, die am Ende Anweisungen verbrauchen.
Sie können dem cortex-m-Design entnehmen, dass sie möglicherweise gedacht haben, dass es überhaupt keinen Bootstrap-Code gibt, also keine .data- oder .bss-Unterstützung. Die meisten Leute, die Globals verwenden, können nicht ohne leben.
Ich könnte dies minimaler machen, aber ein minimales Funktionsbeispiel für alle Cortex-ms, die die Gnu-Toolchain verwenden. Ich kann mich nicht erinnern, welche Versionen Sie mit 5.xx oder so durch die aktuellen 9.xx starten können. Ich habe die Linker-Skripte irgendwo um 3 gewechselt. xx oder 4.xx als ich mehr lernte und als gnu etwas änderte, das mein erstes kaputt machte.
Bootstrap:
Einstiegspunkt in C-Code:
Linker-Skript.
All dies könnte kleiner sein und immer noch funktionieren. Hier wurden einige zusätzliche Dinge hinzugefügt, um es bei der Arbeit zu sehen.
optimierter Build und Link.
Für einige Anbieter möchten Sie 0x08000000 oder 0x01000000 oder andere ähnliche Adressen verwenden, da der Flash dort zugeordnet und in einigen Startmodi auf 0x00000000 gespiegelt wird. Einige haben nur so viel Flash bei 0x00000000 gespiegelt, dass Sie möchten, dass der Vektortabellenpunkt auf dem Flash-Bereich der Anwendung nicht Null ist. Da es auf Vektortabellen basiert, funktioniert alles.
Beachten Sie zunächst, dass die Cortex-ms nur Daumen-Maschinen sind und aus irgendeinem Grund eine Daumenfunktionsadresse erzwungen haben, was bedeutet, dass das lsbit ungerade ist. Wenn Sie Ihre Werkzeuge kennen, teilen die Anweisungen .thumb_func dem gnu-Assembler mit, dass das nächste Label eine Daumenfunktionsadresse ist. Wenn Sie das +1 in der Tabelle tun, wird dies zum Scheitern führen. Versuchen Sie nicht, es richtig zu machen. Es gibt andere Gnu-Assembler-Möglichkeiten, eine Funktion zu deklarieren. Dies ist der minimale Ansatz.
Es wird nicht gestartet, wenn Sie die Vektortabelle nicht richtig verstehen.
benötigen wohl nur den Stapelzeigervektor (kann dort alles einfügen, wenn Sie den Stapelzeiger selbst in Code setzen möchten) und den Rücksetzvektor. Ich habe hier ohne besonderen Grund vier gesetzt. Normalerweise setzen Sie 16, wollten aber dieses Beispiel verkürzen.
Was muss ein C-Bootstrap mindestens tun? 1. Setzen Sie den Stapelzeiger 2. Null .bss 3. Kopieren Sie .data 4. Verzweigen Sie zum C-Einstiegspunkt oder rufen Sie ihn auf
Der C-Einstiegspunkt wird normalerweise als main () bezeichnet. Einige Toolchains sehen jedoch main () und fügen Ihrem Code zusätzlichen Müll hinzu. Ich benutze absichtlich einen anderen Namen. YMMV.
Die Kopie von .data wird nicht benötigt, wenn dies alles RAM-basiert ist. Als Cortex-M-Mikrocontroller ist dies technisch möglich, aber unwahrscheinlich. Daher wird die .data-Kopie benötigt ..... wenn es .data gibt.
Mein erstes Beispiel und ein Codierungsstil besteht darin, sich nicht wie in diesem Beispiel auf .data oder .bss zu verlassen. Arm kümmerte sich um den Stapelzeiger, sodass nur noch der Einstiegspunkt aufgerufen werden muss. Ich möchte es haben, damit der Einstiegspunkt zurückkehren kann. Viele Leute argumentieren, dass Sie das niemals tun sollten. Sie könnten dies dann einfach tun:
und nicht von centry () zurückkehren und keinen Handlercode zurücksetzen.
Der Linker hat die Dinge dort platziert, wo wir gefragt haben. Und insgesamt haben wir ein voll funktionsfähiges Programm.
Arbeiten Sie also zuerst am Linker-Skript:
Hervorheben, dass die Namen rom und ram keine Bedeutung haben, sondern nur die Punkte für den Linker zwischen Abschnitten verbinden.
Fügen Sie einige Elemente hinzu, damit wir sehen können, was die Tools getan haben
Fügen Sie einige Elemente hinzu, die in diesen Abschnitten platziert werden sollen. und bekomme
Hier ist das Zeug, nach dem wir in diesem Experiment suchen (beachten Sie keinen Grund, Code tatsächlich zu laden oder auszuführen ... kennen Sie Ihre Werkzeuge, lernen Sie sie)
Wir haben hier also gelernt, dass die Position von Variablen in Gnu-Linker-Skripten sehr empfindlich ist. Beachten Sie die Position von data_rom_start gegenüber data_start, aber warum funktioniert data_end ? Ich lasse dich das herausfinden. Ich verstehe bereits, warum man sich nicht mit Linker-Skripten herumschlagen und einfach mit der einfachen Programmierung beginnen möchte ...
Eine andere Sache, die wir hier gelernt haben, ist, dass der Linker data_rom_start für uns ausgerichtet hat und wir dort kein ALIGN (4) brauchten. Sollen wir davon ausgehen, dass das immer funktionieren wird?
Beachten Sie auch, dass es auf dem Weg nach draußen aufgefüllt wurde, wir haben 5 Bytes .data, aber es hat es auf 8 aufgefüllt. Ohne ALIGN () können wir die Kopie bereits mit Wörtern erstellen. Könnte dies auf der Grundlage dessen, was wir heute mit dieser Toolchain auf meinem Computer sehen, für die Vergangenheit und die Zukunft zutreffen? Wer weiß, auch wenn die ALIGNs regelmäßig überprüfen müssen, um sicherzustellen, dass einige neue Versionen nicht kaputt sind, werden sie dies von Zeit zu Zeit tun.
Lassen Sie uns von diesem Experiment aus sicherheitshalber fortfahren.
Bewegen Sie die Enden nach innen, um mit dem übereinzustimmen, was andere Leute tun. Und das hat es nicht geändert:
noch ein schneller Test:
geben
Es ist nicht erforderlich, zwischen Bounce und .align zu wechseln
Ohh, richtig, ich erinnere mich jetzt, warum ich das _end__ nicht hineingesteckt habe. weil es nicht funktioniert.
Ein einfacher, aber sehr portabler Code, um dieses Linker-Skript zu heiraten
geben
wir können dort anhalten oder weitermachen. Wenn wir in der gleichen Reihenfolge wie das Linker-Skript initialisieren, ist es in Ordnung, wenn wir mit dem nächsten Schritt fortfahren, da wir dort noch nicht angekommen sind. und stm / ldm sind nur erforderlich / erwünscht, um wortausgerichtete Adressen zu verwenden. Wenn Sie also zu Folgendem wechseln:
mit bss zuerst im linker script, und ja du willst ble nicht bls.
Diese Schleifen werden schneller gehen. Jetzt weiß ich nicht, ob die Ahb-Busse 64 Bit breit sein können oder nicht, aber für einen Arm voller Größe möchten Sie diese Dinge an 64-Bit-Grenzen ausrichten. Ein ldm / stm mit vier Registern an einer 32-Bit-Grenze, jedoch keine 64-Bit-Grenze, wird zu drei separaten Bustransaktionen, wobei an einer 64-Bit-Grenze eine einzelne Transaktion ausgerichtet ist, die mehrere Takte pro Befehl spart.
Da wir Baremetall machen und wir für alles verantwortlich sind, was wir sagen können, sagen wir zuerst bss, dann Daten. Wenn wir dann Heap haben, wächst der Stapel von oben nach unten. Wenn wir also bss auf Null setzen und etwas überlaufen, solange wir anfangen Am richtigen Ort, der in Ordnung ist, verwenden wir diesen Speicher noch nicht. Dann kopieren wir .data und können in den Heap gelangen, der in Ordnung ist, Heap oder nicht, es gibt viel Platz für den Stack, so dass wir auf niemanden / irgendetwas treten (solange wir im Linker-Skript sicherstellen, dass wir das tun. Wenn es Bedenken gibt, vergrößern Sie die ALIGN (), damit wir immer innerhalb unseres Bereichs für diese Füllungen sind.
Also meine einfache Lösung, nimm es oder lass es. Willkommen, um Fehler zu beheben, ich habe dies weder auf Hardware noch auf meinem Simulator ausgeführt ...
Füge alles zusammen und du bekommst:
Beachten Sie, dass dies mit arm-none-eabi- und arm-linux-gnueabi und den anderen Varianten funktioniert, da kein Ghee-Whiz-Material verwendet wurde.
Sie werden feststellen, wenn Sie sich umschauen, dass die Leute verrückt nach Ghee Whiz-Sachen in ihren Linker-Skripten werden, riesigen monströsen Küchenspülen. Es ist besser, nur zu wissen, wie es geht (oder besser, wie man die Werkzeuge beherrscht, damit Sie steuern können, was vor sich geht), als sich auf andere Dinge zu verlassen und nicht zu wissen, wo es kaputt gehen wird, weil Sie nicht verstehen und / oder recherchieren wollen es.
In der Regel wird keine Sprache mit derselben Sprache gebootet (Bootstrap bedeutet in diesem Sinne, dass Code ausgeführt wird, der keinen Compiler mit demselben Compiler kompiliert). Sie möchten eine einfachere Sprache mit weniger Bootstrap verwenden. Aus diesem Grund wird C in der Assembly ausgeführt. Es gibt keine Bootstrap-Anforderungen, die Sie erst nach dem Zurücksetzen mit der ersten Anweisung beginnen. JAVA, sicher, dass Sie die JVM in C schreiben und das C mit asm booten und dann die JAVA booten, wenn Sie mit C wollen, aber auch die JAVA in C ausführen.
Da wir die Annahmen für diese Kopierschleifen kontrollieren, sind sie per Definition enger und sauberer als handgestimmte Memcpy / Memsets.
Beachten Sie, dass Ihr anderes Problem folgendes war:
Wenn diese lokal in Ordnung sind, kein Problem. Wenn diese global sind, müssen Sie zuerst .data initialisieren, damit sie funktionieren. Wenn Sie diesen Trick versuchen, um .data auszuführen, schlagen Sie fehl. Lokale Variablen, gut, das wird funktionieren. Wenn Sie sich aus irgendeinem Grund entschlossen haben, die statischen Einheimischen (lokale Globale, die ich gerne nenne) zu machen, sind Sie wieder in Schwierigkeiten. Jedes Mal, wenn Sie eine Aufgabe in einer Erklärung ausführen, sollten Sie darüber nachdenken, wie diese implementiert wird und ob sie sicher / vernünftig ist. Jedes Mal, wenn Sie davon ausgehen, dass eine Variable bei Nichtdeklaration Null ist, gilt dies auch dann, wenn eine lokale Variable nicht als Null angenommen wird, wenn sie global ist. Wenn Sie nie davon ausgehen, dass sie Null sind, müssen Sie sich keine Sorgen machen.
quelle