STM32 Anleitungen

STM32F1 Anleitung

In diesem Tutorial sammle ich Informationen zur Anwendung von STM32 Mikrocontrollern, Serie F1. Also technische Daten, Hinweise und Programmier-Beispiele auf Basis der CMSIS, die beim Einstieg helfen könnten.

Meine Codeschnipsel sollen bei den ersten Schritten helfen, den Mikrocontroller kennen zu lernen und das Arbeiten mit dem Referenzhandbuch zu erlernen. Sie sind daher absichtlich minimalistisch gehalten, dafür aber umso besser kommentiert.

Modell Bezeichnungen

Der Hersteller hat sich für die Bezeichnung seiner Mikrocontroller folgendes Schema ausgedacht:

ARM Cortex Kerne mit "F" enthalten eine Recheneinheit zur Beschleunigung von Fließkomma-Berechnungen.

Dokumentationen

Die Pinbelegung und elektrischen Daten findet man im jeweiligen Datenblatt. Für den Programmierer ist das Reference Manual am wichtigsten, da es die I/O Funktionen und Register beschreibt. Im Errata Sheet beschreibt der Hersteller überraschende Einschränkungen und Fehler der Mikrochips, teilweise mit konkreten Workarounds.

Weiterführende Doku:

Elektrische Daten

Alle STM32F1 Chips kann man mit 2,0 bis 3,6 Volt betreiben. Der ADC benötigt aber mindestens 2,4 Volt und die USB Schnittstelle läuft nur mit 3,3 V.

Die Stromaufnahme ist im laufenden Betrieb mit 8bit Mikrocontrollern vergleichbar, im Stop Modus ist sie jedoch wesentlich höher. Für langfristigen Batteriebetrieb wird daher auf die sparsame L0 Serie verwiesen.

Viele I/O Pins sind 5 V tolerant. Bei den STM32F103 Modellen sind das: PA8-15, PB2-4, PB6-15, PC6-12, PD0-15, PE0-15, PF0-5, PF11-15, PG0-15.
Im open-drain Modus dürfen die 5 V toleranten Ausgänge durch externe Widerstände auf 5 V hoch gezogen werden.

Die Ausgänge sind einzeln mit 25 mA belastbar, aber insgesamt muss die Stromaufnahme des Chips unter 150 mA bleiben. Gültige Logikpegel sind nur bis 8 mA garantiert. Die Ausgänge sind nicht Kurzschluss-fest.

Die Eingänge sind sehr hochohmig (da CMOS) und haben einen Schmitt-Trigger. Die ESD Schutzdioden sind teilweise nur sehr bedingt belastbar. Die internen Pull-Up und Pull-Down Widerstände haben ungefähr 40 kΩ. Alle I/O Pins haben ungefähr 5 pF Kapazität.

Der NRST (Reset) Pin hat intern einen Pull-Up Widerstand und kann sowohl vom Chip selber als auch von außen auf Low gezogen werden. Intern erzeugte Reset-Impulse sind garantiert mindestens 20 µs lang.

Besondere Ausnahmen

Für die Pins PC13, PC14 und PC15 gelten folgende Einschränkungen: Hintergrund ist, dass diese drei Pins intern am (schwachen) Power-Switch der RTC hängen.

Boards

Nucleo-F103RB

Das Nucleo-F103RB Board (aus der Nucleo-64 Reihe) ist ein hochwertiges Starter-Set zum günstigen Preis um 15 €.

Der 8 MHz Hauptquarz befindet sich auf dem ST-Link Adapter, er versorgt beide Mikrocontroller. Wenn man den ST-Link abtrennt, muss man den Mikrocontroller mit seinem internen R/C Oszillator betreiben oder einen zusätzlichen Quarz in die verbleibende Platine einlöten.

Der I²C Anschluss an der rechten Arduino Buchsenleiste (beschriftet als SCL/D15 und SDA/D14) erfordert die Verwendung von I2C1 mit "remapped" Pin Konfiguration.

Das User Manual enthält die vollständige Beschreibung des Boardes.

Maple Mini

Nachbauten vom nicht mehr produzierten LeafLabs Maple Mini Board bekommt man aus China ab 3,50 €. Dessen RTC ist mangels Quarz nicht benutzbar.

Es hat keinen separaten SWD Anschluss, die nötigen Signale (SWD und SWCLK) sind jedoch auf einer der beiden Stiftleisten herausgeführt. Dieses Board passt nicht in 40 polige DIP Sockel.

Die aufgedruckte Beschriftung der Pins entspricht nicht dem Datenblatt, sondern bezieht sich auf das Arduino Framework.

Die Firmware installiert man wahlweise über USART1 mit dem fest installierten seriellen Bootloader oder über SWD mit einem ST-Link Adapter. Die originalen Maple Mini Boards wurden stets mit Arduino USB Bootloader verkauft, das ist bei den Nachbauten leider nicht immer der Fall.

Der Spannungsregler kann leicht überhitzen wenn man ihn bei mehr als 7 V Versorgungsspannung mit zusätzlichen Verbrauchern belastet.

Ein High Pegel an PB9 schaltet den Pull-Up Widerstand vom USB Anschluss aus.

STM32duino Wiki: Maple Mini Technische Beschreibung des "Maple Mini" Boardes

STM32F103C8T6 Minimum System Development Board

Dieses Board aus China mit dem Spitznamen "Blue Pill" bekommt man ab 1,50 €, ein extremes Schnäppchen.

Wenn man besonders dünne Stiftleisten verwendet, passt das Board in einen 40-poligen DIP Sockel.

Die Firmware installiert man wahlweise über USART1 mit dem fest installierten seriellen Bootloader oder über SWD mit einem ST-Link Adapter.

Der Boot1 Jumper (=PB2) kann im Normalbetrieb für eigene Zwecke verwendet werden.

Es wird geraten, den Rahmen der empfindlichen USB Buchse nachzulöten. Man darf das Board nicht gleichzeitig über USB und ein 5 V Netzteil versorgen (Kurzschluss). Eine zusätzliche 3,3 V Versorgung ist hingegen in Ordnung.

Der USB Pull-Up Widerstand R10 and PA12 ist oft falsch mit 10 kΩ statt dem richtigen 1,5 kΩ bestückt, so dass der USB Port unzuverlässig funktioniert. Zur Korrektur kann man zusätzlich einen 1,8 kΩ Widerstand parallel schalten (von PA12 nach 3,3 V).

Wenn der Uhrenquarz benutzt wird, soll man die Stifte an PC14 und PC15 entfernen, damit er stabil schwingt.

Schaltplan vom STM32F103C8T6 Minimum System Development Board

STM32F103VET6 Minimum System Development Board

Dieses Board aus China bekommt man ab 9 €. Es ist offensichtlich eine größere Variante vom "Blue Pill" Board. Ich habe es noch nicht ausprobiert.

Die Firmware installiert man wahlweise über USART1 oder USB mit dem fest installierten Bootloader oder über SWD mit einem ST-Link Adapter.

Der Boot1 Jumper (=PB2) kann im Normalbetrieb für eigene Zwecke verwendet werden.

Man darf das Board nicht gleichzeitig über USB und ein 5 V Netzteil versorgen (Kurzschluss). Eine zusätzliche 3,3 V Versorgung ist hingegen in Ordnung.

Wenn USB verwendet wird, empfehle ich, den Pull-Up Widerstand an PA12 (D+) zu überprüfen. Er ist im Schaltplan mit 4,7 kΩ eingezeichnet, es sollten aber 1,5 kΩ sein.

Wenn der Uhrenquarz benutzt wird, soll man die Stifte an PC14 und PC15 entfernen, damit er stabil schwingt.

Schaltplan vom STM32F103VET6 Minimum System Development Board

Software

Tools

Entwicklungsumgebungen:

Optionale Software für Windows:

Optionale Software für Linux:

1) Die Programm-Versionen 2.0 bis 2.2 habe ich mit Oracle Java 8 und diesem Start-Script ans Laufen gebracht.

ARM Libraries

Die Basis-Library für alle ARM Cortex-M Mikrocontroller heisst CMSIS-Core. Dabei handelt es sich im Grunde genommen um einen Haufen Definitionen für alle Register, damit man sie mit Namen statt über Hexadezimal-Codes ansprechen kann. Außerdem enthält die CMSIS wenige Hilfsfunktionen, die den ARM Kern konfigurieren. Die CMSIS ist von ARM spezifiziert und wird von allen Chip Herstellern in spezifischen Varianten bereit gestellt.

ST hat ein paar hilfreiche Makros hinzugefügt, wie SET_BIT(), CLEAR_BIT() und MODIFY_REG(). Diese sind nicht von ARM standarisiert.

Download: CMSIS Paket für alle STM32 (habe ich 2019 aus den Cube HAL Paketen extrahiert)

Darauf aufbauend stellt die Firma ST ihr proprietäres Cube HAL Framework bereit, das den Zugriff auf die Hardware-Funktionen durch Abstraktion erleichtern soll. Dazu gehört das Programm CubeMX, womit man Quelltext-Projekte einschließlich Code zur Konfiguration der I/O Funktionen und Taktversorgung erzeugt.

Ich empfehle, die Programmierung zunächst anhand des Referenzhandbuches (ohne HAL) zu lernen, weil diese nach meiner Erfahrung immer wieder kleine gemeine Fehler enthält, mit denen man als Anfänger schnell überfordert ist.

Von 2007 bis 2011 war die inzwischen veraltete Standard Peripheral Library (SPL) im Umlauf. Einige Beispiele im Internet beruhen noch darauf.

Der arm-gcc Compiler bringt die Standard-C Bibliotheken newlib und newlib-nano mit, denen ich weiter unten ein eigenes Kapitel gewidmet habe.

Beispielprogramm

Beispiel für einen einfachen LED-Blinker an PA5 und PC13 auf Basis der CMSIS:
// Filename: main.c

#include <stdint.h>
#include "stm32f1xx.h"

// delay loop for 8 MHz CPU clock with optimizer enabled
void delay(uint32_t msec)
{
    for (uint32_t j=0; j < 2000UL * msec; j++)
    {
        __NOP();
    }
}

int main(void)
{
    // Enable Port A, C and alternate functions
    SET_BIT(RCC->APB2ENR, RCC_APB2ENR_IOPAEN + RCC_APB2ENR_IOPCEN);

    // PA5 and PC13 = Output for LEDs
    MODIFY_REG(GPIOA->CRL, GPIO_CRL_CNF5  + GPIO_CRL_MODE5,  GPIO_CRL_MODE5_0);
    MODIFY_REG(GPIOC->CRH, GPIO_CRH_CNF13 + GPIO_CRH_MODE13, GPIO_CRH_MODE13_0);

    while(1)
    {
        // LED Pin -> High
        WRITE_REG(GPIOA->BSRR, GPIO_BSRR_BS5);
        WRITE_REG(GPIOC->BSRR, GPIO_BSRR_BS13);        
        delay(500);

        // LED Pin -> Low
        WRITE_REG(GPIOA->BSRR, GPIO_BSRR_BR5);
        WRITE_REG(GPIOC->BSRR, GPIO_BSRR_BR13);        
        delay(500);
    }
}
Ich weiß dass man Delays besser mit einem Timer realisiert. Hier wollte ich jedoch ein möglichst simples Programmbeispiel zeigen.

Programmier- und Debug-Schnittstellen

SWJ Schnittstelle

Mit der SWJ Schnittstelle übertragt man das fertige Programm in den Mikrocontroller und kann es im laufenden Betrieb untersuchen. Zum Beispiel kann man das Programm jederzeit anhalten und dann den Inhalt des Speichers anschauen. Wenn es hängt, kann der Debugger anzeigen, wo das passiert. Der Debugger kann sogar melden, wenn ausgewählte Variablen verändert werden.

SWJ ist die einzige Schnittstelle, die von der System Workbench direkt ohne zusätzliche Plugins unterstützt wird. Sie funktioniert unabhängig von Boot Modus, Taktquelle, Spannung und Temperatur. Die SWJ Schnittstelle ist nach dem Reset standardmäßig aktiviert, kann jedoch per Software deaktiviert werden.

Achtung: Die Schnittstelle funktioniert nicht im Stop, Standby und Sleep Modus!

Die SWJ Schnittstelle unterstützt zwei Übertragungsprotokolle: JTAG und SWD. Das neuere SWD Protokoll wird bevorzugt, da es schneller ist und nur drei Leitungen benötigt: GND, SWDIO und SWCLK.

Die passenden Programmieradapter von ST heißen "ST-Link". Billige Nachbauten aus China sehen so aus:

Den ST-Link Adapter vom Nucleo-64 Board kann man abtrennen, um damit andere Mikrocontroller zu programmieren. Oder man zieht die beiden Jumper ab, wodurch die Leitungen SWCLK und SWDIO unterbrochen werden.

Er ist folgendermaßen mit dem Mikrocontroller verbunden:

ST-Link CN4MikrocontrollerBeschreibung
Pin 1VDDMisst die Spannungsversorgung, bei den hier dargestellten ST-Link Adaptern optional
Pin 2SWCLKPA14Serial Wire Clock
Pin 3GNDCommon Ground (Masse)
Pin 4SWDIOPA13Serial Wire Data
Pin 5NRSTReset Signal, optional siehe Verbindungsoptionen
Pin 6SWOPB3Serial Wire Output, optional siehe Trace Meldungen ausgeben

Die Cube Programme verlangen nach einem Firmware-Update, was auf beiden Adaptern problemlos klappt. Die anderen oben genannten Programme sind hingegen auch mit älteren Firmware Versionen zufrieden.

Viele Programme benötige unter Windows den libusb-win32 Treiber, um den ST-Link anzusteuern. Falls dieser fehlt oder nicht richtig geladen wird, siehe hier.

Bei dem chinesischen Stick empfehle ich, die Rückseite der inneren Platine mit Gewebeband abzudecken, damit kein Kurzschluss zum Aluminium-Gehäuse entsteht. Der Reset-Ausgang des Sticks funktioniert nur bei STM8. Wer eine ruhige Hand hat, kann sich eine SWO Leitung nachrüsten:

Ich habe zwei derart verbesserte Sticks für jeweils 5€ zu verkaufen. Sie sind natürlich getestet und ansonsten ungebraucht.

SWJ Deaktivieren

Nach dem Reset sollten Programme erst eine Sekunde abwarten, bevor sie die Schnittstelle deaktivieren. Dies erleichtert den Verbindungsaufbau des Debuggers zum Übertragen neuer Programme.

Um die betroffenen Pins für normale Ein-/Ausgabe zu verwenden, kann man die Schnittstelle im AFIO->MAPR Register deaktivieren, nachdem das AFIOEN Bit eingeschaltet wurde.

// Enable clock for alternate functions
SET_BIT(RCC->APB2ENR, RCC_APB2ENR_AFIOEN);
    
// Disable both SWD and JTAG to free PA13, PA14, PA15, PB3 and PB4
MODIFY_REG(AFIO->MAPR, AFIO_MAPR_SWJ_CFG, AFIO_MAPR_SWJ_CFG_DISABLE); 

or:

// Disable JTAG only to free PA15, PB3* and PB4. SWD remains active
MODIFY_REG(AFIO->MAPR, AFIO_MAPR_SWJ_CFG, AFIO_MAPR_SWJ_CFG_JTAGDISABLE); 
*) PB3 kann trotzdem noch mit dem ST-Link Adapter als SWO Ausgang konfiguriert werden.

Trace Meldungen ausgeben

Man kann den SWO (=PB3) Ausgang des Mikrocontrollers dazu benutzen, Diagnose Meldungen auszugeben. Diese Schnittstelle ist effizienter als USART, weil ihre Bitrate typischerweise ist (nämlich 1/4 der CPU Taktfrequenz) und weil sie über einen kleinen FIFO Puffer (10 Bytes) verfügt.

SWO wird mit dem ST-Link Adapter aktiviert und empfangen. Dann ist PB3 vorübergehend ein Ausgang mit Ruhe-Pegel High. Während der seriellen Datenübertragung liefert er Low-Impulse.

Die CMSIS Funktion ITM_SendChar() gibt ein Zeichen auf der SWO Leitung aus. ITM bedeutet "Instrumentation Trace Message":

#include <stdint.h>
#include "stm32f1xx.h"

// delay loop for default 8 MHz clock with optimizer enabled
void delay(uint32_t msec)
{
    for (uint32_t j=0; j < 2000UL * msec; j++)
    {
        __NOP();
    }
}

// Output a trace message
void ITM_SendString(char *ptr)
{
    while (*ptr)
    {
        ITM_SendChar(*ptr);
        ptr++;
    }
}

int main(void)
{
    while (1)
    {
        ITM_SendString("Hello World!\n");
        delay(500);
    }
}

Boot Loader

Neben der SWJ Schnittstelle haben alle STM32 auch einen unveränderlichen Bootloader, über den man Programme hochladen kann. Er ermöglicht Zugriff auf den Flash Speicher, das RAM und die Option Bytes, zum Debuggen eignet er sich jedoch nicht.

Der Bootloader nutzt den Anschluss USART1. Die STM32F105 und 107 Modelle unterstützen auch USB und CAN.

Zur Konfiguration des Bootloaders dienen die beiden Pins Boot0 und Boot1:

Boot0Boot1 (=PB2)Starte von
LowegalFlash ab Adresse 0x0800 0000, gemappt auf 0x0000 0000
HighLowBootloader
HighHighRAM ab Adresse 0x2000 0000, nicht gemappt

Boot0 und Boot1 werden beim Reset und beim Aufwachen aus dem Standby Modus gelesen. Um den Bootloader zu aktivieren, setzt man den Pin Boot0=High, Boot1=Low und dann drückt man den Reset Knopf.

Weitere Informationen zum Bootloader stehen in der Application Note AN2606.

Serieller Bootloader

Die Verbindung zum PC wird mit einem USB-UART Adapter wie diesem hergestellt:

Folgende Verbindungen sind nötig:

PC USB-UARTSTM32F1Beschreibung
TxDRxD (=PA10)Daten
RxDTxD (=PA9)Daten
GND GNDGemeinsame Masse

Als Taktquelle dient der interne R/C Oszillator, dessen Frequenz bei 3,3 V und Zimmertemperatur meistens ausreichend genau ist. Der Bootloader erkennt die Baudrate automatisch. Es werden 8 Datenbits und gerade Parität (even) verwendet.

USB Bootloader

Beim STM32F105 und 107 unterstützt der Bootloader auch USB. Dazu ist ein Quarz mit 8 MHz, 14.7456 MHz oder 25 MHz notwendig, und die Spannungsversorgung muss 3,3 V sein. Weitere Anwendungshinweise findest du in der Application Note AN2606.

Für Arduino gibt es für einige STM32F103 Boards den STM32duino Bootloader, der das Programmieren über USB ermöglicht. Der kann ohne Arduino aber nur mit zusätzlichem Aufwand verwendet werden, weil dann dein eigenes Programm nicht am Anfang des Flash Speichers beginnt, sondern hinter dem Bootloader.

GCC Optionen

Achtung: Keil MDK verwendet einen anderen Compiler, für den dieses Kapitel nicht passt.

Newlib

Der arm-gcc Compiler bringt standardmäßig zwei C Bibliotheken mit: Newlib ist die Standard-Bibliothek von Linux, während newlib-nano für Mikrocontroller optimiert wurde. Du kannst eine Menge Speicherplatz sparen, indem du auf die nano Version der Library wechselst. Dazu dient das Linker-Flag -specs=nano.specs.

Wenn das Programm die stdio.h Library benutzt, muss man entweder einige Funktionen zum Zugriff auf die Konsole implementieren oder mittels Linker-Flag -specs=nosys.specs auf Dummy Funktionen zurückgreifen.

Wenn man Fließkommazahlen ausgeben möchte, muss man bei der newlib-nano zusätzlich die Option -u _printf_float angeben. Das kostet zusätzlich rund 9 kB Flash Speicher. Für das Parsen von Fließkommazahlen benötigt man die Option -u _scanf_float.

Ich habe gemessen, wie viel Speicher die Funktionen puts() und printf() von der newlib-nano ohne Fließkomma-Unterstützung benötigen:

FunktionHeapStackCode (Flash)
puts()1468162528 Bytes
printf()1468163880 Bytes

Das ist erheblich mehr, als bei AVR Mikrocontrollern. Der Speicherbedarf von printf() ist unabhängig von der Anzahl der Argumente und Formatier-Optionen. Wenn weniger als 1468 Bytes Heap zur Verfügung stehen, belegt die Library stattdessen nur 436 Bytes und gibt dann jedes Zeichen einzeln mit _write() aus. Wenn weniger als 436 Bytes Heap zur Verfügung stehen, dann brechen die Funktionen mit einer HardFault Exception ab.

Da Mikrocontroller im Gegensatz zu größeren Computern kein Standard Ausgabegerät (wie Bildschirm oder Terminal) haben, muss man die Funktion _write() selber implementieren. Erst danch funktionieren printf(), puts() und putchar():

int _write(int file, char *ptr, int len)
{
    for (int i=0; i<len; i++)
    {
        char c=*ptr++;
        // hier das Zeichen c irgendwo ausgeben
    }
    return len;
}

Weiter unten findest du konkrete Beispiele für Ausgaben über serielle Ports und USB. Bei der Ausgabe von Text mit printf() und putchar() ist zu beachten, dass die Zeichen in einem Puffer gesammel werden, bis dieser entweder voll ist oder ein Zeilenvorschub (\n) erfolgt. Mit fflush(stdout) kann man erzwingen, dass die Ausgabe sofort erfolgt. puts() ist nicht betroffen, weil es immer einen Zeilenvorschub anhängt.

Assembler Listing

Wenn du sehen willst, welchen Assembler-Code der Compiler erzeugt, benutze das Linker-Flag
-Wa,-adhlns="$(@:%.o=%.lst)"
Du findest dann für jede Quell-Datei eine *.lst Datei im Verzeichnis Debug oder Release.

Optimizer

In den Einstellungen des Compilers kann man beeinflussen, mit welcher Strategie der Compiler das Programm optimiert (umstrukturiert).

OptionZielBeschreibung
-O0DebuggingKeine Optimierung. Der Assembler Code entspricht genau dem C-Code, was für den Debugger optimal ist. Aber das Programm läuft viel Langsamer, als mit Optimierung.
-O1CompilierzeitDer Compiler wendet nur einfache Optimierungen an, die er schnell umsetzen kann. Nicht empfehlenswert.
-O2GeschwindigkeitGute Geschwindigkeit, von ARM als Standardeinstellung empfohlen.
-O3GeschwindigkeitBeste Geschwindigkeit, unter Umständen wird der Code aber viel größer.
-OsCode-GrößeGute Geschwindigkeit bei möglichst geringer Code-Größe
-OgDebuggingDas Programm wird so weit wie möglich auf Geschwindigkeit optimiert, ohne den Debugger zu beeinträchtigen.

Optimierter Code stimmt stellenweise nicht mehr mit dem C-Quelltext überein, was die Benutzung des Debuggers beeinträchtigt. Zum Beispiel kann der Debugger nur Variablen anzeigen, die eine Adresse im RAM haben, aber der Optimizer bevorzugt CPU Register für Variablen. Unter Umständen entfernt der Optimizer ganze Prozeduren und ersetzt sie durch anderen (inline) Code. Wiederholschleifen werden teilweise durch eine längere Sequenz von Code ersetzt, wenn dadurch die Geschwindigkeit besser wird.

Die vollständige Liste der Optimierungen befindet sich hier.

Startup-Code

Im Gegensatz zu allen mir bekannten Compilern für 8bit Mikrocontroller befindet sich der Startup-Code und die Interrupt-Vektor Tabelle in editierbaren Dateien (sysmem.c und startup_stm32.s). Der Projekt-Assistent in der IDE legt diese Dateien automatisch an. Für erste Versuche kann man sie unverändert benutzen.

Falls vorhanden, führt der Startup-Code eine Funktion mit folgender Signatur aus, bevor statische Objekte konstruiert werden und bevor main() ausgeführt wird:

void SystemInit(void) {}
Bei großen C++ Projekten kann es sich lohnen, die Erhöhung der Taktfrequenz dort unterzubringen, denn dann startet das Programm schneller.

Speicher-Struktur

Obwohl der Prozessor in Harvard Architektur gestaltet ist, benutzt er einen gemeinsamen Adress-Raum für Programm, Daten und I/O Register. Dadurch können alle I/O Register über Zeiger angesprochen werden und der Prozessor kann Code sowohl aus dem RAM als auch aus dem (Flash-) ROM ausführen. Adressen und Zeiger sind 32bit groß.

Die Befehle sind teilweise 16bit und teilweise 32bit groß.

Daten werden als 8, 16 oder 32bit geladen. Sie müssen nicht zwingend an der 32bit Wortgröße ausgerichtet sein. Aber man erreicht bessere Geschwindigkeit, wenn 16bit Daten an 16bit Adressen und 32bit Daten an 32bit Adressen ausgerichtet sind. Der Compiler kümmert sich automatisch darum.

Die Register für I/O Funktionen sind fast alle 16bit breit, mache haben 32bit.

Der arm-gcc Compiler legt konstante Zeichenketten (im Gegensatz zum avr-gcc) in den Flash Speicher, ohne dafür RAM zu verbrauchen.

Funktionsaufrufe

Bei Funktionsaufrufen werden bis zu 4 Parameter durch Register übergeben. Dabei ist es vorteilhaft, sie als 32bit Typ zu deklarieren, um Konvertierungen zu vermeiden. Bei mehr als 4 Parametern wird das RAM zur Übergabe benutzt, dann sind 8bit, 16bit und 32bit Typen gleich langsam.

Der Rückgabewert einer Funktion wird ebenfalls in einem Register übermittelt und sollte daher 32bit groß sein, falls Geschwindigkeit wichtig ist.

Stack

Der Stapel speichert ausschließlich 32bit Werte. Bei jedem PUSH wird der Stapelzeiger (SP) zuerst um 4 verringert und dann wird das Wort an diese Adresse abgelegt. Der Stapelzeiger zeigt also immer auf die zuletzt belegte Adresse im RAM.

Es gibt zwei Stapelzeiger MSP und PSP, zwischen denen man umschalten kann. Der Prozessor startet mit dem MSP, welcher durch das erste Wort in der Interrupt-Vektor Tabelle (an Adresse 0) initialisiert wird. Der alternative Stapelzeiger PSP wird von Betriebssystemen genutzt, um den Programmen separate Stapel zuzuweisen. Unter dem Namen SP spricht man immer den Stapelzeiger an, der durch das SPEL Bit im CONTROL Register ausgewählt wurde (0=MSP (default), 1=PSP).

Relevante CMSIS Funktionen:

Interrupt-Vektoren

Der Flash-Speicher beginnt immer mit der Exception- und Interrupt-Vektor Liste. Jeder Eintrag in der Liste ist eine 32bit Sprungadresse. Diese ist im Referenzhandbuch Kapitel "Interrupt and exception vectors" dokumentiert.

Der Quelltext dazu befindet sich in der Datei startup/startup_stm32.s. Dort findest du die vorgegebenen Namen der C-Funktionen. Die folgende Tabelle gilt für alle STM32F1 Modelle:

AddressARM Exception Nr.CMSIS Interrupt Nr.ISR Handler FunctionDescription
ARM Processor Exceptions
0x0000Initial value for the stack pointer MSP.
0x0004Reset_HandlerInitial value for the program counter, points to assembler startup code.
0x00082-14NMI_Handler()Non maskable interrupt. The RCC Clock Security System (CSS) is linked to the NMI vector.
0x000C3-13HardFault_Handler()Hardware fault. Can optionally be splitted in the next 3 entries:
0x00104-12MemManage_Handler()Memory protection fault
0x00145-11BusFault_Handler()Pre-fetch or memory access fault
0x00186-10UsageFault_Handler()Undefined instruction, illegal unaligned access, invalid state, division by zero
0x001C7-9reserved
0x00208-8
0x00249-7
0x002810-6
0x002C11-5SVC_Handler()Supervisor Call, triggered by the SVC command (formerly known as SVI). Can be used to call operating system services.
0x003012-4reserved
0x003413-3
0x003814-2PendSV_Handler()Pendable Request for System Service. Triggered by the operating system by writing to the ICSR register, to switch the context.
0x003C15-1SysTick_Handler()Called when the systick timer reaches 0
STM32 Hardware Interrupts
0x00400WWDG_IRQHandler()Window Watchdog
0x00441PVD_IRQHandler()PVD through EXTI Line detection
0x00482TAMPER_IRQHandler()Tamper
0x004C3RTC_IRQHandler()RTC
0x00504FLASH_IRQHandler()Flash
0x00545RCC_IRQHandler()RCC
0x00586EXTI0_IRQHandler()EXTI Line0
0x005C7EXTI1_IRQHandler()EXTI Line1
0x00608EXTI2_IRQHandler()EXTI Line2
0x00649EXTI3_IRQHandler()EXTI Line3
0x006810EXTI4_IRQHandler()EXTI Line4
0x006C11DMA1_Channel1_IRQHandler()DMA1 Channel1
0x007012DMA1_Channel2_IRQHandler()DMA1 Channel2
0x007413DMA1_Channel3_IRQHandler()DMA1 Channel3
0x007814DMA1_Channel4_IRQHandler()DMA1 Channel4
0x007C15DMA1_Channel5_IRQHandler()DMA1 Channel5
0x008016DMA1_Channel6_IRQHandler()DMA1 Channel6
0x008417DMA1_Channel7_IRQHandler()DMA1 Channel7
0x008818ADC1_2_IRQHandler()ADC1 and ADC2
0x008C19USB_HP_CAN_TX_IRQHandler()USB High Priority or CAN TX
0x009020USB_LP_CAN_RX0_IRQHandler()USB Low Priority or CAN RX
0x009421CAN_RX1_IRQHandler()CAN1 RX1
0x009822CAN_SCE_IRQHandler()CAN1 SCE
0x009C23EXTI9_5_IRQHandler()EXTI Line[9:5]
0x00A024TIM1_BRK_IRQHandler()TIM1 Break
0x00A425TIM1_UP_IRQHandler()TIM1 Update
0x00A826TIM1_TRG_COM_IRQHandler()TIM1 Trigger and Commutation
0x00AC27TIM1_CC_IRQHandler()TIM1 Capture Compare
0x00B028TIM2_IRQHandler()TIM2
0x00B429TIM3_IRQHandler()TIM3
0x00B830TIM4_IRQHandler()TIM4
0x00BC31I2C1_EV_IRQHandler()I²C1 event
0x00C032I2C1_ER_IRQHandler()I²C1 error
0x00C433I2C2_EV_IRQHandler()I²C2 event
0x00C834I2C2_ER_IRQHandler()I²C2 error
0x00CC35SPI1_IRQHandler()SPI1
0x00D036SPI2_IRQHandler()SPI2
0x00D437USART1_IRQHandler()USART1
0x00D838USART2_IRQHandler()USART2
0x00DC39USART3_IRQHandler()USART3
0x00E040EXTI15_10_IRQHandler()EXTI Line[15:10]
0x00E441RTCAlarm_IRQHandler()RTC alarm through EXTI line
0x00E842USBWakeup_IRQHandler()USB wakeup from suspend through EXTI line
0x00EC43TIM8_BRK_IRQHandler()Timer 8 Break
0x00F044TIM8_UP_IRQHandler()Timer 8 Update
0x00F445TIM8_TRG_COM_IRQHandler()Timer 8 Trigger and Commutation
0x00F846TIM8_CC_IRQHandler()Timer 8 Capture Compare
0x00FC47ADC3_IRQHandler()ADC3
0x010048FSMC_IRQHandler()FSMC
0x010449SDIO_IRQHandler()SDIO
0x010850TIM5_IRQHandler()TIM5
0x010C51SPI3_IRQHandler()SPI3
0x011052UART4_IRQHandler()UART4
0x011453UART5_IRQHandler()UART5
0x011854TIM6_IRQHandler()TIM6
0x011C55TIM6_IRQHandler()TIM7
0x012056DMA2_Channel1_IRQHandler()DMA2 Channel1
0x012457DMA2_Channel2_IRQHandler()DMA2 Channel2
0x012858DMA2_Channel3_IRQHandler()DMA2 Channel3
0x012C59DMA2_Channel4_5_IRQHandler() or DMA2_Channel4_IRQHandler()DMA2 Channel4 (and Channel 5)
0x013060DMA2_Channel5_IRQHandler()DMA2 Channel5
0x013461ETH_IRQHandler()Ethernet
0x013862ETH_WKUP_IRQHandler()Ethernet Wakeup through EXTI line
0x013C63CAN2_TX_IRQHandler()CAN2 TX
0x014064CAN2_RX0_IRQHandler()CAN2 RX0
0x014465CAN2_RX1_IRQHandler()CAN2 RX1
0x014866CAN2_SCE_IRQHandler()CAN2 SCE
0x014C67OTG_FS_IRQHandler()USB On The Go FS

Über das SCB->VTOR Register kann man den Ort der Liste verändern um sie z.B. ins RAM zu verschieben.

Interrupt Controller

Der Interrupt-Controller NVIC steuert die Verarbeitung von Unterbrechungs-Signalen. Er ist Bestandteil des ARM Kerns.

Solche Signale werden von interner oder externer Hardware ausgelöst, wenn bestimmte Ereignisse auftreten. Sie können dazu genutzt werden, das laufende Programm vorübergehend zu unterbrechen und stattdessen eine besondere Funktion auszuführen, die Interrupt-Handler oder Interrupt-Service-Routine (ISR) genannt wird.

Reset, NMI und HardFault haben immer die höchste Priorität, bei allen anderen kann man die Priorität einstellen. Interrupt-Handler können durch höher priorisierte Interrupts unterbrochen werden.

Die wichtigsten CMSIS Funktionen zur Konfiguration des Interrupt-Systems sind:

Um Unterbrechungen temporär zu verbieten (zum Beispiel für exklusiven Zugriff auf Daten oder Schnittstellen), wird folgende Vorgehensweise empfohlen:

uint32_t backup = __get_PRIMASK();
__set_PRIMASK(1);
... do some work ...
__set_PRIMASK(backup);

Normale Unterbrechungen sind durch Pegel gesteuert. Wenn das Signal auf High steht, wird der zugeordnete Handler möglichst bald ausgeführt. Während der Interrupt-Handler läuft, muss das Signal wieder auf Low zurück zurück gehen, sonst wird der Interrupt-Handler nach seinem Ende gleich wieder aufgerufen.

Wenn das Signal zu früh verschwindet, während der Interrupt-Controller nach einer Gelegenheit sucht, den Interrupt-Handler auszuführen, geht es verloren. Der Interrupt-Handler wird dann nicht ausgeführt.

Extended Interrupts

Die externen Interrupt-Signale und auch einige interne durchlaufen einen erweiterten Schaltkreis, der zusätzliche Konfiguration erfordert. Man erkennt sie am Stichwort EXTI.

Externe Interrupt-Signale von I/O Pins werden sehr flexibel durch die Register SYSCFG->EXTICR[0-3] mit den Kanälen des Interrupt-Controllers verbunden. Die internen Unterbrechungen sind hingegen fest einem Kanal zugeordnet.

Interrupt Flanken

Viele erweiterte Unterbrechungen werden durch Flanken (Signalwechsel) ausgelöst. Man erkennt sie an den Bits im Register EXTI->RTSR oder EXTI->FTSR.

Durch die Verwendung von Flanken ist automatisch sicher gestellt, dass der Handler nicht immer wieder erneut ausgeführt wird, falls ein Interrupt Signal für längere Zeit ansteht.

Flanken gesteuerte Interrupts gehen nicht verloren, wenn das Signal schon wieder verschwindet bevor der Handler aufgerufen wurde. Der Interrupt-Controller merkt sich, dass da mal eine Anforderung vorlag, die noch nicht abgearbeitet wurde.

In diesem Zusammenhang ist das Register EXTI->PR wichtig. Dort merkt sich der Interrupt-Controller den Zustand. Während der Initialisierung muss man das Bit zurück setzen, um sicher zu stellen, dass die erste Flanke zuverlässig erkannt wird. Man schreibt eine 1 in das jeweilige Bit, damit es auf 0 zurück gesetzt wird.

Interrupt Masken

Im Register EXTI->IMR werden Unterbrechungen maskiert. Man muss hier eine 1 in das jeweilige Bit schreiben, damit eine Interrupt-Leitung wirksam wird. Standardmäßig sind die meisten Interrupts maskiert, sind also ohne Wirkung.

Das folgende Beispiel löst einen Interrupt aus, wenn das Signal an PC13 von Low nach High wechselt. Beim Nucleo-Board ist PC13 mit dem blauen Taster verbunden.

#include <stdio.h>
#include "stm32f1xx.h"

// Output a trace message
void ITM_SendString(char *ptr)
{
    while (*ptr)
    {
        ITM_SendChar(*ptr);
        ptr++;
    }
}

void EXTI15_10_IRQHandler()
{
    // Clear pending interrupt flag
    SET_BIT(EXTI->PR, EXTI_PR_PR13);

    // Output a trace message
    ITM_SendString("irq\n");
}

int main(void)
{
    // Enable clock for Port C and alternate functions
    SET_BIT(RCC->APB2ENR, RCC_APB2ENR_IOPCEN + RCC_APB2ENR_AFIOEN);

    // Assign PC13 to EXTI0 with rising edge
    MODIFY_REG(AFIO->EXTICR[3], AFIO_EXTICR4_EXTI13, AFIO_EXTICR4_EXTI13_PC);
    SET_BIT(EXTI->IMR, EXTI_IMR_MR13);
    SET_BIT(EXTI->RTSR, EXTI_RTSR_TR13);
    
    // Enable the interrupt
    NVIC_EnableIRQ(EXTI15_10_IRQn);

    // Clear pending interrupt flag
    SET_BIT(EXTI->PR, EXTI_PR_PR13);

    // Endless loop
    while (1) {}
}

Event Masken

Neben den Unterbrechungen steuert der NVIC auch Ereignisse. Ereignisse verwendet man üblicherweise, um die CPU aus aus einem Wait- oder Sleep- Zustand aufzuwecken. So hält zum Beispiel der Befehl __WFE() die CPU bis zum nächsten Ereignis an. Siehe Absatz Powermanagement.

Standardmäßig sind alle Ereignisse maskiert. Man muss im Register EXTI->EMR das entsprechende Bit auf 1 setzen, um ein EXTI Signal als Ereignis zu behandeln.

Taktgeber

Ich habe ziemlich oft gelesen, dass das komplexe System zur Takterzeugung für Anfänger ein großes Hindernis sei. Das sehe ich anders, denn nach einem Reset wird der Mikrocontroller automatisch mit seinem internen 8 MHz R/C Oszillator getaktet. Damit kann man schon eine Menge sinnvoller Programme schreiben.

Die Taktsignale für den ARM Kern (dazu gehört auch der SysTick Timer), sowie RAM und Flash sind automatisch aktiviert. Alle anderen Komponenten muss man ggf. selbst einschalten, was ganz einfach durch Setzen von Bits in den Registern RCC->APB1ENR, RCC->APB2ENR und RCC->AHBENR erledigt wird.

Jetzt kommt der komplizierte Teil. Der System-Takt (SYSCLK) kann aus folgenden Quellen bezogen werden:

Für Watchog und Echtzeit-Uhr (RTC) sind weitere Quellen vorgesehen:

Mehrere Vorteiler und ein PLL Multiplikator können kombiniert werden, um unterschiedliche Taktfrequenzen zu erreichen. Am besten schaut man sich das mal in CubeMX an. Dort kann man schön sehen, welche Parameter konfigurierbar sind und wie sie zusammen wirken.

Das folgende Bild zeigt die Standardvorgabe vom STM32F100, STM32F101, STM32F102 und STM32F103 nach einem Reset:

 

Bei den Modellen STM32F105 und STM32F107 ist es im unteren Bereich etwas komplexer:

Achtung, kleiner Fallstrick: PLLMUL kann bei den Modellen STM32F100 bis 103 auf 2 bis 16 gestellt werden, aber bei den Modellen STM32F105 und STM32F107 nur auf 4 bis 9.

Wenn man den Systemtakt über 24 MHz erhöht, muss man für den Flash Speicher 1 Wait-State einstellen. Bei mehr als 48 MHz sind 2 Wait-States nötig. Bei mehr als 36 MHz ist außerdem ein Vorteiler für den internen APB1 Bus (auch low-speed I/O genannt) einzustellen. Wenn die PLL bereits aktiv ist, muss man sie vor dem Umkonfigurieren zuerst deaktivieren.

Beispiel für die maximalen möglichen 64 MHz mit dem internen HSI Oszillator (gilt nicht für STM32F105, STM32F107):

// The current clock frequency
uint32_t SystemCoreClock=8000000;

// Change system clock to 64 MHz using internal 8 MHz R/C Oscillator
// Called by Assembler startup code
void SystemInit(void)
{
    // Because the debugger switches PLL on, we may
    // need to switch back to the HSI oscillator without PLL

    // Switch to HSI oscillator
    MODIFY_REG(RCC->CFGR, RCC_CFGR_SW, RCC_CFGR_SW_HSI);

    // Wait until the switch is done
    while ((RCC->CFGR & RCC_CFGR_SWS_Msk) != RCC_CFGR_SWS_HSI) {}

    // Disable the PLL, then we can configure it
    CLEAR_BIT(RCC->CR, RCC_CR_PLLON);
    
    // Flash latency 2 wait states
    MODIFY_REG(FLASH->ACR, FLASH_ACR_LATENCY, FLASH_ACR_LATENCY_1);

    // 64 MHz using the 8 MHz/2 HSI oscillator with 16x PLL, lowspeed I/O runs at 32 MHz
    WRITE_REG(RCC->CFGR, RCC_CFGR_PLLMULL16 + RCC_CFGR_PPRE1_DIV2);

    // Enable PLL
    SET_BIT(RCC->CR, RCC_CR_PLLON);

    // Wait until PLL is ready
    while(!READ_BIT(RCC->CR, RCC_CR_PLLRDY)) {}

    // Select PLL as clock source
    MODIFY_REG(RCC->CFGR, RCC_CFGR_SW, RCC_CFGR_SW_PLL);

    // Update variable
    SystemCoreClock=64000000;
}
Die obige Delay Schleife läuft danach allerdings nicht 8x schneller, sondern nur 6x schneller. Der Grund dafür ist, dass der Flash jetzt mit 2 Waitstates betrieben werden muss und der Prefetch-Buffer (der dies ausgleicht) nur direkt aufeinanderfolgende Befehle optimiert. Bei jeden Rücksprung in der Schleife wird der Prefetch-Buffer geleert.

Durch die Angabe __attribute__((section(".data"))) könnte man Funktionen etwas schneller ohne Waitstate aus dem RAM ausführen, da dieser ohne Waitstates arbeitet.

Beispiel für 72 MHz mit einem 8 MHz Quarz (HSE Oszillator):

// The current clock frequency
uint32_t SystemCoreClock=8000000;

// Change system clock to 72 MHz using 8 MHz crystal
// Called by Assembler startup code
void SystemInit(void)
{
    // Because the debugger switches PLL on, we may
    // need to switch back to the HSI oscillator without PLL

    // Switch to HSI oscillator
    MODIFY_REG(RCC->CFGR, RCC_CFGR_SW, RCC_CFGR_SW_HSI);

    // Wait until the switch is done
    while ((RCC->CFGR & RCC_CFGR_SWS_Msk) != RCC_CFGR_SWS_HSI) {}

    // Disable the PLL, then we can configure it
    CLEAR_BIT(RCC->CR, RCC_CR_PLLON);
    
    // Flash latency 2 wait states
    MODIFY_REG(FLASH->ACR, FLASH_ACR_LATENCY, FLASH_ACR_LATENCY_1);

    // Enable HSE oscillator
    SET_BIT(RCC->CR, RCC_CR_HSEON);

    // Wait until HSE oscillator is ready
    while(!READ_BIT(RCC->CR, RCC_CR_HSERDY)) {}

    // 72 MHz using the 8 MHz HSE oscillator with 9x PLL, lowspeed I/O runs at 36 MHz
    WRITE_REG(RCC->CFGR, RCC_CFGR_PLLSRC + RCC_CFGR_PLLMULL9 + RCC_CFGR_PPRE1_DIV2);

    // Enable PLL
    SET_BIT(RCC->CR, RCC_CR_PLLON);

    // Wait until PLL is ready
    while(!READ_BIT(RCC->CR, RCC_CR_PLLRDY)) {}

    // Select PLL as clock source
    MODIFY_REG(RCC->CFGR, RCC_CFGR_SW, RCC_CFGR_SW_PLL);

    // Update variable
    SystemCoreClock=72000000;
}

SysTick Timer

Alle Cortex-M Prozessoren enthalten einen 24bit Timer, mit dem man die Systemzeit misst. Der Timer zählt die Taktimpulse des Prozessors herunter und löst bei jedem Überlauf einen Interrupt aus. Der Funktionsaufruf SysTick_Config(SystemCoreClock/1000) sorgt dafür, dass jede Millisekunde ein SysTick Interrupt ausgelöst wird.

#include <stdint.h>
#include "stm32f1xx.h"

// The current clock frequency
uint32_t SystemCoreClock=8000000;

// Counts milliseconds
volatile uint32_t systick_count=0;

// Interrupt handler
void SysTick_Handler(void)
{
    systick_count++;
}

// Delay some milliseconds.
// Note that effective time may be up to 1ms shorter than requested.
void delay_ms(int ms)
{
    uint32_t start=systick_count;
    while (systick_count-start<ms);
}

int main(void)
{
    // Initialize the timer for 1 ms intervals
    SysTick_Config(SystemCoreClock/1000);
    
    // Delay 2 seconds
    delay_ms(2000);
    ...
}
Wenn der Prozessor beim Debuggen angehalten wird, hält auch dieser Timer an. Im WFI und WFE Sleep Modus läuft der SysTick Timer weiter.

Digitale Pins

Generell könne alle I/O Pins können erst benutzt werden, nachdem man ihre Taktversorgung im Register RCC->APB2ENR eingeschaltet hat. Dort muss man auch das AFIOEN Bit einschalten, es sei denn man benutzt gar keine alternative Funktion.

Standardmäßig sind fast alle I/O Pins als digitaler Eingang konfiguriert. Um deren Status abzufragen, liest man das jeweilige GPIOx->IDR Register.

Im Register GPIOx->CRL (für Pin 0-7) oder GPIOx->CRH (für Pin 8-15) konfiguriert man einen Pin als Ausgang oder für alternativen Funktionen (wie z.B. serieller Port oder PWM Timer).

Für jeden Ausgang kann man dort die maximale Frequenz auf 2, 10 oder 50 MHz einstellen. Damit beeinflusst man die Geschwindigkeit, mit der die Spannung von Low nach High (und zurück) wechselt. Der maximale Laststrom wird dadurch nicht verändert. Im Sinne von elektromagnetischer Verträglichkeit soll man hier immer den niedrigsten Wert einstellen, der zur Anwendung passt.

Direkte Schreibzugriffe sind über das Register GPIOx->ODR möglich. Um einzelne Pins atomar auf High oder Low zu schalten, verwendet man jedoch das GPIOx->BSRR Register.

Schaue Dir die Beschreibung der GPIO Register CRL, CRH, IDR, ODR und BSRR im Referenzhandbuch an.

Analoge Eingänge

Die Taktfrequenz des Systems wird standardmäßig durch 2 geteilt um den ADC zu betreiben. Er funktioniert mit maximal 14 MHz, daher ist es notwendig den Vorteiler im Register RCC->CFGR zu ändern, wenn der Systemtakt über 28 MHz liegt.

Bevor man einen Pin als analogen Eingang verwendet, muss man ihn im Register GPIOx->CRL (für Pin 0-7) oder GPIOx->CRH (für Pin 8-15) konfigurieren. Zum Beispiel:

// Configure PA1 as analog input ADC12_IN1
MODIFY_REG(GPIOA->CRL, GPIO_CRL_CNF1 + GPIO_CRL_MODE1, 0);

Initialisierung des ADC für einzelne Lesezugriffe:

// Initialize the ADC for single conversion mode
void init_analog()
{
    // Divide APB2 clock frequency by 8
    MODIFY_REG(RCC->CFGR, RCC_CFGR_ADCPRE, RCC_CFGR_ADCPRE_0 + RCC_CFGR_ADCPRE_1);
    
    // Enable clock for ADC
    SET_BIT(RCC->APB2ENR, RCC_APB2ENR_ADC1EN);

    // Switch the ADC on
    SET_BIT(ADC1->CR2, ADC_CR2_ADON);

    // Select software start trigger
    MODIFY_REG(ADC1->CR2, ADC_CR2_EXTSEL, ADC_CR2_EXTSEL_0 + ADC_CR2_EXTSEL_1 + ADC_CR2_EXTSEL_2);

    // Set sample time to 41.5 cycles
    MODIFY_REG(ADC1->SMPR2, ADC_SMPR2_SMP0, ADC_SMPR2_SMP0_2);

    // Delay 20 ms
    delay_ms(20);

    // Start calibration
    SET_BIT(ADC1->CR2, ADC_CR2_ADON + ADC_CR2_CAL);

    // Wait until the calibration is finished
    while (READ_BIT(ADC1->CR2, ADC_CR2_CAL));
}

Lesen eines analogen Eingangs:

// Read from an analog input
uint16_t read_analog(int channel)
{
    // Number of channels to convert: 1
    MODIFY_REG(ADC1->SQR1, ADC_SQR1_L, 0);
    
    // Select the channel
    MODIFY_REG(ADC1->SQR3, ADC_SQR3_SQ1, channel);

    // Clear the finish flag
    CLEAR_BIT(ADC1->SR, ADC_SR_EOC);

    // Start a conversion
    // These two bits must be set by individual commands!
    SET_BIT(ADC1->CR2, ADC_CR2_ADON);
    SET_BIT(ADC1->CR2, ADC_CR2_SWSTART);

    // Wait until the conversion is finished
    while (!READ_BIT(ADC1->SR, ADC_SR_EOC));

    // Return the lower 12 bits of the result
    return ADC1->DR & 0b111111111111;
}

Der ADC kann so konfiguriert werden, dass er mehrere Eingänge kontinuierlich liest. Mittels DMA können die Messergebnisse automatisch ins RAM übertragen werden. Dafür habe ich hier kein Beispiel parat.

PWM Ausgänge

Die Timer 1 bis 8 können jeweils 4 PWM Signale mit maximal 16bit Auflösung (65535 Stufen) erzeugen. Damit kann man z.B. die Helligkeit von Lampen oder die Drehzahl von Motoren steuern.

Die Timer 9 bis 14 haben jeweils nur 2 PWM Kanäle.

Die Taktfrequenz der Timer wird vom Systemtakt abgeleitet und kann durch den ABP2 Prescaler (im Register RCC->CFGR) und den Timer Prescaler TIMx->PSC reduziert werden.

Der Timer zählt fortlaufend von 0 an hoch bis zum Maximum, welches durch das TIMx->ARR Register festgelegt wird. Wenn der Maximalwert als 50000 festgelegt wird, können die Ausgangsimpulse wahlweise 1 bis 50000 Takte breit sein.

Für jeden Ausgang gibt es ein Vergleichs-Register TIMx->CCRy welches bestimmt, wie breit die Ausgangsimpulse sein sollen. Beim Extremwert 0 ist der Ausgang ständig Low. Bei Werten größer dem Maximum (in TIMx->ARR) ist der Ausgang ständig High. Mit der option "inverse polarity" im Register TIMx->CCER können die Ausgänge umgepolt werden, so dass sie Low-Impule liefern.

Das folgende Beispielprogramm benutzt die Ausgänge von Timer 3 (PA6, PA7, PB0 und PB1), um dort vier angeschlossene Leuchtdioden unterschiedlich hell flimmern zu lassen:

#include "stm32f1xx.h"

void init_io()
{
    // Enable Port A, B and alternate functions
    SET_BIT(RCC->APB2ENR, RCC_APB2ENR_IOPAEN + RCC_APB2ENR_IOPBEN + RCC_APB2ENR_AFIOEN);

    // PA6 = Timer 3 channel 1 alternate function output
    MODIFY_REG(GPIOA->CRL, GPIO_CRL_CNF6 + GPIO_CRL_MODE6, GPIO_CRL_CNF6_1 + GPIO_CRL_MODE6_0);

    // PA7 = Timer 3 channel 2 alternate function output
    MODIFY_REG(GPIOA->CRL, GPIO_CRL_CNF7 + GPIO_CRL_MODE7, GPIO_CRL_CNF7_1 + GPIO_CRL_MODE7_0);

    // PB0 = Timer 3 channel 3 alternate function output
    MODIFY_REG(GPIOB->CRL, GPIO_CRL_CNF0 + GPIO_CRL_MODE0, GPIO_CRL_CNF0_1 + GPIO_CRL_MODE0_0);

    // PB1 = Timer 3 channel 4 alternate function output
    MODIFY_REG(GPIOB->CRL, GPIO_CRL_CNF1 + GPIO_CRL_MODE1, GPIO_CRL_CNF1_1 + GPIO_CRL_MODE1_0);
}

void init_timer3_for_pwm()
{
    // Enable timer 3
    SET_BIT(RCC->APB1ENR, RCC_APB1ENR_TIM3EN);

    // Timer 3 channel 1 compare mode = PWM1 with the required preload buffer enabled
    MODIFY_REG(TIM3->CCMR1, TIM_CCMR1_OC1M + TIM_CCMR1_OC1PE, 
        TIM_CCMR1_OC1M_2 + TIM_CCMR1_OC1M_1 + TIM_CCMR1_OC1PE);

    // Timer 3 channel 2 compare mode=PWM1 with the required preload buffer enabled
    MODIFY_REG(TIM3->CCMR1, TIM_CCMR1_OC2M + TIM_CCMR1_OC2PE, 
        TIM_CCMR1_OC2M_2 + TIM_CCMR1_OC2M_1 + TIM_CCMR1_OC2PE);

    // Timer 3 channel 3 compare mode = PWM1 with the required preload buffer enabled
    MODIFY_REG(TIM3->CCMR2, TIM_CCMR2_OC3M + TIM_CCMR1_OC1PE, 
        TIM_CCMR2_OC3M_2 + TIM_CCMR2_OC3M_1 + TIM_CCMR1_OC1PE);

    // Timer 3 channel 4 compare mode = PWM1 with the required preload buffer enabled
    MODIFY_REG(TIM3->CCMR2, TIM_CCMR2_OC4M + TIM_CCMR1_OC1PE, 
       TIM_CCMR2_OC4M_2 + TIM_CCMR2_OC4M_1 + TIM_CCMR1_OC1PE);

    // Timer 3 enable all four compare outputs
    SET_BIT(TIM3->CCER, TIM_CCER_CC1E + TIM_CCER_CC2E + TIM_CCER_CC3E + TIM_CCER_CC4E);

    // Timer 3 inverse polarity for all four compare outputs
    // SET_BIT(TIM3->CCER, TIM_CCER_CC1P + TIM_CCER_CC2P + TIM_CCER_CC3P + TIM_CCER_CC4P);
   
    // Timer 3 auto reload register, defines the maximum value of the counter in PWM mode.
    TIM3->ARR = 50000; // 8000000/50000 = 160 pulses per second
    
    // Timer 3 clock prescaler, the APB2 clock is divided by this value +1.
    TIM3->PSC = 0; // divide clock by 1 

    // Timer 3 enable counter and auto-preload
    SET_BIT(TIM3->CR1, TIM_CR1_CEN + TIM_CR1_ARPE);
}

int main(void)
{
    init_io();
    init_timer3_for_pwm();

    // set PWM pulse width of all four outputs
    TIM3->CCR1 = 40;
    TIM3->CCR2 = 400;
    TIM3->CCR3 = 4000;
    TIM3->CCR4 = 40000; 
}

Die Timer 1 und 8 können komplementäre Ausgangssignale mit Tot-Zeit erzeugen, was für den Eigenbau von H-Brücken nützlich ist. Allerdings kollidieren die Ausgänge vom Timer 1 teilweise mit dem USB Port und der Timer 8 existiert nur bei den größeren High und XL Density Modellen.

Ich möchte darauf hinweisen, dass die Timer noch viele weitere Funktionen haben, die ich hier gar nicht alle zeigen kann. Mehr Informationen dazu gibt es zum Beispiel in der Application Note AN4776.

USART Schnittstelle

Der interne HSI Oszillator ist häufig aber nicht immer stabil genug, um die USART Schnittstellen zu betreiben. Es empfiehlt sich daher, auf eine externe Quelle (HSE) umzuschalten. In dem folgenden Beispiel nutze ich der Einfachheit halber trotzdem den internen HSI Oszillator.

Je nach Taktfrequenz der Peripherie sind unterschiedliche Baudraten möglich:

Beim Nucleo-64 Board ist die serielle Schnittstelle USART2 mit dem ST-Link Adapter verbunden, der diese wiederum über USB an einen virtuellen COM Port weiter leitet:

ST-Link CN3STM32F1 USART2Beschreibung
TxDRxD (=PA3)Daten
RxDTxD (=PA2)Daten
GND GNDGemeinsame Masse

Der ST-Link v2.1 unterstützt 600 bis 2000000 Baud.

Das folgende Beispielprogramm gibt "Hello World!" auf USART2 aus und schickt danach alle empfangenen Zeichen als echo an den PC zurück. Das Senden findet hier direkt statt (ggf. mit Warteschleife) während der Empfang interrupt-gesteuert stattfindet:

#include <stdio.h>
#include "stm32f1xx.h"

uint32_t SystemCoreClock=8000000;

// Redirect standard output to the serial port
int _write(int file, char *ptr, int len)
{
    for (int i=0; i<len; i++)
    {
        while(!(USART2->SR & USART_SR_TXE));
        USART2->DR = *ptr++;
    }
    return len;
}

// called after each received character
void USART2_IRQHandler(void)
{
    char received=USART2->DR;

    // send echo back
    while(!(USART2->SR & USART_SR_TXE));
    USART2->DR = received;
}

int main(void)
{
    // Enable clock for Port A, alternate functions and USART2
    SET_BIT(RCC->APB2ENR, RCC_APB2ENR_IOPAEN + RCC_APB2ENR_AFIOEN);
    SET_BIT(RCC->APB1ENR, RCC_APB1ENR_USART2EN);

    // PA2 (TxD) shall use the alternate function with push-pull
    MODIFY_REG(GPIOA->CRL, GPIO_CRL_CNF2 + GPIO_CRL_MODE2, GPIO_CRL_CNF2_1 + GPIO_CRL_MODE2_1);

    // Enable transmitter, receiver and receive-interrupt of USART2
    USART2->CR1 = USART_CR1_UE + USART_CR1_TE + USART_CR1_RE + USART_CR1_RXNEIE;

    // Set baudrate
    USART2->BRR = (SystemCoreClock / 115200);

    // Enable interrupt in NVIC
    NVIC_EnableIRQ(USART2_IRQn);

    printf("Hello World!\n");
    while (1) {};
}

I²C Bus

Der I²C Bus ist eine beliebte Schnittstelle für die Anbindung von Peripherie über kurze Leitungen, wie Port-Erweiterungen, Sensoren und Batterie-Management. Siehe Spezifikation von Philips/NXP.

Der Bus besteht aus den beiden Leitungen SDA und SCL. An beide Leitungen gehört jeweils ein Pull-Up Widerstand, typischerweise mit 4,7 kΩ bei 5 V oder 2,7 kΩ bei 3,3 V. Die STM32F1 Mikrocontroller haben zwei I²C Busse, beide unterstützen 3,3 V und 5 V Pegel, aber nur wenige Slaves sind so flexibel.

SignalI2C1 normalI2C1 remappedI2C2
SCL TaktPB6PB8PB10
SDA DatenPB7PB9PB11

Zum Remappen kann man das Bit I2C1_REMAP im Register AFIO->MAPR setzen. Nach der Initialisierung der I²C Schnittstelle (nicht vorher!) muss man die betroffen I/O Pins im Register GPIOB->CRL bzw. GPIOB->CRH als "Alternate function output open-drain 2 MHz" konfigurieren.

Normalerweise hat man einen zentralen Master, der viele Slaves ansteuert. Jeder Slave hat eine eigene eindeutige 7bit Adresse. Innerhalb einer Transaktion kann der Master 0 oder mehr Bytes an den Slave senden und danach 0 oder mehr Bytes vom Slave empfangen. Der folgende Code kann dazu für den Master verwendet werden:

#include <stdint.h>
#include <stdbool.h>
#include "stm32f1xx.h"


/**
 * Initialize the I²C interface.
 *
 * @param registerStruct May be either I2C1 (SCL=PB6, SDA=PB7) or I2C2 (SCL=PB10, SDA=PB11)
 * @param remap Whether to remap I2C1 to the alternative pins (SCL=PB8, SDA=PB9).
 * @param fastMode false=100 kHz, true=400 kHz
 * @param apb1_clock clock frequency of APB1 peripherals
 */
void i2c_init(I2C_TypeDef* registerStruct, bool remap, bool fastMode, uint32_t apb1_clock)
{
    // Enable clock for Port B and alternate functions
    SET_BIT(RCC->APB2ENR, RCC_APB2ENR_IOPBEN + RCC_APB2ENR_AFIOEN);
    
    // Enable clock for the I2C interface
    if (registerStruct==I2C1)
    {
        SET_BIT(RCC->APB1ENR, RCC_APB1ENR_I2C1EN);
    }
    else if (registerStruct==I2C2)
    {
        SET_BIT(RCC->APB1ENR, RCC_APB1ENR_I2C2EN);
    }
    
    // Disable the peripheral
    CLEAR_BIT(registerStruct->CR1, I2C_CR1_PE);

    // Configure timing
    MODIFY_REG(registerStruct->CR2, I2C_CR2_FREQ, apb1_clock/1000000);
    if (fastMode)
    {
        MODIFY_REG(registerStruct->CCR, I2C_CCR_CCR, apb1_clock/800000);
        MODIFY_REG(registerStruct->TRISE, I2C_TRISE_TRISE, apb1_clock/4000000+1);
    }
    else
    {
        MODIFY_REG(registerStruct->CCR, I2C_CCR_CCR, apb1_clock/200000);
        MODIFY_REG(registerStruct->TRISE, I2C_TRISE_TRISE, apb1_clock/1000000+1);
    }

    // Enable the peripheral
    SET_BIT(registerStruct->CR1, I2C_CR1_PE);

    // Configure the I/O pins for alternate function open-drain 2 MHz
    if (registerStruct==I2C1)
    {
        if (remap)
        {
            // PB8=SCL, PB9=SDA
            SET_BIT(AFIO->MAPR, AFIO_MAPR_I2C1_REMAP);
            MODIFY_REG(GPIOB->CRH, GPIO_CRH_CNF8 + GPIO_CRH_MODE8, GPIO_CRH_CNF8_0 + GPIO_CRH_CNF8_1 + GPIO_CRH_MODE8_1);
            MODIFY_REG(GPIOB->CRH, GPIO_CRH_CNF9 + GPIO_CRH_MODE9, GPIO_CRH_CNF9_0 + GPIO_CRH_CNF9_1 + GPIO_CRH_MODE9_1);
        }
        else
        {
            // PB6=SCL, PB7=SDA
            CLEAR_BIT(AFIO->MAPR, AFIO_MAPR_I2C1_REMAP);
            MODIFY_REG(GPIOB->CRL, GPIO_CRL_CNF6 + GPIO_CRL_MODE6, GPIO_CRL_CNF6_0 + GPIO_CRL_CNF6_1 + GPIO_CRL_MODE6_1);
            MODIFY_REG(GPIOB->CRL, GPIO_CRL_CNF7 + GPIO_CRL_MODE7, GPIO_CRL_CNF7_0 + GPIO_CRL_CNF7_1 + GPIO_CRL_MODE7_1);
        }
    }
    else if (registerStruct==I2C2)
    {
        // PB10=SCL, PB11=SDA
        MODIFY_REG(GPIOB->CRH, GPIO_CRH_CNF10 + GPIO_CRH_MODE10, GPIO_CRH_CNF10_0 + GPIO_CRH_CNF10_1 + GPIO_CRH_MODE10_1);
        MODIFY_REG(GPIOB->CRH, GPIO_CRH_CNF11 + GPIO_CRH_MODE11, GPIO_CRH_CNF11_0 + GPIO_CRH_CNF11_1 + GPIO_CRH_MODE11_1);
    }
}


/**
 * Perform an I²C transaction, which sends 0 or more data bytes, followed by receiving 0 or more data bytes.
 *
 * @param registerStruct May be either I2C1 or I2C2
 * @param slave_addr 7bit slave_addr (will be shifted within this function)
 * @param send_buffer Points to the buffer that contains the data bytes that shall be sent (may be 0 if not used)
 * @param send_size Number of bytes to send
 * @param receive_buffer Points to the buffer that will be filled with the received bytes (may be 0 if not used)
 * @param receive_size Number of bytes to receive
 * @return Number of received data bytes, or -1 if sending failed
 */
int i2c_communicate(I2C_TypeDef* registerStruct, uint8_t slave_addr, 
    void* send_buffer, int send_size, void* receive_buffer, int receive_size)
{
    int receive_count=-1;

    // shift the 7bit address to the right position
    slave_addr=slave_addr<<1;

    // Send data
    if (send_size>0)
    {
        // Send START and slave address
        SET_BIT(registerStruct->CR1, I2C_CR1_START);                     // send START condition
        while (!READ_BIT(registerStruct->SR1, I2C_SR1_SB));              // wait until START has been generated
        WRITE_REG(registerStruct->DR,slave_addr);                        // send slave address
        while (!READ_BIT(registerStruct->SR1, I2C_SR1_ADDR))             // wait until address has been sent
        {
            if (READ_BIT(registerStruct->SR1, I2C_SR1_AF))
            {
                // did not receive ACK after address
                goto error;
            }
        }

        READ_REG(registerStruct->SR2);                                   // clear ADDR
        while (send_size>0)
        {
            WRITE_REG(registerStruct->DR,*((uint8_t*)send_buffer));      // send 1 byte from buffer
            while (!READ_BIT(registerStruct->SR1, I2C_SR1_TXE))          // wait until Tx register is empty
            {
                if (READ_BIT(registerStruct->SR1, I2C_SR1_AF))
                {
                    // did not receive ACK after data byte
                    goto error;
                }
            }
            send_buffer++;
            send_size--;
        }
        while (!READ_BIT(registerStruct->SR1, I2C_SR1_BTF))              // wait until last byte transfer has finished
        {
            if (READ_BIT(registerStruct->SR1, I2C_SR1_AF))
            {
                // did not receive ACK after data byte
                goto error;
            }
        }
    }
    
    // Sending succeeded, start counting the received bytes
    receive_count=0;

    CLEAR_BIT(registerStruct->CR1, I2C_CR1_POS);                         // POS=0
    SET_BIT(registerStruct->CR1, I2C_CR1_ACK);                           // acknowledge each byte

    // Receive data
    // The procedure includes workaround as described in AN2824
    if (receive_size>0)
    {
        // Send (RE-)START and slave address
        SET_BIT(registerStruct->CR1, I2C_CR1_START);                      // send START condition
        while (!READ_BIT(registerStruct->SR1, I2C_SR1_SB));               // wait until START has been generated
        WRITE_REG(registerStruct->DR,slave_addr+1);                       // send slave address + read mode
        while (!READ_BIT(registerStruct->SR1, I2C_SR1_ADDR))              // wait until address has been sent
        {
            if (READ_BIT(registerStruct->SR1, I2C_SR1_AF))
            {
                // did not receive ACK after address
                goto error;
            }
        }

        if (receive_size>2)
        {
            READ_REG(registerStruct->SR2);                                // clear ADDR
            while (receive_size>3)
            {
                while (!READ_BIT(registerStruct->SR1, I2C_SR1_RXNE));     // wait until a data byte has been received
                *((uint8_t*)receive_buffer)=READ_REG(registerStruct->DR); // read data
                receive_size--;
                receive_count++;
                receive_buffer++;
            }
            while (!READ_BIT(registerStruct->SR1, I2C_SR1_BTF));          // wait until 2 bytes are received
            CLEAR_BIT(registerStruct->CR1, I2C_CR1_ACK);                  // prepare to send a NACK
            *((uint8_t*)receive_buffer)=READ_REG(registerStruct->DR);     // read the penultimate data byte
            receive_size--;
            receive_count++;
            receive_buffer++;
            __disable_irq();
            {
                SET_BIT(registerStruct->CR1, I2C_CR1_STOP);               // prepare to send a STOP condition
                *((uint8_t*)receive_buffer)=READ_REG(registerStruct->DR); // read the last data byte
                receive_size--;
                receive_count++;
                receive_buffer++;
            }
            __enable_irq();
        }
        else if (receive_size==2)
        {
            SET_BIT(registerStruct->CR1, I2C_CR1_POS);                    // NACK shall be applied to the next 
                                                                             // byte, not the current byte
            __disable_irq();
            {
                READ_REG(registerStruct->SR2);                            // clear ADDR
                CLEAR_BIT(registerStruct->CR1, I2C_CR1_ACK);              // prepare to send a NACK
            }
            __enable_irq();
            while (!READ_BIT(registerStruct->SR1, I2C_SR1_BTF));          // wait until 2 bytes are received
            __disable_irq();
            {
                SET_BIT(registerStruct->CR1, I2C_CR1_STOP);               // prepare to send a STOP condition
                *((uint8_t*)receive_buffer)=READ_REG(registerStruct->DR); // read the penultimate data byte
                receive_size--;
                receive_count++;
                receive_buffer++;
             }
            __enable_irq();
        }
        else if (receive_size==1)
        {
            CLEAR_BIT(registerStruct->CR1, I2C_CR1_ACK);                  // prepare to send a NACK
            __disable_irq();
            {
                READ_REG(registerStruct->SR2);                            // clear ADDR
                SET_BIT(registerStruct->CR1, I2C_CR1_STOP);               // prepare to send a STOP condition
            }
            __enable_irq();
            while (!READ_BIT(registerStruct->SR1, I2C_SR1_RXNE));         // wait until a data byte has been received
        }

        *((uint8_t*)receive_buffer)=READ_REG(registerStruct->DR);         // read the last data byte
        receive_size--;
        receive_count++;
        receive_buffer++;
        while (READ_BIT(registerStruct->SR1, I2C_CR1_STOP));              // wait until STOP has been generated
    }

    else if (receive_size==0 && send_size>0)
    {
        SET_BIT(registerStruct->CR1, I2C_CR1_STOP);                       // send STOP condition
        while (READ_BIT(registerStruct->CR1, I2C_CR1_STOP));              // wait until STOP has been generated
    }

    return receive_count;

    error:
    SET_BIT(registerStruct->CR1, I2C_CR1_STOP);                           // send STOP condition
    while (READ_BIT(registerStruct->CR1, I2C_CR1_STOP));                  // wait until STOP has been generated
    CLEAR_BIT(registerStruct->CR1, I2C_CR1_PE);                           // restart the I2C interface clear all error flags
    SET_BIT(registerStruct->CR1, I2C_CR1_PE);
    //ITM_SendString("I2C bus error!\n");
    return receive_count;
}


int main(void)
{
    // Initialize I2C1, no pin remapping, no fast mode, APB1 clock is 8 MHz
    i2c_init(I2C1, false, false, 8000000);

    // Send and receive buffer
    uint8_t send_buffer[4]={10,20,30,40};
    uint8_t receive_buffer[9];

    // Communicate with slave address 8: send 4 bytes, then receive 9 bytes
    int received=i2c_communicate(I2C1, 8, send_buffer, 4, receive_buffer, 9);
}
Tut mir leid, dass der Code so komplex geworden ist. Die I²C Schnittstelle des STM32F1 ist leider ziemlich doof.

Wenn der Slave beim Senden unerwartet mit NACK Antwortet, bricht die Funktion ab. Wenn die SCL oder SDA Leitung auf Low Pegel hängen bleibt (zum Beispiel aufgrund fehlender Pull-Up Widerstände), bleibt die Funktion in einer endlosen Warteschleife hängen. Mit Interrupts kann man das sicher noch etwas eleganter machen.

USB Schnittstelle

Die USB Schnittstelle erfordert ein umfangreiches Softwarepaket. Beinahe alle Programmierer binden daher fertige Implementierungen in ihr Programm ein.

Die USB Schnittstelle funktioniert Interrupt-getrieben. Immer wenn die Hardware ein kleines Datenpaket gesendet oder empfangen hat, löst sie einen Interrupt aus. Der Interrupthandler hat die Aufgabe, Anfragen des Host zu beantworten und Nutzdaten mit dem Pufferspeicher auszutauschen. Wenn man den Mikrocontroller beim Debuggen anhält, fällt die USB Schnittstelle sofort aus.

USB und CAN schließen sich gegenseitig aus, man kann nur eine davon gleichzeitig nutzen.

Der Systemtakt muss entweder 48 MHz oder 72 MHz betragen und aus einem Quarz gewonnen werden. Der USB Clock Prescaler wird dementsprechend auf 1 oder 1,5 gestellt, um die USB Schnittstelle mit 48 MHz zu takten.

Die USB Buchse wird mit PA11 (D-) und PA12 (D+) verbunden. Es ist nicht nötig, den Modus (in, out, alternative) dieser Pins zu konfigurieren.

An D+ gehört ein 1,5 kΩ Pull-Up Widerstand auf 3,3 V, welcher dem Host Computer signalisiert, dass ein Gerät angeschlossen wurde. Manche Boards schalten den Widerstand mit einen I/O Pin ein. Dadurch kann man den Host Computer dazu bringen, das USB Gerät erneut zu erkennen, ohne das Kabel abstecken zu müssen.

Beim "Maple Mini" Board schaltet PB9=High den Widerstand aus. Beim "Blue Pill" Board ist der Widerstand fest mit 3,3 V verbunden. Darum muss man bei diesem Board das USB Kabel nach jedem Reset abstecken und wieder anschließen.

Virtueller COM-Port mit Cube HAL

Auf der Webseite von STM gibt es den "STM32 Virtual COM Port Driver" zum Herunterladen, aber den braucht man gar nicht, da alle aktuellen Betriebssysteme den CDC Standardtreiber bereits enthalten.

Mit dem Programm CubeMX kann man sich ein Projekt mit USB Unterstützung zusammenklicken. Das geht so:

Probiere das Programm zunächst ohne Änderungen aus. Der PC sollte im Gerätemanager einen neuen virtuellen COM Anschluss mit dem Namen "Serielles USB-Gerät (COMx)" oder "STMicroelectronics Virtual COM Port (COMx)" anzeigen.

Um Text vom Mikrocontroller an den PC zu senden, füge im Quelltext von main.c folgendes zwischen die genannten Markierungen ein:

/* USER CODE BEGIN Includes */

#include "usbd_cdc_if.h"

/* USER CODE END Includes */

...

  /* USER CODE BEGIN WHILE */
  while (1)
  {
  /* USER CODE END WHILE */

  /* USER CODE BEGIN 3 */

        // LED On
        HAL_GPIO_WritePin(LED_GPIO_Port,LED_Pin,GPIO_PIN_SET);
        HAL_Delay(500);

        // LED Off
        HAL_GPIO_WritePin(LED_GPIO_Port,LED_Pin,GPIO_PIN_RESET);
        HAL_Delay(500);

        // Send data
        char msg[]="Hallo!";
        CDC_Transmit_FS( (uint8_t*) msg, strlen(msg));

  }
  /* USER CODE END 3 */

Diese Variante belegt etwa 20 kB Flash und 5 kB RAM. Davon dienen jeweils 1 kB als Sendepuffer und Empfangspuffer (kann man ändern). ie Ausgabe kann man mit einem Terminal-Programm (Baudrate ist egal) anzeigen oder unter Linux mit dem Befehl: cat /dev/ttyACM0.

Damit die Ausgabefunktionen der Standard C Library (z.B. printf, puts, putchar) auf USB geleitet werden, kannst du folgende Funktion implementieren:

// Redirect standard output to the USB port
int _write(int file, char *ptr, int len)
{
    CDC_Transmit_FS( (uint8_t*) ptr, len);
    return len;
}

Virtueller COM-Port ohne Cube HAL

Der Benutzer W.S. hat im mikrocontroller.net Forum eine USB CDC Implementierung zur freien Verwendung veröffentlicht, die ebenfalls ohne Treiberinstallation funktioniert. Der Quelltext ist sehr kompakt - nur zwei Dateien ohne weitere Anhängigkeiten. Ich habe diesen Code für das Blue-Pill Board und Nucleo-F103RB Board angepasst und in ein Projekt für die System Workbench eingebaut. Das "Atollic TrueStudio" und die "STM32 Cube IDE" können es importieren.

Achtung: Dieser Code passt nicht zu den Modellen F105 und F107, denn die haben eine andere USB Schnittstelle.

Das Programm lässt die LED an Anschluss PC13 jede Sekunde aufblitzen und sendet dabei "Hello World!" über USB an den angeschlossenen Computer. Es belegt nur 5,2 kB Flash und 600 Bytes RAM. Davon dienen jeweils 256 Byte als Sendepuffer und Empfangspuffer (kann man ändern).

#include "stm32f1xx.h"
#include "usb.h"

// The current clock frequency
uint32_t SystemCoreClock=8000000;

// Counts milliseconds
volatile uint32_t systick_count=0;

// Interrupt handler
void SysTick_Handler(void)
{
    systick_count++;
}

// Delay some milliseconds
// Note that effective time may be up to 1ms shorter than requested.
void delay_ms(int ms)
{
    uint32_t start=systick_count;
    while (systick_count-start<ms);
}

// Change system clock to 48 MHz using 8 MHz crystal
// Called by Assembler startup code
void SystemInit(void)
{
    // Because the debugger switches PLL on, we may
    // need to switch back to the HSI oscillator without PLL

    // Switch to HSI oscillator
    MODIFY_REG(RCC->CFGR, RCC_CFGR_SW, RCC_CFGR_SW_HSI);

    // Wait until the switch is done
    while ((RCC->CFGR & RCC_CFGR_SWS_Msk) != RCC_CFGR_SWS_HSI) {}

    // Disable the PLL, then we can configure it
    CLEAR_BIT(RCC->CR, RCC_CR_PLLON);
    
    // Flash latency 1 wait state
    MODIFY_REG(FLASH->ACR, FLASH_ACR_LATENCY, FLASH_ACR_LATENCY_0);

    // Enable HSE oscillator
    SET_BIT(RCC->CR, RCC_CR_HSEON);

    // Wait until HSE oscillator is ready
    while(!READ_BIT(RCC->CR, RCC_CR_HSERDY)) {}

    // 48 MHz using the 8 MHz HSE oscillator with 6x PLL, lowspeed I/O runs at 24 MHz
    WRITE_REG(RCC->CFGR, RCC_CFGR_PLLSRC + RCC_CFGR_PLLMULL6 + RCC_CFGR_PPRE1_DIV2);

    // Enable PLL
    SET_BIT(RCC->CR, RCC_CR_PLLON);

    // Wait until PLL is ready
    while(!READ_BIT(RCC->CR, RCC_CR_PLLRDY)) {}

    // Select PLL as clock source
    MODIFY_REG(RCC->CFGR, RCC_CFGR_SW, RCC_CFGR_SW_PLL);

    // Set USB prescaler to 1 (skip in case of 72 MHz)
    MODIFY_REG(RCC->CFGR, RCC_CFGR_USBPRE, RCC_CFGR_USBPRE);

    // Update variable
    SystemCoreClock=48000000;
}

void init_io()
{
    // Enable USB
    SET_BIT(RCC->APB1ENR, RCC_APB1ENR_USBEN);

    // Enable Port A and C
    SET_BIT(RCC->APB2ENR, RCC_APB2ENR_IOPAEN + RCC_APB2ENR_IOPCEN);

    // PC13 = Output for the LED
    MODIFY_REG(GPIOC->CRH, GPIO_CRH_CNF13 + GPIO_CRH_MODE13, GPIO_CRH_MODE13_0);
}

int main(void)
{
    // Initialize system timer
    SysTick_Config(SystemCoreClock/1000);
    
    init_io();
    UsbSetup();
    
    while (1)
    {
        // LED On
        WRITE_REG(GPIOC->BSRR,GPIO_BSRR_BR13);
        delay_ms(100);

        UsbStrOut("Hello World!");

        // LED Off
        WRITE_REG(GPIOC->BSRR,GPIO_BSRR_BS13);
        delay_ms(1000);
    }
}

Die Ausgabe kann man mit einem Terminal-Programm (Baudrate ist egal) anzeigen oder unter Linux mit dem Befehl: cat /dev/ttyACM0.

Nach der Initialisierung mittels UsbSetup() wird die Funktion UsbCharOut() oder UsbStrOut() benutzt, um Zeichen zu senden. UsbSetup setzt voraus, dass der Systemtakt bereits korrekt konfiguriert ist. Die entsprechenden Zeilen habe ich oben fett hervorgehoben.

Für fortgeschrittene Programmierer hat Niklas Gürtler das USB-Tutorial mit STM32 im mikrocontroller.net Forum geschrieben. Er beschreibt dort detailliert, wie die USB Schnittstelle funktioniert. Dort stellt er als Anwendungsbeispiel einen nützlichen 3-Fach USB-UART Adapter vor, den ich für die Eclipse basierten Entwickungsumgebungen und das Blue-Pill Board angepasst habe.

Echtzeituhr

Die RTC kann dazu verwendet werden, um eine Uhr zu bauen. Technisch gesehen handelt es sich nur um einen simplen batteriebetriebenen Zähler mit 32 kHz Quarz-Oszillator, der üblicherweise genauer läuft, als der Systemtakt. Ein einstellbarer Vorteiler erzeugt den Sekunden-Takt, dahinter kommt ein 32bit Zähler. Uhrzeit und Datum muss man ggf. per Software anhand des Zählerstandes berechnen.

Nach einem Stromausfall ohne bzw. mit leerer Batterie werden die Zähler automatisch auf 0 gesetzt und die Uhr angehalten.

Neben der Uhr enthält die batteriegepufferte Einheit auch 10 so genannte Backup Register (mit je 16bit Breite) wo man an Daten ablegen kann. Das letzte Backup Register Nr. 9 ist für den Bootloader reserviert.

Der LSE Oszillator nutzt nur sehr wenig Energie und ist daher bei falscher Beschaltung störanfällig. Die Leitungen zum sorgfältig ausgewählten Quarz sollen so kurz wie möglich sein und die Kapazitäten müssen genau berechnet werden.

Der Anschluss PC13 wird ebenfalls durch den Low-Power Schaltkreis der RTC versorgt, also auch durch die Backup Batterie. Er soll daher nur mit niedriger Frequenz geschaltet werden und bei High Pegel nicht belastet werden.

RTC Initialisieren

Dieses Beispiel initialisiert die RTC so, dass jede Sekunde ein Interrupt aufgerufen wird. In der ISR wird die LED an Port PA5 getoggelt, so dass sie blinkt.
#include "stm32f1xx.h"

void init_io()
{
    // Enable Port A
    SET_BIT(RCC->APB2ENR, RCC_APB2ENR_IOPAEN);

    // PA5 = Output
    MODIFY_REG(GPIOA->CRL, GPIO_CRL_CNF5 + GPIO_CRL_MODE5, GPIO_CRL_MODE5_0);
}

void initRtc()
{
    // Enable the backup domain
    SET_BIT(RCC->APB1ENR, RCC_APB1ENR_BKPEN + RCC_APB1ENR_PWREN);

    // Enable write access to the backup domain
    SET_BIT(PWR->CR, PWR_CR_DBP);

    // Enable LSE oscillator
    SET_BIT(RCC->BDCR, RCC_BDCR_LSEON);

    // Wait until LSE oscillator is ready
    while(!READ_BIT(RCC->BDCR, RCC_BDCR_LSERDY)) {}

    // Select LSE as clock source for the RTC
    MODIFY_REG(RCC->BDCR, RCC_BDCR_RTCSEL, RCC_BDCR_RTCSEL_LSE);

    // Enable the RTC
    SET_BIT(RCC->BDCR, RCC_BDCR_RTCEN);

    // Wait until RTC is synchronized
    while(!READ_BIT(RTC->CRL, RTC_CRL_RSF)) {}

    // Wait until last write operation is done
    while(!READ_BIT(RTC->CRL, RTC_CRL_RTOFF)) {}

    // Enable second interrupt
    SET_BIT(RTC->CRH,RTC_CRH_SECIE);

    // Wait until last write operation is done
    while(!READ_BIT(RTC->CRL, RTC_CRL_RTOFF)) {}

    // Enter configuration mode
    SET_BIT(RTC->CRL,RTC_CRL_CNF);

    // Divide oscillator frequency by 32767+1 to get seconds
    RTC->PRLL=32767;
    RTC->PRLH=0;

    // Leave configuration mode
    CLEAR_BIT(RTC->CRL,RTC_CRL_CNF);

    // Wait until last write operation is done
    while(!READ_BIT(RTC->CRL, RTC_CRL_RTOFF)) {}

    // Enable interrupt in NVIC
    NVIC_EnableIRQ(RTC_IRQn);
}

void RTC_IRQHandler(void)
{
    // Clear interrupt flag
    CLEAR_BIT(RTC->CRL,RTC_CRL_SECF);

    // Note: After clearing the interrupt flag, give the RTC at
    // least 5 clock cycles time before leaving the ISR, otherwise 
    // the ISR gets executed twice.

    // Toggle LED
    GPIOA->ODR ^= GPIO_ODR_ODR5;
}

int main(void)
{
    init_io();
    initRtc();
    while(1){};
}

In der Interrupt-Vektor Tabelle in startup/startup_stm32.s muss ein Eintrag für den "RTC_IRQHandler" hinzugefügt werden, falls nicht vorhanden.

RTC lesen

Das Auslesen der Uhrzeit (also des Sekundenzählers) erfordert zwei Lesezugriffe zu je 16 bit. Es kann passieren, dass der Zähler zwischen den beiden Lesezugriffen verändert wird, was zu völlig falschen Ergebnissen führt. Um diesen Fehler sicher zu umgehen, liest man den Sekundenzähler wiederholt aus, bis man zweimal hintereinander den selben Wert erhält.
uint32_t read_rtc()
{
    // Wait until RTC is synchronized
    while(!READ_BIT(RTC->CRL, RTC_CRL_RSF)) {}

    // Repeat until got 2x the same value.
    uint32_t old=0;
    uint32_t new=0;
    do
    {
        old=new;
        new = (((uint32_t) RTC->CNTH) << 16) | ((uint32_t)RTC->CNTL);        
    }
    while (old != new);
    return new;
}

RTC beschreiben

Beim Schreiben verlangt die RTC folgende Prozedur:
void update_rtc(uint32_t seconds)
{
    // Wait until last write operation is done
    while(!READ_BIT(RTC->CRL, RTC_CRL_RTOFF)) {}

    // Enter configuration mode
    SET_BIT(RTC->CRL,RTC_CRL_CNF);

    RTC->CNTH = (uint16_t)(seconds >> 16);
    RTC->CNTL = (uint16_t)(seconds & 0xFFFF);

    // Leave configuration mode
    CLEAR_BIT(RTC->CRL,RTC_CRL_CNF);

    // Wait until last write operation is done
    while(!READ_BIT(RTC->CRL, RTC_CRL_RTOFF)) {}
}

RTC Kalibrieren

Ohne Kalibrierung stellt man den Vorteiler wie oben gezeigt auf 32767, die Frequenz des Quarzes wird dann durch 32767+1 geteilt. Meine Blue-Pill Boards hatten dabei 1-2 Sekunden Abweichung pro Tag. Sollte deine Uhr ohne Kalibrierung um mehr als 5 Sekunden pro Tag abweichen, liegt mit Sicherheit ein Hardwarefehler vor.

Um die Uhr ohne teure Messinstrumente grob zu kalibrieren lässt man sie einige Tage lang laufen und ermittelt dabei ihre Abweichung von der soll-Geschwindigkeit durch Vergleich mit einem präzisen Zeitserver.

Dann verringert man ggf. den Vorteiler RTC->PRLL so weit, dass die Uhr gerade eben etwas zu schnell läuft. Jede Verringerung um 1 macht die Uhr 2,637 Sekunden pro Tag schneller. Anschließend stellt man im Register BKP->RTCCR einen Korrekturwert (0-127) ein, wobei jede Stufe die Uhr um 0,082s pro Tag verlangsamt.

Wenn die Uhr zum Beispiel 4 Sekunden pro Tag zu langsam wäre, würde man den Vorteiler um 2 verringern und dann den Korrekturwert auf 15 stellen:

Abweichung:                         4,000 Sekunden
Vorteiler:          2 * -2,637 =   -5,274 Sekunden  (setze RTC->PRLL = 32767 - 2)
Korrekturwert:     15 * +0,082 =   +1,230 Sekunden  (setze BKP->RTCCR = 15)
==================================================
Summe:                             -0,044 Sekunden
Es bleibt eine Ungenauigkeit von -0,044 Sekunden pro Tag übrig.

Power Management

Indem man Taktsignale für I/O Funktionen deaktiviert oder verlangsamt, spart man bereits eine Menge Strom. Darüber hinaus gibt es die folgenden besondere Zustände für den ARM Kern:

ModusEintrittAufwachenBeschreibung
WFI Sleep__WFI()InterruptWarte auf Interrupt. Nur die CPU wird angehalten.
WFE Sleep__WFE()Interrupt oder EreignisWarte auf Ereignis. Nur die CPU wird angehalten.
StopPDDS=1, LPDS=1, SLEEPDEEP=1 + __WFI() oder __WFE()EXTI Leitung, configuriert im EXTI Register. Taktsignale von HSI/HSE sind deaktiviert. Die I/O Pins, Register und RAM bleiben unverändert. Debugging ist nicht möglich.
StandbyPDDS=1, LPDS=0, SLEEPDEEP=1 + __WFI() oder __WFE()Steigende Flanke an WKUP Pin, RTC Alarm, externer Reset am NRST, IWDG Reset. Taktsignale von HSI/HSE sind deaktiviert. RAM Inhalte gehen verloren. Nur die Backup Register bleiben erhalten. Die I/O Pins werden hochohmig, außer TAMPER, WKUP und NRST. Debugging ist nicht möglich. Zum Aufwachen muss der Controller neu starten.

Wenn der WFI/WFE Sleep innerhalb einer Interruptroutine aktiviert wurde, kann er nur durch einen höher priorisierten Interrupt aufgeweckt werden. Wenn gerade ein Ereignis ansteht, während __WFE() augerufen wird, wird nur das Ereignis gelöscht und kein Sleep Modus aktiviert.

Durch Setzen von Bit 1 (SLEEPONEXIT) im Register SCB->SCR aktiviert man die "Sleep on exit" Funktion. Diese bewirkt, dass der Prozessor nach Abarbeitung jeder Interruptroutine automatisch in den WFI Sleep Modus geht.

Wenn im SCB->SCR Register das Bit 4 (SEVONPEND) gesetzt ist, löst ein anstehender Interrupt zugleich ein Ereignis aus, selbst wenn der Interrupt nicht freigeschaltet ist.

Arduino Umgebung

Mit dem Arduino Framework ist das Programmieren einfach, aber man kann nicht alle Funktionen des Chips ausnutzen. Außerdem enthält die Arduino IDE keinen Debugger. Falls Du es trotzdem ausprobieren möchtest, solltest du die Geschichte von stm32duino kennen:

Das Arduino Framework war von Anfang an eine Umsetzung der Programmiersprache Wiring für ATmega Mikrocontroller. Obwohl Ardunio inzwischen auch einige 32bit Controller unterstützt, merkt man deutlich, dass Arduino primär für die Bedürfnisse und Fähigkeiten von 8bit ATmega Controllern gestaltet wurde.

Im Jahr 2009 erschien das Leaflabs Maple Board als erstes STM32 Board für Arduino. Nachdem der Hersteller den Produktsupport im Jahr 2016 beendete, startete Roger Clarks sein stm32duino Projekt um die Arduino Unterstützung zumindest für den STM32F103 weiter leben zu lassen. Er hat wesentliche Teile von Leaflabs' Code weiter verwendet.

Im Jahr 2018 wurde das stm32duino Projekt samt Domäne vom Chiphersteller ST übernommen und bis zur Unkenntlichkeit umgestaltet - und zwar als Aufsatz auf deren Cube HAL Framework. So konnte ST schnell sehr viele STM32 Modelle unterstützen. Die aktuelle Version von stm32duino gibt es hier.

Ich bin erfahren genug, um dieses "Framework auf Framework" Konstrukt strikt abzulehnen. Also empfehle ich den "alten" schlanken Core von Roger Clarks. Er pflegt seinen Code immer noch weiter, aber im Gegensatz zu ST nicht im Stil einer unbeständigen Spielwiese, sondern als ausgereifte stabile Software. Dan Drown kümmert sich darum, dass Rogers Core bequem über den Boardmanager der Arduino IDE installierbar ist.

Die Doku zu diesem Arduino Core befindet sich hier. Als Programmieradapter empfehle ich dazu einen originalen oder nachgemachten ST-Link.

Damit erzeugte Sketche enthalten immer die Serial Klasse für den virtuellen COM Port, was etwa 14 kB Flash und 2,8 kB RAM belegt. Die echten seriellen Ports sind über die Klassen Serial1, Serial2 und Serial3 ansprechbar.

Dieser Arduino Core basiert nicht auf der CMSIS, daher heißen dort die Konstanten für die Register und Bitmasken etwas anders. Werfe dazu ggf. einen Blick in die Dateien packages/stm32duino/hardware/STM32F1/2018.7.2/system/libmaple/stm32f1/include/series/*.h

Die Pins PA13, PA14, PA15, PB3 and PB4 sind standardmäßig für die ungenutzte Debug Schnittstelle reserviert. Das kann man so ändern:

void setup()
{
    // Disable both SWD and JTAG to free PA13, PA14, PA15, PB3 and PB4
    afio_cfg_debug_ports(AFIO_DEBUG_NONE);
    
    or:      
    
    // Disable JTAG only to free PA15, PB3 and PB4. SWD remains active
    afio_cfg_debug_ports(AFIO_DEBUG_SW_ONLY);
}

STM32duino Bootloader

Für einige STM32F103 Boards steht der STM32duino Bootloader zur Verfügung. Er ermöglicht das Hochladen eigener Sketche (Programme) über den USB Anschluss. Der Bootloader belegt zusätzlich 8 kB vom Flash Speicher, die eigenen Sketche werden dahinter positioniert.

Für das STM32F103C8T6 Minimum System Development Board (Blue-Pill) ist die Datei generic_boot20_pc13.bin die richtige. Man installiert sie wahlweise über den seriellen Port mit einem USB-UART Adapter oder über den SWJ Anschluss mit einem ST-Link Adapter.

Der dazugehörige Windows Treiber befindet sich im Arduino_STM32 Paket. Führe zur Installation die Datei /Arduino_STM32-master/drivers/win/install_driver.bat aus. Für Linux braucht man keinen Treiber zu installieren.

Der STM32duino Bootloader ist nur eine Sekunde lang nach dem Loslassen des Reset-Knopfes aktiv. Dies zeigt er durch schnelles Blinken der Status-LED an. Innerhalb dieser kurzen Zeit kann man mit der Arduino IDE einen Sketch hochladen.

Im Gerätemanager von Windows erscheint der Bootloader als "libusb-win32 devices/Maple DFU". Nach einer Sekunde verschwindet er wieder, danach erscheint der virtuelle serielle COM-Port des Sketches.

Wegen dem schwierigen Timing finde ich den Bootloader unhandlich und nicht empfehlenswert.

Virtueller COM-Port mit Arduino

Der virtuelle COM-Port ist fester Bestandteil der STM32 Erweiterung für Arduino, deswegen ist er sehr einfach zu programmieren. Die für serielle Ports übliche Initialisierungs-Prozedur entfällt:
void setup() 
{
    // PC13 is connected to the status LED
    pinMode(PC13, OUTPUT);
}

void loop() 
{
    digitalWrite(PC13, LOW);
    Serial.println("Tick");
    delay(500);

    digitalWrite(PC13, HIGH);
    Serial.println("Tack");
    delay(500);
}
Die Ausgabe kannst du im Seriellen Port Monitor der Arduino IDE sehen. Falls du lieber das Hammer Terminal benutzt, musst du dort den "DTR" Knopf unterhalb des Ausgabefensters einschalten.