Version 85 (modified by 4 years ago) (diff) | ,
---|
Boot et premier programme en mode kernel
Cette page décrit la séance complète : TD et TP. Elle commence par des exercices à faire sur papier et puis elle continue et se termine par des questions sur le code et quelques exercices de codage simples à écrire et à tester sur le prototype. La partie pratique est découpée en 5 étapes. Pour chaque étape, nous donnons (1) une brève description, (2) une liste des objectifs principaux de l'étape, (3) une liste des fichiers avec un bref commentaire sur chaque fichier, (4) une liste de questions simples dont les réponses sont dans le code, le cours ou le TD et enfin (5) un exercice de codage.
IMPORTANT
Avant de faire cette séance, vous devez avoir lu les documents suivants :
- Description des objectifs de cette séance et des suivantes : obligatoire
- Cours de démarrage présentant l'architecture matérielle et logicielle que vous allez manipuler obligatoire
- Document sur l'assembleur du MIPS et la convention d'appel des fonctions : recommandé
- Configuration de l'environnement des TP : obligatoire
- Documentation sur le mode kernel du MIPS32 : optionnel pour cette séance
Récupération du code du TP
- Vous devez être sur une machine Linux native ou virtualisée (sinon lisez Configuration de l'environnement des TP → Étape 1)
- Vous devez avoir le répertoire
$HOME/AS5
contenant le prototype almo1 et le compilateur MIPS (sinon lisez Configuration de l'environnement des TP → Étape 2) - Téléchargez l'archive code du tp1 et placez là dans le répertoire
$HOME/AS5
- Assurez-vous que vous avez déjà sourcé le fichier
Source-me.sh
(sinon lisez Configuration de l'environnement des TP → Étape 3) - Ouvrez un
terminal
, allez dans le répertoireAS5
(cd ~/AS5
) et décompressez l'archive du tp1 avectar xvzf tp1.tgz
Cette étape est peut-être inutile si vous avez déjà fait la décompression de l'archive au moment de son téléchargement. - Dans le
terminal
, exécutez la commandecd ; tree -L 2 AS5
. Vous devriez obtenir ceci:
(si vous n'avez pastree
sur votre Linux, vous pouvez l'installer, c'est un outil utile, mais pas indispensable pour ces TP)/home/osboxes/AS5 ├── bin │ ├── almo1.x │ ├── gcc │ ├── Source-me.sh │ ├── test │ └── tracelog └── tp1 ├── 1_hello_boot ├── 2_init_asm ├── 3_init_c ├── 4_nttys ├── 5_driver └── Makefile
A. Travaux dirigés
A1. Analyse de l'architecture
Les trois figures ci-dessous donnent des informations sur l'architecture du prototype almo1 sur lequel vous allez travailler.
- À droite, vous avez un schéma de connexion simplifié.
- Au centre, vous avez la représentation des 4 registres internes du contrôleur de terminal
TTY
nécessaires pour commander un couple écran-clavier. - À gauche, vous avez la représentation de l'espace d'adressage implémenté pour le prototype.
Questions
- Il y a deux mémoires dans almo1 : RAM et ROM. Qu'est-ce qui les distinguent et que contiennent-elles ?
- Qu'est-ce l'espace d'adressage du MIPS ? Quelle taille fait-il ?
Quelles sont les instructions du MIPS permettant d'utiliser ces adresses ? Est-ce synonyme de mémoire ? - Dans quel composant matériel se trouve le code de démarrage et à quel adresse est-il placé dans l'espace d'adressage et pourquoi à cette adresse ?
- Quel composant permet de faire des entrées-sorties dans almo1 ?
Citez d'autres composants qui pourraient être présents dans un autre SoC ? - Il y a 4 registres dans le contrôleur de
TTY
, à quelles adresses sont-ils placés dans l'espace d'adressage ?
Comme ce sont des registres, est-ce que le MIPS peut les utiliser comme opérandes pour ses instructions (comme add, or, etc.) ?
Dans quel registre faut-il écrire pour envoyer un caractère sur l'écran du terminal (implicitement à la position du curseur) ?
Que contiennent les registresTTY_STATUS
etTTY_READ
?
Quelle est l'adresse deTTY_WRITE
dans l'espace d'adressage ? - Le contrôleur de
TTY
peut contrôler de 1 à 4 terminaux. Chaque terminal dispose d'un ensemble de 4 registres (on appelle ça une carte de registres, ou en anglais uneregister map
). Ces ensembles de 4 registres sont placés à des adresses contiguës. S'il y a 2 terminaux (
TTY0
etTTY1
), A quelle adresse est le registreTTY_READ
deTTY1
? - Que représentent les flèches bleues sur le schéma ? Pourquoi ne vont-elles que dans une seule direction ?
A2. Programmation assembleur
L'usage du code assembleur est réduit au minimum. Il est utilisé uniquement où c'est indispensable. C'est le cas du code de démarrage. Ce code ne peut pas être écrit en C au moins une raison importante. Le compilateur C suppose la présence d'une pile et d'un registre du processeur contenant le pointeur de pile, or au démarrage les registres sont vides (leur contenu n'est pas significatif). Dans cette partie, nous allons nous intéresser à quelques éléments de l'assembleur qui vous permettront de comprendre le code en TP.
Questions
- Nous savons que l'adresse du premier registre du
TTY
est0xd0200000
est qu'à cette adresse se trouve le registreTTY_WRITE
duTTY0
. Écrivez le code permettant d'écrire le code ASCII'x'
sur le terminal 0. Vous avez droit à tous les registres du MIPS. - Le problème est que l'adresse du
TTY
est un choix de l'architecte du prototype et s'il décide de placer leTTY
ailleurs dans l'espace d'adressage, il faudra réécrire le code précédent. Nous allons utiliser une étiquette, supposons que l'adresse du premier registre duTTY
se nomme__tty_regs_map
. Le code assembleur ne connait pas l'adresse, il ne connaît que le symbole. Si nous voulons toujours écrire'x'
sur le terminal 0. Nous allons utiliser la macrola $r, label
qui est remplacée par les deux instructionslui
etori
. Il existe aussi la macroli
pour initialiser des valeurs 32bits dans un registre. Pour être plus précis, les instructionssont remplacés parla $r, label li $r, 0x87654321
Réécrivez le code de la question précédente en utilisantlui $r, label>>16 ori $r, $r, label & 0xFFFF lui $r, 0x8765 ori $r, $r, 0x4321
la
etli
- En assembleur pour sauter à une adresse de manière inconditionnelle, on utilise les instructions
j label
oujr $r
, peuvent-elles faire les choses ? - Vous avez utilisé les directives
.text
et.data
pour définir les sections où placer les instructions et les variables globales, mais il existe la possibilité de demander la création de nouvelles sections dans le code objet produit par le compilateur avec la directive.section name,"flags"
name
est le nom de la nouvelle section on met souvent un.name
pour montrer que c'est une section et"flags"
informe du contenu"ax"
pour des instructions,"ad"
pour des données (ceux que ça intéresse pourront regarder là https://frama.link/20UzK0FP)
$5
et$6
dans$4
- À quoi sert la directive
.globl label
? - Écrivez une séquence de code qui affiche la chaîne de caractère
"Hello"
surTTY0
. Ce n'est pas une fonction et vous pouvez utiliser tous les registres que vous voulez. Vous supposez que__tty_regs_maps
est déjà défini. - En regardant, le dessin de l'espace d'adressage du prototype almo1, à quelle adresse devra être initialisé le pointeur de pile pour le kernel. Rappelez pourquoi c'est indispensable de le définir avant d'appeler une fonction C et écrivez le code qui fait l'initialisation, en supposant que l'adresse du pointeur porte le nom
__kdata_end
A2. Programmation en C
Vous savez déjà programmer en C, mais vous allez voir des syntaxes ou des cas d'usage que vous ne connaissez peut-être pas encore. Les questions qui sont posées ici n'ont pas toutes été vues en cours, mais vous connaissez peut-être les réponses, sinon ce sera l'occasion d'apprendre.
Questions
- Quels sont les usages du mot clé
static
en C ? - Pourquoi déclarer des fonctions ou des variables
extern
? - Comment déclarer un tableau de structures en variable globale ? La structure est nommée
test_s
a deux champsint
nommésa
etb
. Le tableau est nommétab
a 2 cases. - Quelle est la différence entre
#include "file.h"
et#include <file.h>
? - Comment définir une macroinstruction du processeur uniquement si elle n'est pas définie ? Écrivez un exemple.
- Comment être certain de ne pas inclure plusieurs fois le même fichier
.h
? - Supposons que la structure
tty_s
et le tableau de registres deTTY
soient définis comme suit. Écrivez une fonction Cint getchar(void)
bloquante qui attend un caractère tapé au clavier sur leTTY0
. Nous vous rappelons qu'il faut attendre que le registreTTY_STATUS
soit différent de 0 avant de lireTTY_READ
.struct tty_s { int write; // tty's output address int status; // tty's status address something to read if not null) int read; // tty's input address int unused; // unused address }; extern volatile struct tty_s __tty_regs_map[NTTYS];
- Savez-vous à quoi sert le mot clé
volatile
? Nous n'en avons pas parlé en cours, mais c'est nécessaire pour les adresses des registres de périphérique, une idée ... ?
A3. Compilation
Pour obtenir le programme exécutable, nous allons utiliser :
gcc -o file.o -c file.c
- Appel du compilateur avec l'option
-c
qui demande àgcc
de faire le préprocessing puis la compilation c pour produire le fichier objetfile.o
- Appel du compilateur avec l'option
ld -o bin.x -Tkernel.ld files.o ...
- Appel de l'éditeur de lien pour produire l'exécutable
bin.x
en assemblant tous les fichiers objets.o
, en les plaçant dans l'espace d'adressage et résolvant les liens entre eux (quand un.o
utilise une fonction ou une variable définie dans un autre.o
).
- Appel de l'éditeur de lien pour produire l'exécutable
objdump -D file.o > file.o.s
ouobjdump -D bin.x > bin.x.s
- Appel du désassembleur prend les fichiers binaires (
.o
ou.x
) pour retrouver le code produit par le compilateur à des fins de debug ou de curiosité.
- Appel du désassembleur prend les fichiers binaires (
Questions
Le fichier kernel.ld
décrit l'espace d'adressage et la manière de remplir les sections dans le programme exécutable.
__tty_regs_map = 0xd0200000 ; __boot_origin = 0xbfc00000 ; __boot_length = 0x00001000 ; __ktext_origin = 0x80000000 ; __ktext_length = 0x00020000 ; [... question 1 ...] __kdata_end = __kdata_origin + __kdata_length ; MEMORY { boot_region : ORIGIN = __boot_origin, LENGTH = __boot_length ktext_region : ORIGIN = __ktext_origin, LENGTH = __ktext_length [... question 2 ...] } SECTIONS { .boot : { *(.boot) } > boot_region [... question 3 ...] .kdata : { *(.*data*) } > kdata_region }
- Le fichier commence par la déclaration des variables donnant des informations sur les adresses et les tailles des régions de mémoire. Ces symboles n'ont pas de type et ils sont visibles de tous les programmes c, il faut juste leur donner un type pour le compilateur puisse les exploiter, c'est ce que nous avons fait pour
extern volatile struct tty_s __tty_regs_map[NTTYS]
. En regardant, dans le dessin de la représentation de l'espace d'adressage, complétez les lignes de déclaration des variables pour la régionkdata_region
- Le fichier contient ensuite la déclaration des régions qui vont être remplies par les sections trouvées dans les fichiers objets. Complétez les lignes propres à la déclaration de la région
kdata_region
. - Enfin le fichier contient comment sont remplies les régions avec les sections. Complétez les lignes correspondant à la description du remplissage de la région
ktext_region
. Vous devez la remplir avec les sections.text
issus de tous les fichiers.
Nous allons systématiquement utiliser des Makefiles pour la compilation du code, mais aussi pour lancer le simulateur du prototype almo1. Pour cette première séance, les Makefiles ne permettent pas de faire des recompilations partielles de fichiers. Les Makefiles sont utilisés pour agréger toutes les actions que nous voulons faire sur les fichiers, c'est-à-dire : compiler, exécuter avec ou sans trace, nettoyer le répertoire. Nous avons recopiez le premier Makefile pour montrer sa forme et poser quelques questions, auxquels vous savez certainement répondre.
# Tools and parameters definitions # ------------------------------------------------------------------------------ NTTY ?= 2 # default number of ttys CC = mipsel-unknown-elf-gcc # compiler LD = mipsel-unknown-elf-ld # linker OD = mipsel-unknown-elf-objdump # desassembler SX = almo1.x # prototype simulator CFLAGS = -c # stop after compilation, then produce .o CFLAGS += -Wall -Werror # gives almost all C warnings and considers them to be errors CFLAGS += -mips32r2 # define of MIPS version CFLAGS += -std=c99 # define of syntax version of C CFLAGS += -fno-common # do not use common sections for non-static vars (only bss) CFLAGS += -fno-builtin # do not use builtin functions of gcc (such as strlen) CFLAGS += -fomit-frame-pointer # only use of stack pointer ($29) CFLAGS += -G0 # do not use global data pointer ($28) CFLAGS += -O3 # full optimisation mode of compiler CFLAGS += -I. # directories where include files like <file.h> are located CFLAGS += -DNTTYS=$(NTTY) # #define NTTYS with the number of ttys in the prototype FROM ?= 0 # first cycles to trace NCYC ?= 10000 # number of cycles to execute # Rules (here they are used such as simple shell scripts) # ------------------------------------------------------------------------------ help: @echo "\nUsage : make <compil|exec|trace|clean> [FROM=num] [NCYC=num]\n" @echo " compil : compile all sources" @echo " exec : prototype execution" @echo " trace : execution with a trace for debug (trace.log)" @echo " FROM is the first cycle from which the trace is made" @echo " NCYC is the number of cycles to execute" @echo " clean : clean all compiled files\n" compil: $(CC) -o hcpu.o $(CFLAGS) hcpu.S @$(OD) -D hcpu.o > hcpu.o.s $(LD) -o kernel.x -T kernel.ld hcpu.o @$(OD) -D kernel.x > kernel.x.s exec: compil $(SX) -KERNEL kernel.x -NTTYS $(NTTY) trace: compil $(SX) -KERNEL kernel.x -DEBUG $(FROM) -NCYCLES $(NCYC) -NTTYS $(NTTY) > details.log;\ echo "\ngenerate trace.log, please wait... ";\ tracelog -vout="trace.log.s" *.x.s details.log ;\ rm details.log clean: -rm *.o* *.x* *~ *.log.* proc?_term? 2> /dev/null || true
- Au début du fichier se trouve la déclaration des variables du Makefile, quelle est la différence entre
=
,?=
et+=
? - Où est utilisé
CFLAGS
? Que fait-DNTTYS=$(NTTY)
et pourquoi est-ce utile ici ? - Si on exécute
make
sans cible, que se passe-t-il ? - à quoi servent
@
et-
au début de certaines commandes ?
B. Travaux pratiques
B1. Premier programme en assembleur dans la seule section de boot
Nous commençons par un petit programme de quelques lignes en assembleur, placé entièrement dans la région mémoire du boot, qui réalise l'affichage du message "Hello World". C'est un tout tout petit programme, mais pour obtenir l'exécutable, vous devrez utiliser tous les outils de la chaîne de cross-compilation MIPS et pour l'exécuter vous devrez exécuter le simulateur du prototype. C'est simple, mais c'est nouveau pour beaucoup d'entre vous. Vous devez d'abord répondre aux questions, elles ont pour but de vous faire lire le code et revoir les points du cours. Les réponses sont dans le cours ou dans les fichiers sources. Certaines ont déjà été traitées en TD, c'est normal. Ensuite, vous passez aux exercises pratiques.
Objectifs
- produire un exécutable à partir d'un code en assembleur.
- savoir comment afficher un caractère sur un terminal.
- analyse d'une trace d'exécution
Fichiers
1_hello_boot ├── hcpu.S : code dépendant du cpu matériel en assembleur ├── kernel.ld : ldscript décrivant l'espace d'adressage pour l'éditeur de lien └── Makefile : description des actions possibles sur le code : compilation, exécution, nettoyage, etc.
Questions
- Dans quel fichier se trouve la description de l'espace d'adressage du MIPS ? Que trouve-t-on dans ce fichier ?
- Dans quel fichier se trouve le code de boot et pourquoi, selon vous, avoir nommé ce fichier ainsi ?
- À quelle adresse démarre le MIPS ? Où peut-on le vérifier ?
- Que produit
gcc
quand on utilise l'option-c
? - Que fait l'éditeur de liens ? Comment est-il invoqué ?
- De quels fichiers a besoin l'éditeur de liens pour fonctionner ?
- Dans quelle section se trouve le code de boot pour le compilateur ? (la réponse est dans le code assembleur)
- Dans quelle section se trouve le message hello pour le compilateur ? Ce choix est particulier, mais ce message est en lecture seule.
- Dans quelle section se trouve le code de boot dans le code exécutable ?
- Dans quelle région de la mémoire le code de boot est-il placé ?
- Comment connaît-on l'adresse du registre de sortie du contrôleur de terminal
TTY
? - Le code de boot se contente d'afficher un message, comment sait-on que le message est fini et que le programme doit s'arrêter ?
- Pourquoi terminer le programme par un
dead: j dead
?
Exercices
- Exécutez le programme en lançant le simulateur avec
make exec
, qu'observez-vous ? - Exécutez le programme en lançant le simulateur avec
make trace
. Cela exécute le programme pour une courte durée et cela produit un fichiertrace.log.s
. Que voyez-vous dans la trace ? - Modifiez le code de
hcpu.S
afin d'afficher le message "Au revoir\n" (Hommage VGE) après le message "Hello".
Vous devez avoir deux messages, et pas seulement étendre le premier.
B2. Saut dans le code du noyau en assembleur
Dans le deuxième programme, nous restons en assembleur, mais nous avons deux fichiers source : (1) le fichier contenant
le code de boot et (2) le fichier contenant le code du noyau. Ici, le code du noyau c'est juste une fonction kinit()
. Ce n'est pas vraiment une fonction car on n'utilise pas la pile.
Objectifs
- Savoir comment le programme de boot fait pour sauter à l'adresse de la routine kinit.
- Avoir un fichier kernel.ld un peu plus complet.
Fichiers
2_init_asm/ ├── hcpu.S : code dépendant du cpu matériel en assembleur ├── kernel.ld : ldscript décrivant l'espace d'adressage pour l'éditeur de lien ├── kinit.S : fichier contenant le code de démarrage du noyau, ici c'est une routine kinit. └── Makefile : description des actions possibles sur le code : compilation, exécution, nettoyage, etc.
Questions
- Regarder dans le fichier
hcpu.S
, dans quelle section est désormais le code de boot ? - Le code de boot ne fait que sauter à l'adresse
kinit avec l'instruction
j`, il n'y a pas de retour, ce n'est donc pas unjal
. Où est définikinit
? Comment le code de boot connait-il cette adresse ? Pourquoi ne pas avoir utiliséj init
et donc pourquoi passer par un registre ? - Dans
kernel.ld
, que signifie*(.*data*)
? - Quelle est la valeur de
__kdata_end
? Pourquoi mettre 2 «_
» au début des variables duldscript
?
Exercices
- Exécutez le programme sur le simulateur. Est-ce différent de l'étape 1 ?
- Modifiez le code, comme pour l'étape 1, afin d'afficher un second message ?
B3. Saut dans la fonction kinit() du noyau en langage C
Dans ce troisième programme, nous faisons la même chose que pour le deuxième mais kinit()
est désormais écrit en
langage C. Cela change peu de choses, sauf une chose importante kinit()
est une fonction et donc il faut absolument
une pile d'exécution.
Objectifs
- Savoir comment et où déclarer la pile d'exécution du noyau.
- Savoir comment afficher un caractère sur un terminal depuis un programme C.
Fichiers
3_init_c/ ├── hcpu.S : code dépendant du cpu matériel en assembleur ├── kernel.ld : ldscript décrivant l'espace d'adressage pour l'éditeur de lien ├── kinit.c : fichier en C contenant le code de démarrage du noyau, ici c'est la fonction kinit(). └── Makefile : description des actions possibles sur le code : compilation, exécution, nettoyage, etc.
Questions
- Quand faut-il initialiser la pile ? Dans quel fichier est-ce ? Quelle est la valeur du pointeur initial ?
Exercices
- Exécutez le programme sur le simulateur. Est-ce différent de l'étape 1 ?
- Modifiez le code de
kinit.c
, et comme pour l'étape 1, afficher un second message ?
B4. Accès aux registres de contrôle des terminaux TTY
Le prototype de SoC que nous utilisons pour les TP est configurable. Il est possible par exemple de choisir le nombre de terminaux texte (TTY). Par défaut, il y en a un mais, nous pouvons en avoir jusqu'à 4. Nous allons modifier le code du noyau pour s'adapter à cette variabilité. En outre, pour le moment, nous ne faisions qu'écrire sur le terminal, maintenant, nous allons aussi lire le clavier.
Objectifs
- Savoir comment compiler un programme C avec du code conditionnel.
- Savoir comment décrire en C l'ensemble des registres d'un contrôleur de périphérique et y accéder.
Fichiers
4_nttys/ ├── hcpu.S : code dépendant du cpu matériel en assembleur ├── kernel.ld : ldscript décrivant l'espace d'adressage pour l'éditeur de lien ├── kinit.c : fichier en C contenant le code de démarrage du noyau, ici c'est la fonction kinit(). └── Makefile : description des actions possibles sur le code : compilation, exécution, nettoyage, etc.
Questions
- ?
Exercices
- Exécutez le programme sur le simulateur. Qu'observez-vous ?
- Modifiez le code pour afficher un message sur le second terminal, il y a toujours une attente sur le premier terminal.
- Modifiez le code pour que le programme attende sur les deux terminaux. L'idée est de ne plus faire d'attente bloquante sur le registre
TTY_STATUS
de chaque terminal.
B5. Premier petit pilote pour le terminal
Dans l'étape 4, nous accédons au registre de périphérique directement dans la fonction kinit()
, ce n'est pas très
simple. C'est pourquoi nous allons ajouter un niveau d'abstraction qui représente un début de pilote de périphérique
(device driver). Ce pilote, même tout petit constitue une couche logicielle avec une API.
Objectifs
- Savoir comment créer un début de pilote pour le terminal
TTY
. - Savoir comment décrire une API en C
- Savoir appeler une fonction en assembleur depuis le C
Fichiers
5_driver/ ├── harch.c : code dépendant de l'architecture du SoC, pour le moment c'est juste le pilote du TTY ├── harch.h : API du code dépendant de l'architecture ├── hcpu.h : prototype de la fonction clock() ├── hcpu.S : code dépendant du cpu matériel en assembleur ├── kernel.ld : ldscript décrivant l'espace d'adressage pour l'éditeur de lien ├── kinit.c : fichier en C contenant le code de démarrage du noyau, ici c'est la fonction kinit(). └── Makefile : description des actions possibles sur le code : compilation, exécution, nettoyage, etc.
Questions
- Le code du driver du TTY est dans le fichier
harch.c
et les prototypes sont dansharch.h
. Si vous ouvrezharch.h
vous allez voir que seuls les prototypes des fonctionstty_read()
ettty_write()
sont présents. La structure décrivant la carte des registres duTTY
est déclaré dans le .c. Pourquoi avoir fait ainsi ? - Le MIPS dispose d'un compteur de cycles internes. Ce compteur est dans un banc de registres accessibles uniquement quand le processeur fonctionne en mode
kernel
. Nous verrons ça au prochain cours, mais en attendant nous allons quand même exploiter ce compteur. Pourquoi avoir mis la fonction danshcpu.S
? Rappeler, pourquoi avoir mis.globl clock
Exercices
- Comme d'habitude, exécutez le code et observez.
- Afin de vous détendre un peu, vous allez créer un petit jeu
guess
guess
tire un nombre entre '0' et '9' et vous devez le deviner en faisant des propositions.guess
vous dit si c'est trop grand ou trop petit.
- Vous créez deux fichiers
guess.c
etguess.h
.guess.c
contient le jeu il y au moins une fonctionguess()
guess.h
contient les déclarations externes deguess.c
kinit()
doit lancerguess()
guess()
- vous demande de taper une touche pour démarrer le jeu.
- effectue un tirage d'un nombre en utilisant la fonction
clock()
et ne gardant que le chiffre de poids faible (ce n'est pas aléatoire, mais c'est mieux que rien) - exécute en boucle jusqu'à réussite
- demande d'un chiffre
- comparaison avec le tirage et affichage des messages
"trop grand"
,"trop petit"
ou"bravo"
- Vous devrez modifier le Makefile puisque vous avez un fichier à compiler en plus.
- Si c'est trop facile, vous pouvez complexifier en utilisant des nombres à 2 chiffres ou plus.