Context Navigation

← Previous Change
Wiki History
Next Change →

Changes between Initial Version and Version 1 of MjpegCourse/Station

Timestamp:: Feb 26, 2007, 1:00:58 PM (18 years ago)
Author:: Nicolas Pouillon
Comment:: Nom hiérarchique

Legend:

: Unmodified
: Added
: Removed
: Modified

MjpegCourse/Station

                       v1
+{{{
+#!html
+<h1>TP1: Description d'application avec DSX, et exécution sur station de travail</h1>
+}}}
+[[PageOutline]]
+= 0. Objectif =
+L'objectif de ce premier TP est de vous familiariser avec le langage de description DSX
+(comme Design Space Explorer). Ce langage permet au concepteur de déployer une application
+logicielle multi-tâches (écrite en C) sur une architecture matérielle multi-processeurs (MP-SoC),
+modélisée avec les composants matériels fournis par la bibliothèque SoCLib.
+Le langage de description DSX est une API implémentée à l'aide du langage Python, et il permet au concepteur
+de faire 3 choses:
+ * Définir la structure de l'application logicielle multi-tâches, c'est à dire le Graphe des Tâches et des Communications.
+   (aussi appelé TCG: Tasks&Communication Graph).
+   On suppose que le parallélisme "gros grain" de l'application et le shéma des communication entre les
+   tâches peuvent être statiquement définis par le concepteur, et n'évoluent pas en cours d'exécution.
+ * Définir l'architecture matérielle, c'est à dire définir le nombre de processeurs, le nombre de bancs mémoires,
+   la taille des caches, le type d'inerconnect utilisé, etc...
+ * Contrôler le déploiement de l'application logicielle sur la plate-forme matérielle, c'est à dire le placement
+   des tâches sur les processeurs et le placement des canaux de communication sur les bancs mémoire.
+L'exécution de cette description DSX permet générer trois choses:
+ * Une version de l'application logicielle multi-tâches compatible POSIX, qui peut être
+   compilée et exécutée sur n'importe quelle station de travail supportant l'API des threads POSIX.
+   Cette première version permet de valider fonctionnellement l'application logicielle, indépendamment
+   de toute architecture MP-SoC.
+ * Un ensemble de fichiers de directives permettant de compiler l'application logicielle pour le(s)
+   processeur(s) embarqué(s) sur le MP-SoC, d'effectuer l'édition de liens avec le système d'exploitation
+   embarqué, et de générer le code binaire exécutable.
+ * Un modèle SystemC complet de l'architecture matérielle, correctement configuré pour respecter
+   l'organisation de l'espace adressable défini par le concepteur, permettant de générer un simulateur
+   complet de cette architecture, capable d'exécuter en simulation le code embarqué.
+Dans ce 1^er^ TP, on se limitera à décrire - en langage DSX - la structure de l'application logicielle MJPEG,
+à écrire quelques unes des tâches de l'application MJPEG, et à valider cette application en l'exécutant sur
+une station de travail GNU/Linux.
+Vous fournirez un rapport rédigé, en format Adobe Acrobat (PDF), ainsi que certaines sources. Tous les détails sont
+à la fin dans la section 'Compte-Rendu'. Les points du présent sujet devant faire l'objet d'un écho dans votre rapport sont
+en '''''gras oblique''''', préfixés de [[Image(MjpegCourse:q.gif)]].
+= 1. Prise en main =
+== 1.1. Exécuter l'application SplitMsg ==
+Pour prendre en main l'outil DSX, on s'intéresse à une application parallèle
+extrêmement simple comportant deux tâches et un seul canal de communication MWMR.
+Cette application s'appelle !SplitMsg.
+ * Importez l'environnement nécessaire dans le contexte de votre ''shell''
+{{{
+$ source /users/outil/dsx/dsx_env.sh
+}}}
+ * Créez un répertoire `SplitMsg` dans lequel vous mettrez les fichiers à recopier.
+   * Pour les fichiers, voir la page SplitMsg
+ * Si ce n'est pas déjà fait, rendez la description DSX exécutable
+{{{
+$ chmod +x fichier_de_description
+}}}
+ * Exécutez la description DSX
+{{{
+$ ./fichier_de_description
+}}}
+ * [[Image(MjpegCourse:q.gif)]] Q1: '''''Quels fichiers ou répertoires ont été créés?'''''
+ * Lancez la compilation l'application logicielle générée par DSX, en utilisant le makefile également généré
+   par DSX.
+{{{
+$ make
+}}}
+ * Lancez le programme multitâche généré qui porte le nom "exe.posix".
+   Vous pourrez interrompre l'exécution à tout moment en pressant Ctrl-c.
+{{{
+$ ./exe.posix
+}}}
+ * [[Image(MjpegCourse:q.gif)]] Q2: '''''Comment interprêter ce que vous observez lors de l'exécution de cette application ?'''''
+== 1.2. Anatomie de la description DSX ==
+Dans DSX, on fait une distinction entre un modèle de tâche et une instance de tâche,
+car un même modèle de tâche peut être instancié plusieurs fois dans une application.
+ * Un modèle de tâche est défini par la directive `TaskModel`. Il spécifie
+   pour une tâche ses ressources utilisées (canaux de communication, ...)
+   ainsi que ses implémentations existantes. Pour l'instant, on ne s'intéressera
+   qu'aux implémentations logicielles déclarées par `SwTask`. voir DsxTaskModel
+ * Une instance de tâche est définie par la directive `Task`. Elle fait partie d'un
+   TCG. Elle est connectée aux autres tâches par les ressources. voir DsxTasks
+Dans les applications décrites dans ce TP, chaque modèle de tâche ne sera utilisé qu'une fois.
+La description DSX de l'application SplitMsg est en trois parties.
+[[Image(MjpegCourse:q.gif)]] Q3: '''''A quoi sert chacune des parties ?'''''
+= 2. Application MJPEG =
+Dans tout le reste du TP, on s'intéressera à l'application MJpeg telle que décrite en cours.
+On en rappelle le graphe de tâches:
+[[Image(MjpegCourse:mjpeg.png)]]
+Chaque tâche effectue un traitement élémentaire dans la décompression d'une image.
+Dans ce TCG, on représente les tâches par des ronds et les canaux de communication
+par des rectangles. Il s'agit donc d'un graphe bipartie.
+Notre animation MJPEG sera composée d'images faisant toutes la même taille.
+Comme une compression JPEG découpe l'image en blocs de 8x8 pixels, chacune des
+dimensions de l'image sera multiple de 8 (on ne gère qu'un nombre entier de blocs).
+Nous allons utiliser les constantes suivantes:
+ * WIDTH largeur de l'image en pixels
+ * HEIGHT hauteur de l'image en pixels
+A partir de ces deux constantes, d'autres constantes sont définies dans le fichier `jpeg.h`:
+ * BLOCKS_W nombre de blocs en largeur
+ * BLOCKS_H nombre de blocs en hauteur
+ * NBLOCKS nombre de blocs par image (= BLOCKS_W*BLOCKS_H)
+== 2.1. Spécifier le TCG ==
+Il faut nommer chaque élément du TCG:
+ * Les noms des tâches ont été définis en cours et sont imposés.
+ * Vous pouvez choisir librement les noms des canaux de communication.
+   Chaque canal de communication est attaché à au moins deux tâches par des ''ports''.
+   On distingue le nom des canaux de communication et le nom des ports des tâches connectées à ces canaux.
+Pour déterminer les noms des ports des tâches, il est impératif de consulter
+le code des tâches fourni dans le fichier attachment:mjpeg_tp1.tar.bz2,
+recopiez ce fichier chez vous et décompressez-le.
+{{{
+$ tar xjvf mjpeg_tp1.tar.bz2
+}}}
+'''Note''': Même si le code sources des tâches {{{iqzz}}} et {{{libu}}}
+n'est pas fourni, vous pouvez connaître les largeurs de
+tous les canaux en vous référant au code des autres tâches, et le nom des
+ports est fourni dans la description DSX, dans le fichier {{{mjpeg.py}}}
+(à compléter).
+Dans le fichier de description DSX {{{mjpeg.py}}},
+ * Pour chacun des modèles de tâches:
+   * Reportez des noms pour chacun des ports d'entrée/sortie (cf DsxTasks).
+   * Complétez la description des modèles de tâches
+     Iqzz, et Libu ont une déclaration particulière à ne pas prendre en compte pour l'instant,
+     car ces modèles tâches sont fournis sans les sources: vous les écrirez aux prochaines questions
+ * Pour chaque canal de communication:
+   * Choisissez un nom et instanciez le canal
+     (Nous avons 8 fifos Mwmr, utiliser l'API décrite dans DsxResource, `tg_demux` est fournie en exemple)
+   * Dimensionnez (profondeur et largeur) les canaux en fonction des contraintes imposées par le code des tâches.
+ * Créez un Tcg
+   * en instanciant une tâche de chaque modèle, voir DsxTcg
+   * en connectant les canaux aux ports des tâches, en les désignant par leurs noms
+== 2.2. Exécution de l'application ==
+ * Exécutez la description
+{{{
+$ ./mjpeg.py
+}}}
+ * Lancez la compilation de l'application
+{{{
+$ make
+}}}
+ * Lancez l'exécution de l'application
+{{{
+$ ./exe.posix
+}}}
+ * [[Image(MjpegCourse:q.gif)]] Q4: '''''Décrivez brièvement ce que vous observez'''''
+== 2.3. Écriture en C de la tâche IQZZ ==
+IQZZ est une tâche faisant un double traitement, appliqué successivement à chaque bloc de 8x8 pixels de l'image.
+IQZZ nécessite un tableau de quantisation inverse T, venant de la tâche ''Demux'' par un canal de communication dédié.
+Cette table doit être lue '''une fois par image''', elle sert au traitement de '''tous''' les blocs
+d'une image. Le nombre de blocs dans l'image est donné par la constante NBLOCKS, définie dans "jpeg.h".
+Un bloc entrant dans IQZZ est composé de 8x8=64 facteurs.
+||F,,0,,||F,,1,,||F,,2,,||F,,3,,||F,,4,,||F,,5,,||F,,6,,||F,,7,,||
+||F,,8,,||F,,9,,||F,,10,,||F,,11,,||F,,12,,||F,,13,,||F,,14,,||F,,15,,||
+||F,,16,,||F,,17,,||F,,18,,||F,,19,,||F,,20,,||F,,21,,||F,,22,,||F,,23,,||
+||F,,24,,||F,,25,,||F,,26,,||F,,27,,||F,,28,,||F,,29,,||F,,30,,||F,,31,,||
+||F,,32,,||F,,33,,||F,,34,,||F,,35,,||F,,36,,||F,,37,,||F,,38,,||F,,39,,||
+||F,,40,,||F,,41,,||F,,42,,||F,,43,,||F,,44,,||F,,45,,||F,,46,,||F,,47,,||
+||F,,48,,||F,,49,,||F,,50,,||F,,51,,||F,,52,,||F,,53,,||F,,54,,||F,,55,,||
+||F,,56,,||F,,57,,||F,,58,,||F,,59,,||F,,60,,||F,,61,,||F,,62,,||F,,63,,||
+On applique sur ce bloc deux traitement successifs:
+ * La quantisation inverse (IQ) est la multiplication de chaque élément d'entrée par un facteur
+   de la table de 64 coefficients de quantisation inverse T,,n,,, globale pour l'image.
+F,,n,,' = F,,n,, * T,,n,,
+||F,,0,,'||F,,1,,'||F,,2,,'||F,,3,,'||F,,4,,'||F,,5,,'||F,,6,,'||F,,7,,'||
+||F,,8,,'||F,,9,,'||F,,10,,'||F,,11,,'||F,,12,,'||F,,13,,'||F,,14,,'||F,,15,,'||
+||F,,16,,'||F,,17,,'||F,,18,,'||F,,19,,'||F,,20,,'||F,,21,,'||F,,22,,'||F,,23,,'||
+||F,,24,,'||F,,25,,'||F,,26,,'||F,,27,,'||F,,28,,'||F,,29,,'||F,,30,,'||F,,31,,'||
+||F,,32,,'||F,,33,,'||F,,34,,'||F,,35,,'||F,,36,,'||F,,37,,'||F,,38,,'||F,,39,,'||
+||F,,40,,'||F,,41,,'||F,,42,,'||F,,43,,'||F,,44,,'||F,,45,,'||F,,46,,'||F,,47,,'||
+||F,,48,,'||F,,49,,'||F,,50,,'||F,,51,,'||F,,52,,'||F,,53,,'||F,,54,,'||F,,55,,'||
+||F,,56,,'||F,,57,,'||F,,58,,'||F,,59,,'||F,,60,,'||F,,61,,'||F,,62,,'||F,,63,,'||
+ * Le !ZigZag (ZZ) est un réordonnancement des pixels d'un bloc en diagonale. Il permet d'améliorer la compression.
+Après le réordonnancement, l'ordre des facteurs en sortie doit être:
+||F,,0,,'||F,,1,,'||F,,5,,'||F,,6,,'||F,,14,,'||F,,15,,'||F,,27,,'||F,,28,,'||
+||F,,2,,'||F,,4,,'||F,,7,,'||F,,13,,'||F,,16,,'||F,,26,,'||F,,29,,'||F,,42,,'||
+||F,,3,,'||F,,8,,'||F,,12,,'||F,,17,,'||F,,25,,'||F,,30,,'||F,,41,,'||F,,43,,'||
+||F,,9,,'||F,,11,,'||F,,18,,'||F,,24,,'||F,,31,,'||F,,40,,'||F,,44,,'||F,,53,,'||
+||F,,10,,'||F,,19,,'||F,,23,,'||F,,32,,'||F,,39,,'||F,,45,,'||F,,52,,'||F,,54,,'||
+||F,,20,,'||F,,22,,'||F,,33,,'||F,,38,,'||F,,46,,'||F,,51,,'||F,,55,,'||F,,60,,'||
+||F,,21,,'||F,,34,,'||F,,37,,'||F,,47,,'||F,,50,,'||F,,56,,'||F,,59,,'||F,,61,,'||
+||F,,35,,'||F,,36,,'||F,,48,,'||F,,49,,'||F,,57,,'||F,,58,,'||F,,62,,'||F,,63,,'||
+Notes d'implémentation:
+ * Pour implémenter ZZ, un tableau statique commençant par les
+   valeurs ZZ![0]=0, ZZ![1]=1, ZZ![2]=8, ZZ![3]=16, ZZ![4]=9, ...
+   vous sera probablement utile.
+ * Les transformations IQ et ZZ doivent être implémentées dans
+   la même boucle.
+ * Les types des données sont:
+   * T: Table de quantisation inverse (IQ): entiers non signés 8 bits
+   * F,,n,,: Blocs en entrée: entiers 16 bits signés
+   * F,,n,,': Blocs en sortie: entiers 32 bits signés (car 8bits*16bits nécessite au plus 24 bits...)
+ * Votre code '''doit''' être portable quelle que soit l'endianness du processeur sous-jacent
+   (si vous ne faites pas de transtypages hasardeux sur les pointeurs, ça devrait bien se passer)
+ * Votre code '''doit''' gérer toutes les tailles d'images (tant qu'elles sont multiples de 8x8).
+   Toutes les boucles doivent utiliser les tailles issues des defines (WIDTH, HEIGHT, BLOCKS_W, BLOCKS_H)
+Instructions:
+ * Écrivez en C le code de la tâche IQZZ à l'aide de l'API logicielle définie dans SrlApi
+ * Réécrivez la définition de la tâche IQZZ dans la description DSX
+{{{
+# On avait:
+LlvmBlob('iqzz', stack_size = 1024, blob = 'src/iqzz_48x48.bc')
+# On peut alors déclarer iqzz comme une tâche logicielle en C.
+SwTask( ... )
+}}}
+Inspirez-vous des autres déclarations, n'oubliez pas les `defines` si vous voulez un code portable.
+En fonction de la définition d'{{{iqzz}}} que vous utilisez (celle de `LlvmBlob` ou la vôtre),
+et en recompilant, vous observerez les résultats l'implémentation de référence ou de la vôtre.
+ * Affinez votre fonction. Si besoin, lancez l'application {{{exe.posix}}} dans un débugger.
+   La fonction implémentant {{{iqzz}}} portera probablement le nom {{{iqzz_func_iqzz}}}.
+== 2.4. Écriture en C de la tâche LIBU ==
+Un Ramdac est une RAM couplée à un DAC (Digital to Analog Converter). Le contenu de la ram est
+converti en signal analogique pour être envoyé sur un écran. Notre Ramdac a un accès particulier:
+Il a un comportement Fifo. Il faut écrire les pixels dans l'ordre où ils vont être affichés :
+tous les pixels d'une ligne, puis toutes les lignes d'une image.
+Il se trouve que les blocs issus de la décompression JPEG font 8x8 pixels. Ils ne font pas la
+largeur de l'image, il faut donc construire des lignes d'image à partir des blocs issus de la décompression.
+C'est le but de la tâche Libu (Line Builder).
+Libu prend BLOCKS_W blocs de 8x8 pixels et en construit 8 lignes de WIDTH pixels de large
+(rappel: BLOCKS_W*8 = WIDTH). Il peut alors envoyer successivement ces lignes au Ramdac.
+En pseudo-code, le traitement de Libu est:
+{{{
+bloc : 8x8 pixels
+buffer : WIDTH*8 pixels
+Pour chaque 0 .. BLOCKS_H:
+    Pour chaque 0 .. BLOCKS_W:
+        Lire un bloc
+        Pour chaque ligne du bloc
+            Copier les 8 pixels en les mettant à leur place dans buffer
+    Pour chacune des 8 lignes du buffer:
+        Envoyer la ligne
+}}}
+ * Implémentez cette tâche en C à l'aide de l'API logicielle définie dans SrlApi
+ * Modifiez la description de l'application DSX pour prendre en compte votre source
+ * Testez l'application nouvellement compilée
+= 3. Compte-Rendu =
+Vous devrez créer une archive `tar.gz`, contenant un seul répertoire nommé `tp1`. Dans ce répertoire vous devrez mettre:
+ * Un fichier `__init__.py` vide
+ * Un fichier `rendu.py` contenant:
+{{{
+from dsx import *
+iqzz = TaskModel( # le reste de la définition de votre modèle iqzz
+                     )
+libu = TaskModel( # le reste de la définition de votre modèle libu
+                     )
+}}}
+   Et rien d'autre, en particulier rien à propos des autres tâches ou du TCG.
+ * Le code des tâches iqzz et libu que vous avez écrites dans un sous-répertoire `src/`.
+ * Votre rapport (une page maximum) en format PDF (et aucun autre) dans `tp1/rapport.pdf`.
+Le nom de fichier de l'archive doit contenir les nom des deux auteurs, séparés par un ''underscore'' (_),
+par exemple: `dupond_dupont.tar.gz`.
+Faites particulièrement attention à cette archive. elle fera l'objet d'une correction automatique pour la
+validation des sources, d'où le format strict.
+Pour être surs de vous, le listing du contenu de l'archive doit donner cette liste avec ces noms,
+et rien de plus (l'ordre des fichiers n'importe pas):
+{{{
+$ tar tzf nombinome0_nombinome1.tar.gz
+tp1/
+tp1/__init__.py
+tp1/src/
+tp1/src/iqzz.c
+tp1/src/libu.c
+tp1/rapport.pdf
+tp1/rendu.py
+$
+}}}
+Envoyez cette archive avant le 13/02/2007, 18h00 à [MailAsim:nipo Nicolas Pouillon].