Context Navigation

← Previous Changeset
Next Changeset →

Changeset 19

Timestamp:

Jun 26, 2009, 5:23:11 AM (16 years ago)

Author:

guillaumeb

Message:

relecture des slides

Location:

trunk

Files:

: 1 added
: 7 edited

doc (modified) (1 prop)
doc/slides (modified) (1 prop)
doc/slides/1_contexte_sujet.tex (modified) (5 diffs)
doc/slides/2_definition_analyse_probleme.tex (modified) (1 diff)
doc/slides/3_principe_solution.tex (modified) (2 diffs)
doc/slides/4_identification_taches.tex (modified) (1 diff)
doc/slides/plan.txt (added)
src/l1cache.cpp (modified) (3 diffs)

Legend:

: Unmodified
: Added
: Removed

trunk/doc

Property svn:ignore

old	new
5	5	*.toc
6	6	*.snm
	7	.*.swp

trunk/doc/slides
- Property svn:ignore set to
  .*.swp

trunk/doc/slides/1_contexte_sujet.tex

-                      r17
+                      r19
 %==============================================================================
+% reviewed 0.2
+% [Contexte : La simulation c'est bien mais c'est lent]
 \begin{frame} \FT{Contexte}
     \BI
 …
     développement de compilateurs et d'applications, pour bon nombre de raisons :
        \BI
        \o Il n'est pas nécessaire d'avoir à sa disposition le micro-processeur
+       \o Il n'est pas nécessaire d'avoir à sa disposition le processeur
        \o Elle permet un diagnostic spécifique à un processeur des performances
        d'un programme
 …
     très nombreux des processeurs, il en découle des simulations très lentes,
     voire inutilisables pour simuler des architectures multic\oe ur.
+    \o Un facteur de ralentissement de 10 à 10000 est constaté entre
+    l'exécution native et la simulation d'un programme. À titre d'exemple, il
+    n'est pas rare que la simulation d'un programme s'exécutant nativement en
+    dix minutes dure jusqu'à trois semaines.
     \EI
 \end{frame} %-------------------------------------------------------------------
+% reviewed 0.2
+% [Problématique : Est-ce qu'on peut simplifier la simulation pour aller plus
+%   vite ?]
+\section{Problématique et approche}
+\begin{frame} \FT{Problématique}
+    \BI
+    \o Les simulations complètes sont trop longues pour être exploitables
+    \o Les simulations entraînent souvent des approximations du fait de
+    certaines spécificités non toujours documentées des différents processeurs.
+    \o Les modèles de simulation doivent donc être simplifiés, tout en
+    préservant la pertinence de la simulation : on doit garder une bonne
+    approximation du comportement des applications, notamment dans le cas
+    d'applications utilisant des fonctionnalités  multic\oe urs.
+    \EI
+\end{frame}
+% reviewed 0.1++
+% [Approche : simuler seulement le comportement de la mémoire]
+\begin{frame} \FT{Approche}
+    \BI
+    \o % simulation gros grain
+    \o %    hum hum : la mémoire est un facteur déterminant
+    \o % modèle choisi : intégrer uniquement la simulation
+        % des accès mémoire et un temps de traitement des
+        % instructions
+    \o %    et le 1
+    \EI
+\end{frame}
 \begin{frame} \FT{Description détaillée}
     \BI
 …
     l'aspect mémoire :
         \BI
         \o La hierarchie de cache
+        \o La hiérarchie de cache
         \o La communication entre les cache
         \o La gestion de la cohérence entre les caches partagés
 …
         \BI
         \o SimpleScalar, qui est inutilisable (sans extension) pour simuler
         des systèmes multi-processeurs ou multic\oe urs.
+        des systèmes multiprocesseurs ou multic\oe urs.
         \o Unisim, qui est beaucoup plus modulaire, mais qui procure un
         framework assez important, dont il aurait fallu extraire la
         simple modélisation de cache.
         \o Simics, semble offrir des avantages considérables sur les autres,
         notemment quant à sa vitesse d'exécution, mais c'est un logiciel
+        notamment quant à sa vitesse d'exécution, mais c'est un logiciel
         propriétaire que nous n'avons pas testé
         \EI

trunk/doc/slides/2_definition_analyse_probleme.tex

-                      r17
+                      r19
 %==============================================================================
 \begin{frame} \FT{Simulation de caches de processeurs multicoeurs}
+\begin{frame} \FT{Simulation de caches de processeurs multic\oe urs}
     \BI
     \o La simulation doit prendre en compte les aspects suivants :
         - hierarchie paramétrabe de plusieurs caches, de façon modulaire
+        - hiérarchie paramétrable de plusieurs caches, de façon modulaire
         (cache L1, L2, etc.)
     \o communications entres les caches hierarchiques
     \o gestion de caches de processeurs multicoeurs :
+    \o communications entres les caches hiérarchiques
+    \o gestion de caches de processeurs multic\oe urs :
         \BI
         \o caches partagés

trunk/doc/slides/3_principe_solution.tex

-                      r17
+                      r19
 \begin{frame} \FT{Principe de la solution}
     \BI
     \o Modélisation de la hierarchie de cache
+    \o Modélisation de la hiérarchie de cache
     \o Traitement d'une séquence d'accès (read, write) à des adresses
     \o Un modèle très simplifié pour le reste des instructions:
 …
         \o pas d'analyse de dépendances
         \o pas de prédiction de branchement
         \o constantes pour les temps d'execution des instructions
+        \o constantes pour les temps d'exécution des instructions
         \EI
     \o le traitement des autres instructions est encore à définir

trunk/doc/slides/4_identification_taches.tex

r17	r19
7	7	\o Étude modèle simplifié du processeur, différentes approches possibles
8	8	\BI
9		\o in~~trumentation d'un exécutable (modèle de v~~algrind)
	9	\o instrumentation d'un exécutable (modèle de Valgrind)
10	10	\o émulation
11	11	\EI

trunk/src/l1cache.cpp

-                      r16
+                      r19
 #include "l1cache.h"
+// TODO il manque un signal pour faire des requetes au L2
 void L1Cache::read()
 …
     miss_info = false;
     hit_info = false;
+    out_activate = false;
 …
         Address element(req, cstore->get_line_width());
-        //
-        //  XXX FIXME A PARTIR d'ICI C'EST N'IMPORTE QUOI
-        //
         //  rappel : processing queue c'est le chargement interne. Si un élement
         //  est déjà chargé dans le cache, il va dans la processing queue,
         //  sinon, il part en requete dans le L2
         //
-        //  ca m'apprendra a faire du copier coller et commiter sans verifier
         //
         // Si la donnée est chargée dans le cache
         if (cstore->is_loaded(element)) {
             out_activate = true;
+            processing_queue->insert(element, latency);
+            hit_info = true;
             // affichage de l'action
             cout << sc_time_stamp() << " L1Cache : access to loaded data [" << element << "]  -> hit" << endl;
+            cout << sc_time_stamp() << " L1Cache : access to data [" << element << "]  -> hit ... [start loading]" << endl;
-            hit_info = true;
-            out_data = in_data;
         } else {
+            // XXX requete a un module exterieur
             // affichage de l'action
             cout << sc_time_stamp() << " L1Cache : access to loaded data [" << element << "]  -> miss" << endl;
+            cout << sc_time_stamp() << " L1Cache : access to data [" << element << "]  -> miss" << endl;
+            out_data = in_data;
             miss_info = true;
-            processing_queue->insert(element, latency);
-            processing_queue->print();
+        }
-        //
-        // XXX JUSQU'A ICI, C'est N'IMPORTE QUOI
-        //
+    }

Note: See TracChangeset for help on using the changeset viewer.