1 | \section{Vue d'ensemble} |
---|
2 | |
---|
3 | \slidetitle{Vue d'ensemble} |
---|
4 | { |
---|
5 | \printgraph{MORPHEO_micro_architecture-overview}{0.48} |
---|
6 | } |
---|
7 | { |
---|
8 | } |
---|
9 | |
---|
10 | \slidetitle{Avancement} |
---|
11 | { |
---|
12 | \printgraph{MORPHEO_micro_architecture-overview-20080225}{0.48} |
---|
13 | |
---|
14 | } |
---|
15 | { |
---|
16 | } |
---|
17 | |
---|
18 | \section{Statistiques} |
---|
19 | |
---|
20 | \slidetitle{Statistiques} |
---|
21 | { |
---|
22 | Refonte complète de la manière de générer les statistiques. |
---|
23 | \begin{description} |
---|
24 | \item[Déclaration]~ |
---|
25 | \begin{itemize} |
---|
26 | \item Stat * \_stat; |
---|
27 | \item counter\_t * \_nb\_inst; |
---|
28 | \end{itemize} |
---|
29 | \item[Construction / Destruction]~\\ |
---|
30 | La classe {\it Stat} à 4 paramètres : |
---|
31 | \begin{enumerate} |
---|
32 | \item Nom de l'instance |
---|
33 | \item Nom du composant |
---|
34 | \item Nombre de cycles à ignorer avant l'évaluation des statistiques |
---|
35 | \item Période entre deux statistiques |
---|
36 | \end{enumerate} |
---|
37 | Lors de la destruction de l'objet, un fichier de statistiques au format XML est généré. |
---|
38 | \end{description} |
---|
39 | } |
---|
40 | { |
---|
41 | } |
---|
42 | |
---|
43 | \slide |
---|
44 | { |
---|
45 | \begin{description} |
---|
46 | \item[Compteur]~ |
---|
47 | \begin{itemize} |
---|
48 | \item \_nb\_inst = \_stat $->$ create\_variable\\("nb\_inst"); |
---|
49 | \item \_average\_inst = \_stat $->$ create\_counter\\("average\_inst", "IPC", "Instructions by cycle"); |
---|
50 | \item \_stat $->$create\_expr\\("average\_inst", "/ nb\_inst cycle", false); |
---|
51 | \end{itemize} |
---|
52 | \item[Run time]~ |
---|
53 | \begin{itemize} |
---|
54 | \item (* \_nb\_inst) ++ ; |
---|
55 | \item A la fin de chaque fonction de transition de chaque composant : \_stat $->$ end\_cycle(); |
---|
56 | \end{itemize} |
---|
57 | \item[Composant interne]~ |
---|
58 | \begin{itemize} |
---|
59 | \item \_stat $->$ add\_stat (component $->$ \_stat);\\ |
---|
60 | Le fichier de statistiques du "top level" contiendra les statistiques des composants internes. |
---|
61 | \end{itemize} |
---|
62 | \end{description} |
---|
63 | } |
---|
64 | { |
---|
65 | } |
---|
66 | |
---|
67 | \section{Zoom sur ...} |
---|
68 | |
---|
69 | \subsection{Custom unit} |
---|
70 | \slidetitle{Custom unit} |
---|
71 | { |
---|
72 | La norme OpenRISC propose : |
---|
73 | \begin{itemize} |
---|
74 | \item 14 codes opérations réservés |
---|
75 | \begin{itemize} |
---|
76 | \item 8 ORBIS. |
---|
77 | \item 2 ORFPX (1 simple précision et 1 double précision). |
---|
78 | \item 4 ORVDX. |
---|
79 | \end{itemize} |
---|
80 | \item 8 groupes pour les registres spéciaux |
---|
81 | \item 7 exceptions réservées |
---|
82 | \end{itemize} |
---|
83 | } |
---|
84 | { |
---|
85 | } |
---|
86 | |
---|
87 | \slidetitle{Nos limitations} |
---|
88 | { |
---|
89 | \begin{itemize} |
---|
90 | \item Une instruction custom ne cible qu'un seul groupe custom. |
---|
91 | \item Un groupe ne peut être instancier qu'une seule fois par thread. |
---|
92 | \item L'interface de l'unité custom est fixe. |
---|
93 | \item Les unités custom peuvent générer n'importe quelles exceptions custom (plus l'exception "RANGE"). |
---|
94 | \item Seule une exécution d'opération custom provoque des exceptions. |
---|
95 | \end{itemize} |
---|
96 | } |
---|
97 | { |
---|
98 | } |
---|
99 | |
---|
100 | \slidetitle{Implémentation} |
---|
101 | { |
---|
102 | L'utilisateur doit fournir au composant "Execute\_loop" un pointeur sur une fonction dont le prototype est : |
---|
103 | |
---|
104 | \begin{itemize} |
---|
105 | \item custom\_information\_t {\it get\_information} (int context); |
---|
106 | \end{itemize} |
---|
107 | |
---|
108 | custom\_information\_t est une structure qui regroupe plusieurs pointeurs de fonction. |
---|
109 | } |
---|
110 | { |
---|
111 | } |
---|
112 | |
---|
113 | \slide |
---|
114 | { |
---|
115 | |
---|
116 | \begin{itemize} |
---|
117 | \item bool {\it get\_valid\_group } (int gpr); |
---|
118 | \item int {\it get\_nb\_register } (int gpr); |
---|
119 | \item access\_mode\_t {\it get\_mode } (int gpr, int reg); |
---|
120 | \item custom\_decod\_t * {\it get\_decod } (Toperation\_t op); |
---|
121 | \item custom\_execute\_transition\_t * {\it get\_execute\_reset } (int gpr); |
---|
122 | \item custom\_execute\_transition\_t * {\it get\_execute\_transition} (int gpr); |
---|
123 | \item custom\_execute\_genMoore\_t * {\it get\_execute\_genMoore } (Toperation\_t op); |
---|
124 | \item custom\_vhdl\_t * {\it get\_vhdl\_decod } (void); |
---|
125 | \item custom\_vhdl\_t * {\it get\_vhdl\_execute } (void); |
---|
126 | \end{itemize} |
---|
127 | } |
---|
128 | { |
---|
129 | } |
---|
130 | |
---|
131 | \subsection{Morpheo v1} |
---|
132 | \slidetitle{Morpheo v1} |
---|
133 | { |
---|
134 | \printgraph{MORPHEO_overview}{0.67} |
---|
135 | } |
---|
136 | { |
---|
137 | } |
---|
138 | |
---|
139 | \subsection{Load Store Unit} |
---|
140 | \slidetitle{Load Store Unit} |
---|
141 | { |
---|
142 | \begin{itemize} |
---|
143 | \item MORPHEO v1 : perte de performance du à la gestion de la Load Store Unit. |
---|
144 | \begin{itemize} |
---|
145 | \item Load Store Unit est placé dans la OOO\_Engine : insertion in-order. |
---|
146 | \item Le calcul d'adresse est réalisé par les ALU. |
---|
147 | \item Lancement tardif des lectures. |
---|
148 | \end{itemize} |
---|
149 | \item Modèle mémoire : weakly ordered.\\Présence d'instruction de synchronisation. |
---|
150 | \item Si mémoire virtuelle : Bit WOM (Weakly-Ordered-Memory)\\(si = 0, load/store in-order sans prefetch). |
---|
151 | \end{itemize} |
---|
152 | |
---|
153 | |
---|
154 | % Graphe expliquant l'implémentation de la LSU de la v1 |
---|
155 | } |
---|
156 | { |
---|
157 | } |
---|
158 | |
---|
159 | \slidetitle{Augmenter la performance (1)} |
---|
160 | { |
---|
161 | \begin{itemize} |
---|
162 | \item Insertion dans le LSU out-of-order |
---|
163 | \begin{description} |
---|
164 | \item [Comment ?] Gestion des pointeurs dans le OOO\_Engine |
---|
165 | \item [Pourquoi ?] La LSU peut être placer dans l'Execute\_loop (au coeur de la boucle Read / Write). |
---|
166 | \end{description} |
---|
167 | \end{itemize} |
---|
168 | |
---|
169 | \printgraph{MORPHEO_component-load_store_queue-ooo}{1} |
---|
170 | } |
---|
171 | { |
---|
172 | } |
---|
173 | |
---|
174 | |
---|
175 | \slidetitle{Augmenter la performance (2)} |
---|
176 | { |
---|
177 | \begin{itemize} |
---|
178 | \item Lectures spéculatives : Lancer la lecture avant de vérifier les dépendances avec des stores précédents. |
---|
179 | \begin{description} |
---|
180 | \item [Comment ?] Accès au cache dès réceptions de la lecture. Ajout d'une file d'attente qui va attendre puis vérifier les dépendence avec les stores. |
---|
181 | \item [Pourquoi ?] Dépendances RAW entre accès mémoires relativement rare. |
---|
182 | \end{description} |
---|
183 | \end{itemize} |
---|
184 | |
---|
185 | \printgraph{MORPHEO_component-load_store_queue-load_speculative}{1} |
---|
186 | } |
---|
187 | { |
---|
188 | } |
---|
189 | |
---|
190 | \slidetitle{Augmenter la performance (3)} |
---|
191 | { |
---|
192 | \begin{itemize} |
---|
193 | \item Commit spéculatif des lectures. |
---|
194 | \begin{description} |
---|
195 | \item [Comment ?] Ecrire le résultat dans le banc de registres dès réceptions de la réponse. |
---|
196 | \item [Pourquoi ?] Diminuer la surface de la store queue : vérifier des dépendances sur plusieurs cycles. |
---|
197 | \end{description} |
---|
198 | \end{itemize} |
---|
199 | |
---|
200 | \printgraph{MORPHEO_component-load_store_queue-commit_speculative}{1} |
---|
201 | } |
---|
202 | { |
---|
203 | } |
---|
204 | |
---|
205 | \slidetitle{Augmenter la performance (4)} |
---|
206 | { |
---|
207 | \begin{itemize} |
---|
208 | \item Bypass du résultat des lectures |
---|
209 | \begin{description} |
---|
210 | \item [Comment ?] Ajouter le contenu de la check queue au réseau de bypass. |
---|
211 | \item [Pourquoi ?] Augmenter la performance. |
---|
212 | \end{description} |
---|
213 | \end{itemize} |
---|
214 | |
---|
215 | \printgraph{MORPHEO_component-load_store_queue-commit_speculative_bypass}{1} |
---|
216 | } |
---|
217 | { |
---|
218 | } |
---|
219 | |
---|
220 | \subsection{Rename Unit} |
---|
221 | \slidetitle{Rename Unit} |
---|
222 | { |
---|
223 | \begin{itemize} |
---|
224 | \item Unité qui demande beaucoup de structure multi accès |
---|
225 | \item Remplacement des structures à N accès par M strutures à 1 accès (M multiple de N) |
---|
226 | \end{itemize} |
---|
227 | |
---|
228 | \printgraph{MORPHEO_component-free_list}{1} |
---|
229 | } |
---|
230 | { |
---|
231 | } |
---|
232 | |
---|
233 | \section{Etapes suivantes} |
---|
234 | \slidetitle{Etapes suivantes} |
---|
235 | { |
---|
236 | \begin{enumerate} |
---|
237 | \item Finir systemC |
---|
238 | \item Test ``limité'' |
---|
239 | \item Cache non bloquant : wrapper plusieurs xcache |
---|
240 | \item Test sur plate-forme réel |
---|
241 | \item VHDL |
---|
242 | \item Test avec la plate-forme précédente |
---|
243 | \end{enumerate} |
---|
244 | } |
---|
245 | { |
---|
246 | } |
---|