Context Navigation

Changes between Version 33 and Version 34 of SoclibCourseTp5

Timestamp:: Dec 20, 2010, 12:38:56 PM (15 years ago)
Author:: alain
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

SoclibCourseTp5

-              v33
+              v34
 Chaque composant est donc repèré par un couple `(cluster_index, local_index)`.
+L'espace d'adressage reste partagé par tous les composants du système (quel que soit leur cluster), et n'importe
+quel initiateur peut directement adresser n'importe quelle cible. Si l'initiateur et la cible n'appartiennent pas au même
+cluster, les paquets VCI (commande et réponse) sont acheminés grace à un interconnect global (généralement un
+micro-réseau intégré ou NoC).
+Ce regroupement en clusters répond généralement à deux objectifs:
+ * D'un point de vue architecture, regrouper dans un même cluster les composants qui communiquent beaucoup entre eux permet de réduire la latence des communications, et de minimiser la consommation. Ce découpage permet également de distribuer la mémoire embarquée, et d'éviter le goulot d'étranglement que constituerait un unique banc mémoire sur la puce (même si l'accès à la mémoire externe reste un goulot d'étranglement).
+Les architectures clusterisées sont généralement des architectures NUMA (Non Uniform Memory Access). On trouve en effet un banc mémoire physique par cluster, afin d'éviter de remplacer le goulot d'étranglement du bus partagé  par le goulot d'étranglement de l'accès à un unique banc mémoire. La mémoire est donc physiquement distribuée, même si l'espace d'adressage reste partagé par tous les composants du système (quel que soit leur cluster).
+NUMA signifie donc deux chose :
+ * n'importe quel initiateur peut directement adresser n'importe quelle cible,
+ * la latence  et la consommation énérgétique seront beaucoup plus faible lorsque qu'un processeur accède à la mémoire locale (dans le même cluster) que lorsqu'il accède à une mémoire distante ( dans un autre cluster.
+Si l'initiateur et la cible n'appartiennent pas au même cluster, les paquets VCI (commande et réponse) sont acheminés grace à un interconnect global (généralement un micro-réseau intégré sur puce).
+Les architectures NUMA clusterisées visent donc deux objectifs:
+ * D'un point de vue performance, on peut réduire la consommation énergétique et la latence des communications en regroupant dans un même cluster les composants qui communiquent beaucoup entre eux.
  * D'un point de vue électrique, le découpage en clusters permet de résoudre en partie les problèmes d'horlogerie, puisque chaque cluster peut être implanté dans un domaine d'horloge séparé (approche GALS : Globally Asynchronous / Locally Synchronous). Le franchissement des frontières d'horlogre est alors la responsabilité du micro-réseau assurant les communications inter-clusters.
+Remarquez cependant quela capacité de stockage de la mémoire embarquée n'est jamais suffisante, et que l'accès à la mémoire externe reste un goulot d'étranglement.
 == 3.1 structuration des adresses ==