Changes between Version 33 and Version 34 of SoclibCourseTp5


Ignore:
Timestamp:
Dec 20, 2010, 12:38:56 PM (14 years ago)
Author:
alain
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • SoclibCourseTp5

    v33 v34  
    195195Chaque composant est donc repèré par un couple `(cluster_index, local_index)`.
    196196
    197 L'espace d'adressage reste partagé par tous les composants du système (quel que soit leur cluster), et n'importe
    198 quel initiateur peut directement adresser n'importe quelle cible. Si l'initiateur et la cible n'appartiennent pas au même
    199 cluster, les paquets VCI (commande et réponse) sont acheminés grace à un interconnect global (généralement un
    200 micro-réseau intégré ou NoC).
    201 
    202 Ce regroupement en clusters répond généralement à deux objectifs:
    203  * D'un point de vue architecture, regrouper dans un même cluster les composants qui communiquent beaucoup entre eux permet de réduire la latence des communications, et de minimiser la consommation. Ce découpage permet également de distribuer la mémoire embarquée, et d'éviter le goulot d'étranglement que constituerait un unique banc mémoire sur la puce (même si l'accès à la mémoire externe reste un goulot d'étranglement).
     197Les architectures clusterisées sont généralement des architectures NUMA (Non Uniform Memory Access). On trouve en effet un banc mémoire physique par cluster, afin d'éviter de remplacer le goulot d'étranglement du bus partagé  par le goulot d'étranglement de l'accès à un unique banc mémoire. La mémoire est donc physiquement distribuée, même si l'espace d'adressage reste partagé par tous les composants du système (quel que soit leur cluster).
     198
     199NUMA signifie donc deux chose :
     200 * n'importe quel initiateur peut directement adresser n'importe quelle cible,
     201 * la latence  et la consommation énérgétique seront beaucoup plus faible lorsque qu'un processeur accède à la mémoire locale (dans le même cluster) que lorsqu'il accède à une mémoire distante ( dans un autre cluster.
     202
     203Si l'initiateur et la cible n'appartiennent pas au même cluster, les paquets VCI (commande et réponse) sont acheminés grace à un interconnect global (généralement un micro-réseau intégré sur puce).
     204
     205Les architectures NUMA clusterisées visent donc deux objectifs:
     206 * D'un point de vue performance, on peut réduire la consommation énergétique et la latence des communications en regroupant dans un même cluster les composants qui communiquent beaucoup entre eux.
    204207 * D'un point de vue électrique, le découpage en clusters permet de résoudre en partie les problèmes d'horlogerie, puisque chaque cluster peut être implanté dans un domaine d'horloge séparé (approche GALS : Globally Asynchronous / Locally Synchronous). Le franchissement des frontières d'horlogre est alors la responsabilité du micro-réseau assurant les communications inter-clusters.
     208
     209Remarquez cependant quela capacité de stockage de la mémoire embarquée n'est jamais suffisante, et que l'accès à la mémoire externe reste un goulot d'étranglement.
    205210
    206211== 3.1 structuration des adresses ==