source: trunk/platforms/tsarv4_generic_mmu/top.cpp @ 256

Last change on this file since 256 was 255, checked in by alain, 12 years ago

Two modifications in the "tsarv4_generic_mmu" platform:
1) improving the debug mechanisms (better control on the command line)
2) changing/simplifying the IRQs wiring to ICU in the tsarV4_cluster_mmu.

File size: 32.4 KB
Line 
1/////////////////////////////////////////////////////////////////////////
2// File: top.cpp
3// Author: Alain Greiner
4// Copyright: UPMC/LIP6
5// Date : august 2012
6// This program is released under the GNU public license
7/////////////////////////////////////////////////////////////////////////
8// This file define a generic TSAR architecture with virtual memory.
9// - It uses vci_local_crossbar as local interconnect
10// - It uses virtual_dspin as global interconnect
11// - It uses the vci_cc_vcache_wrapper_v4
12// - It uses the vci_mem_cache_v4
13// - It contains one vci_xicu and one vci_multi_dma per cluster.
14// The peripherals BDEV, FBUF, MTTY, and the boot BROM
15// are in the cluster containing address 0xBFC00000.
16//
17// It is build with one single component implementing a cluster:
18// The Tsarv4ClusterMmu component is defined in files
19// tsarv4_cluster_mmu.* (with * = cpp, h, sd)
20//
21// The IRQs are connected to XICUs as follow:
22// - The IRQ_IN[0] to IRQ_IN[7] ports are not used in all clusters.
23// - The DMA IRQs are connected to IRQ_IN[8] to IRQ_IN[15] in all clusters.
24// - The TTY IRQs are connected to IRQ_IN[16] to IRQ_IN[30] in I/O cluster.
25// - The BDEV IRQ is connected to IRQ_IN[31] in I/O cluster.
26//
27// The physical address space is 32 bits.
28// The number of clusters cannot be larger than 256.
29// The number of processors per cluster cannot be larger than 8.
30//
31// The hardware parameters are :
32// - xmax     : number of clusters in a row (power of 2)
33// - ymax     : number of clusters in a column (power of 2)
34// - nb_procs : number of processors per cluster (power of 2)
35// - nb_dmas  : number of DMA channels per cluster (< 9)
36// - nb_ttys  : number of TTYs in I/O cluster (< 16)
37//
38// General policy for 32 bits physical address decoding:
39// All segments base addresses are multiple of 64 Kbytes
40// Therefore the 16 address MSB bits completely define the target:
41// The (x_width + y_width) MSB bits (left aligned) define
42// the cluster index, and the 8 LSB bits define the local index:
43//      | X_ID  | Y_ID  |---| LADR |     OFFSET          |
44//      |x_width|y_width|---|  8   |       16            |
45/////////////////////////////////////////////////////////////////////////
46
47#include <systemc>
48#include <sys/time.h>
49#include <iostream>
50#include <sstream>
51#include <cstdlib>
52#include <cstdarg>
53#include <stdint.h>
54
55#include "gdbserver.h"
56#include "mapping_table.h"
57#include "tsarv4_cluster_mmu.h"
58#include "alloc_elems.h"
59
60///////////////////////////////////////////////////
61//      OS
62///////////////////////////////////////////////////
63
64#define USE_ALMOS 0
65#define almos_bootloader_pathname "/Users/alain/soc/tsar-svn-june-2010/softs/almos/bootloader/bin/bootloader-soclib-mipsel.bin"
66#define almos_kernel_pathname "/Users/alain/soc/tsar-svn-june-2010/softs/almos/kernel/bin/kernel-soclib-mipsel.bin@0xbfc10000:D"
67#define almos_archinfo_pathname "/Users/alain/soc/tsar-svn-june-2010/softs/almos/arch_bins/arch-info_4_4.bin@0xBFC08000:D"
68
69///////////////////////////////////////////////////
70//               Parallelisation
71///////////////////////////////////////////////////
72
73#define USE_OPENMP               0
74#define OPENMP_THREADS_NR        8
75
76#if USE_OPENMP
77#include <omp.h>
78#endif
79
80//  cluster index (computed from x,y coordinates)
81#define cluster(x,y)   (y + ymax*x)
82
83// flit widths for the DSPIN network
84#define cmd_width            40
85#define rsp_width            33
86
87// VCI format
88#define cell_width            4
89#define address_width         32
90#define plen_width            8
91#define error_width           2
92#define clen_width            1
93#define rflag_width           1
94#define srcid_width           14
95#define pktid_width           4
96#define trdid_width           4
97#define wrplen_width          1
98
99///////////////////////////////////////////////////
100//     Parameters default values         
101///////////////////////////////////////////////////
102
103#define MESH_XMAX             2
104#define MESH_YMAX             2
105
106#define NB_PROCS              1
107#define NB_TTYS               8
108#define NB_DMAS               1
109
110#define XRAM_LATENCY          0
111
112#define MEMC_WAYS             16
113#define MEMC_SETS             256
114
115#define L1_IWAYS              4
116#define L1_ISETS              64
117
118#define L1_DWAYS              4
119#define L1_DSETS              64
120
121#define FBUF_X_SIZE           128
122#define FBUF_Y_SIZE           128
123
124#define BDEV_SECTOR_SIZE      512
125#define BDEV_IMAGE_NAME       "/Users/alain/Documents/licence/almo_svn_2011/soft/giet_vm/display/images.raw"
126
127#define BOOT_SOFT_NAME        "/Users/alain/Documents/licence/almo_svn_2011/soft/giet_vm/soft.elf"
128
129#define MAX_FROZEN_CYCLES     10000
130
131#define TRACE_MEMC_ID         1000000
132#define TRACE_PROC_ID         1000000
133
134/////////////////////////////////////////////////////////
135//    Physical segments definition
136/////////////////////////////////////////////////////////
137// There is 3 segments replicated in all clusters:
138// - seg_memc   -> MEMC / BASE = 0x**000000    (12 M bytes)
139// - seg_icu    -> ICU  / BASE = 0x**F00000
140// - seg_dma    -> CDMA / BASE = 0x**F30000
141//
142// There is 4 specific segments in the "IO" cluster
143// (containing address 0xBF000000)
144// - seg_reset  -> BROM / BASE = 0xBFC00000   (1 Mbytes)
145// - seg_fbuf   -> FBUF / BASE = 0xBFD00000   (2 M bytes)
146// - seg_bdev   -> BDEV / BASE = 0xBFF10000
147// - seg_tty    -> MTTY / BASE = 0x**F20000
148//
149// There is one special segment corresponding to
150// the processors in the coherence address space
151// - seg_proc   -> PROC / BASE = 0x**B0 to 0xBF
152///////////////////////////////////////////////////
153
154// specific segments in "IO" cluster : absolute physical address
155
156#define BROM_BASE               0xBFC00000     
157#define BROM_SIZE               0x00100000
158
159#define FBUF_BASE               0x80D00000     
160#define FBUF_SIZE               0x00200000
161
162#define BDEV_BASE               0x80F10000     
163#define BDEV_SIZE               0x00001000
164
165#define MTTY_BASE               0x80F20000     
166#define MTTY_SIZE               0x00001000
167
168// replicated segments : physical address is incremented by an offset
169//     offset  = cluster(x,y) << (address_width-x_width-y_width);
170
171#define MEMC_BASE               0x00000000     
172#define MEMC_SIZE               0x00C00000
173
174#define XICU_BASE               0x00F00000     
175#define XICU_SIZE               0x00001000
176
177#define CDMA_BASE               0x00F30000     
178#define CDMA_SIZE               0x00008000
179
180////////////////////////////////////////////////////////////////////
181//     TGTID definition in direct space
182// For all components:  global TGTID = global SRCID = cluster_index
183////////////////////////////////////////////////////////////////////
184
185#define MEMC_TGTID               0
186#define XICU_TGTID               1
187#define CDMA_TGTID               2
188#define MTTY_TGTID               3
189#define FBUF_TGTID               4
190#define BROM_TGTID               5
191#define BDEV_TGTID               6
192
193/////////////////////////////////
194int _main(int argc, char *argv[])
195{
196   using namespace sc_core;
197   using namespace soclib::caba;
198   using namespace soclib::common;
199
200
201   char     soft_name[256] = BOOT_SOFT_NAME;     // pathname to binary code
202   size_t   ncycles        = 1000000000;         // simulated cycles
203   size_t   xmax           = MESH_XMAX;          // number of clusters in a row
204   size_t   ymax           = MESH_YMAX;          // number of clusters in a column
205   size_t   nb_procs       = NB_PROCS;           // number of processors per cluster
206   size_t   nb_dmas        = NB_DMAS;            // number of RDMA channels per cluster
207   size_t   nb_ttys        = NB_TTYS;            // number of TTY terminals in I/O cluster
208   size_t   xfb            = FBUF_X_SIZE;        // frameBuffer column number
209   size_t   yfb            = FBUF_Y_SIZE;        // frameBuffer lines number
210   size_t   memc_ways      = MEMC_WAYS;
211   size_t   memc_sets      = MEMC_SETS;
212   size_t   l1_d_ways      = L1_DWAYS;
213   size_t   l1_d_sets      = L1_DSETS;
214   size_t   l1_i_ways      = L1_IWAYS;
215   size_t   l1_i_sets      = L1_ISETS;
216   char     disk_name[256] = BDEV_IMAGE_NAME;    // pathname to the disk image
217   size_t   blk_size       = BDEV_SECTOR_SIZE;   // block size (in bytes)
218   size_t   xram_latency   = XRAM_LATENCY;       // external RAM latency
219   bool     debug_ok       = false;              // trace activated
220   size_t   debug_period   = 1;                  // trace period
221   size_t   debug_memc_id  = TRACE_MEMC_ID;      // index of memc to be traced (cluster_id) 
222   size_t   debug_proc_id  = TRACE_PROC_ID;      // index of proc to be traced
223   uint32_t debug_from     = 0;                  // trace start cycle
224   uint32_t frozen_cycles  = MAX_FROZEN_CYCLES;  // monitoring frozen processor
225
226   ////////////// command line arguments //////////////////////
227   if (argc > 1)
228   {
229      for (int n = 1; n < argc; n = n + 2)
230      {
231         if ((strcmp(argv[n],"-NCYCLES") == 0) && (n+1<argc))
232         {
233            ncycles = atoi(argv[n+1]);
234         }
235         else if ((strcmp(argv[n],"-NPROCS") == 0) && (n+1<argc))
236         {
237            nb_procs = atoi(argv[n+1]);
238            assert( ((nb_procs == 1) || (nb_procs == 2) || 
239                     (nb_procs == 4) || (nb_procs == 8)) &&
240                  "NPROCS must be equal to 1, 2, 4, or 8");
241         }
242         else if ((strcmp(argv[n],"-NTTYS") == 0) && (n+1<argc))
243         {
244            nb_ttys = atoi(argv[n+1]);
245            assert( (nb_ttys < 16) &&
246                   "The number of TTY terminals cannot be larger than 15");
247         }
248         else if ((strcmp(argv[n],"-NDMAS") == 0) && (n+1<argc))
249         {
250            nb_dmas = atoi(argv[n+1]);
251            assert( (nb_dmas < 9) &&
252                   "The number of DMA channels per cluster cannot be larger than 8");
253         }
254         else if ((strcmp(argv[n],"-XMAX") == 0) && (n+1<argc))
255         {
256            xmax = atoi(argv[n+1]);
257            assert( ((xmax == 1) || (xmax == 2) || (xmax == 4) || (xmax == 8) || (xmax == 16)) 
258                  && "The XMAX parameter must be 2, 4, 8, or 16" );
259         }
260
261         else if ((strcmp(argv[n],"-YMAX") == 0) && (n+1<argc))
262         {
263            ymax = atoi(argv[n+1]);
264            assert( ((ymax == 1) || (ymax == 2) || (ymax == 4) || (ymax == 8) || (ymax == 16)) 
265                  && "The YMAX parameter must be 2, 4, 8, or 16" );
266         }
267         else if ((strcmp(argv[n],"-XFB") == 0) && (n+1<argc))
268         {
269            xfb = atoi(argv[n+1]);
270         }
271         else if ((strcmp(argv[n],"-YFB") == 0) && (n+1<argc) )
272         {
273            yfb = atoi(argv[n+1]);
274         }
275         else if ((strcmp(argv[n],"-SOFT") == 0) && (n+1<argc) )
276         {
277            strcpy(soft_name, argv[n+1]);
278         }
279         else if ((strcmp(argv[n],"-DISK") == 0) && (n+1<argc) )
280         {
281            strcpy(disk_name, argv[n+1]);
282         }
283         else if ((strcmp(argv[n],"-TRACE") == 0) && (n+1<argc) )
284         {
285            debug_ok = true;
286            debug_from = atoi(argv[n+1]);
287         }
288         else if ((strcmp(argv[n],"-MEMCID") == 0) && (n+1<argc) )
289         {
290            debug_memc_id = atoi(argv[n+1]);
291            assert( (debug_memc_id < (xmax*ymax) ) && 
292                   "debug_memc_id larger than XMAX * YMAX" );
293         }
294         else if ((strcmp(argv[n],"-PROCID") == 0) && (n+1<argc) )
295         {
296            debug_proc_id = atoi(argv[n+1]);
297            assert( (debug_proc_id < (xmax*ymax*nb_procs) ) && 
298                   "debug_proc_id larger than XMAX * YMAX * BN_PROCS" );
299         }
300         else if ((strcmp(argv[n], "-MCWAYS") == 0) && (n+1 < argc))
301         {
302            memc_ways = atoi(argv[n+1]);
303         }
304         else if ((strcmp(argv[n], "-MCSETS") == 0) && (n+1 < argc))
305         {
306            memc_sets = atoi(argv[n+1]);
307         }
308         else if ((strcmp(argv[n], "-XLATENCY") == 0) && (n+1 < argc))
309         {
310            xram_latency = atoi(argv[n+1]);
311         }
312         else if ((strcmp(argv[n], "-FROZEN") == 0) && (n+1 < argc))
313         {
314            frozen_cycles = atoi(argv[n+1]);
315         }
316         else if ((strcmp(argv[n], "-PERIOD") == 0) && (n+1 < argc))
317         {
318            debug_period = atoi(argv[n+1]);
319         }
320         else
321         {
322            std::cout << "   Arguments on the command line are (key,value) couples." << std::endl;
323            std::cout << "   The order is not important." << std::endl;
324            std::cout << "   Accepted arguments are :" << std::endl << std::endl;
325            std::cout << "     -SOFT pathname_for_embedded_soft" << std::endl;
326            std::cout << "     -DISK pathname_for_disk_image" << std::endl;
327            std::cout << "     -NCYCLES number_of_simulated_cycles" << std::endl;
328            std::cout << "     -NPROCS number_of_processors_per_cluster" << std::endl;
329            std::cout << "     -NTTYS total_number_of_TTY_terminals" << std::endl;
330            std::cout << "     -NDMAS number_of_DMA_channels_per_cluster" << std::endl;
331            std::cout << "     -XMAX number_of_clusters_in_a_row" << std::endl;
332            std::cout << "     -YMAX number_of_clusters_in_a_column" << std::endl;
333            std::cout << "     -TRACE debug_start_cycle" << std::endl;
334            std::cout << "     -MCWAYS memory_cache_number_of_ways" << std::endl;
335            std::cout << "     -MCSETS memory_cache_number_of_sets" << std::endl;
336            std::cout << "     -XLATENCY external_ram_latency_value" << std::endl;
337            std::cout << "     -XFB fram_buffer_number_of_pixels" << std::endl;
338            std::cout << "     -YFB fram_buffer_number_of_lines" << std::endl;
339            std::cout << "     -FROZEN max_number_of_lines" << std::endl;
340            std::cout << "     -PERIOD number_of_cycles between trace" << std::endl;
341            std::cout << "     -MEMCID index_memc_to_be_traced" << std::endl;
342            std::cout << "     -PROCID index_proc_to_be_traced" << std::endl;
343            exit(0);
344         }
345      }
346   }
347
348   std::cout << std::endl;
349   std::cout << " - NB_CLUSTERS = " << xmax*ymax << std::endl;
350   std::cout << " - NB_PROCS    = " << nb_procs <<  std::endl;
351   std::cout << " - NB_TTYS     = " << nb_ttys <<  std::endl;
352   std::cout << " - NB_DMAS     = " << nb_dmas <<  std::endl;
353   std::cout << " - MAX_FROZEN  = " << frozen_cycles << std::endl;
354   std::cout << " - MEMC_WAYS   = " << memc_ways << std::endl;
355   std::cout << " - MEMC_SETS   = " << memc_sets << std::endl;
356   std::cout << " - RAM_LATENCY = " << xram_latency << std::endl;
357
358   std::cout << std::endl;
359
360#if USE_OPENMP
361   omp_set_dynamic(false);
362   omp_set_num_threads(threads_nr);
363   std::cerr << "Built with openmp version " << _OPENMP << std::endl;
364#endif
365
366   // Define VCI parameters
367   typedef soclib::caba::VciParams<cell_width,
368           plen_width,
369           address_width,
370           error_width,                                   
371           clen_width,
372           rflag_width,
373           srcid_width,
374           pktid_width,
375           trdid_width,
376           wrplen_width> vci_param;
377
378   // Define parameters depending on mesh size
379   size_t   cluster_io_id;
380   size_t   x_width;
381   size_t   y_width;
382
383   if      (xmax == 1) x_width = 0;
384   else if (xmax == 2) x_width = 1;
385   else if (xmax <= 4) x_width = 2;
386   else if (xmax <= 8) x_width = 3;
387   else                x_width = 4;
388
389   if      (ymax == 1) y_width = 0;
390   else if (ymax == 2) y_width = 1;
391   else if (ymax <= 4) y_width = 2;
392   else if (ymax <= 8) y_width = 3;
393   else                y_width = 4;
394
395   cluster_io_id = 0xBF >> (8 - x_width - y_width);
396
397   /////////////////////
398   //  Mapping Tables
399   /////////////////////
400
401   // direct network
402   MappingTable maptabd(address_width, 
403         IntTab(x_width + y_width, 16 - x_width - y_width), 
404         IntTab(x_width + y_width, srcid_width - x_width - y_width), 
405         0x00FF0000);
406
407   for (size_t x = 0; x < xmax; x++)
408   {
409      for (size_t y = 0; y < ymax; y++)
410      {
411         sc_uint<address_width> offset  = cluster(x,y) << (address_width-x_width-y_width);
412
413         std::ostringstream    sh;
414         sh << "d_seg_memc_" << x << "_" << y;
415         maptabd.add(Segment(sh.str(), MEMC_BASE+offset, MEMC_SIZE, IntTab(cluster(x,y),MEMC_TGTID), true));
416
417         std::ostringstream    si;
418         si << "d_seg_xicu_" << x << "_" << y;
419         maptabd.add(Segment(si.str(), XICU_BASE+offset, XICU_SIZE, IntTab(cluster(x,y),XICU_TGTID), false));
420
421         std::ostringstream    sd;
422         sd << "d_seg_mdma_" << x << "_" << y;
423         maptabd.add(Segment(sd.str(), CDMA_BASE+offset, CDMA_SIZE, IntTab(cluster(x,y),CDMA_TGTID), false));
424
425         if ( cluster(x,y) == cluster_io_id )
426         {
427            maptabd.add(Segment("d_seg_mtty", MTTY_BASE, MTTY_SIZE, IntTab(cluster(x,y),MTTY_TGTID), false));
428            maptabd.add(Segment("d_seg_fbuf", FBUF_BASE, FBUF_SIZE, IntTab(cluster(x,y),FBUF_TGTID), false));
429            maptabd.add(Segment("d_seg_bdev", BDEV_BASE, BDEV_SIZE, IntTab(cluster(x,y),BDEV_TGTID), false));
430            maptabd.add(Segment("d_seg_brom", BROM_BASE, BROM_SIZE, IntTab(cluster(x,y),BROM_TGTID), true));
431         }
432      }
433   }
434   std::cout << maptabd << std::endl;
435
436   // coherence network
437   // - tgtid_c_proc = srcid_c_proc = local procid
438   // - tgtid_c_memc = srcid_c_memc = nb_procs
439   MappingTable maptabc(address_width, 
440         IntTab(x_width + y_width, srcid_width - x_width - y_width), 
441         IntTab(x_width + y_width, srcid_width - x_width - y_width), 
442         0x00FF0000);
443
444   for (size_t x = 0; x < xmax; x++)
445   {
446      for (size_t y = 0; y < ymax; y++)
447      {
448         sc_uint<address_width> offset  = cluster(x,y) << (address_width-x_width-y_width);
449
450         // cleanup requests must be routed to the memory cache
451         std::ostringstream sh;
452         sh << "c_seg_memc_" << x << "_" << y;
453         maptabc.add(Segment(sh.str(), (nb_procs << (address_width - srcid_width)) + offset, 
454                     0x10, IntTab(cluster(x,y), nb_procs), false));
455
456         // update & invalidate requests must be routed to the proper processor
457         for ( size_t p = 0 ; p < nb_procs ; p++) 
458         {
459            std::ostringstream sp;
460            sp << "c_seg_proc_" << x << "_" << y << "_" << p;
461            maptabc.add( Segment( sp.str() , (p << (address_width - srcid_width)) + offset , 
462                         0x10 , IntTab(cluster(x,y), p) , false)); 
463         }
464      }
465   }
466   std::cout << maptabc << std::endl;
467
468   // external network
469   MappingTable maptabx(address_width, IntTab(1), IntTab(x_width+y_width), 0xF0000000);
470
471   for (size_t x = 0; x < xmax; x++)
472   {
473      for (size_t y = 0; y < ymax ; y++)
474      { 
475         sc_uint<address_width> offset  = cluster(x,y) << (address_width-x_width-y_width);
476         std::ostringstream sh;
477         sh << "x_seg_memc_" << x << "_" << y;
478         maptabx.add(Segment(sh.str(), MEMC_BASE+offset, 
479                     MEMC_SIZE, IntTab(cluster(x,y)), false));
480      }
481   }
482   std::cout << maptabx << std::endl;
483
484   ////////////////////
485   // Signals
486   ///////////////////
487
488   sc_clock      signal_clk("clk");
489   sc_signal<bool>    signal_resetn("resetn");
490
491   // Horizontal inter-clusters DSPIN signals
492   DspinSignals<cmd_width>*** signal_dspin_h_cmd_inc =
493      alloc_elems<DspinSignals<cmd_width> >("signal_dspin_h_cmd_inc", xmax-1, ymax, 2);
494   DspinSignals<cmd_width>*** signal_dspin_h_cmd_dec =
495      alloc_elems<DspinSignals<cmd_width> >("signal_dspin_h_cmd_dec", xmax-1, ymax, 2);
496   DspinSignals<rsp_width>*** signal_dspin_h_rsp_inc =
497      alloc_elems<DspinSignals<rsp_width> >("signal_dspin_h_rsp_inc", xmax-1, ymax, 2);
498   DspinSignals<rsp_width>*** signal_dspin_h_rsp_dec =
499      alloc_elems<DspinSignals<rsp_width> >("signal_dspin_h_rsp_dec", xmax-1, ymax, 2);
500
501   // Vertical inter-clusters DSPIN signals
502   DspinSignals<cmd_width>*** signal_dspin_v_cmd_inc =
503      alloc_elems<DspinSignals<cmd_width> >("signal_dspin_v_cmd_inc", xmax, ymax-1, 2);
504   DspinSignals<cmd_width>*** signal_dspin_v_cmd_dec =
505      alloc_elems<DspinSignals<cmd_width> >("signal_dspin_v_cmd_dec", xmax, ymax-1, 2);
506   DspinSignals<rsp_width>*** signal_dspin_v_rsp_inc =
507      alloc_elems<DspinSignals<rsp_width> >("signal_dspin_v_rsp_inc", xmax, ymax-1, 2);
508   DspinSignals<rsp_width>*** signal_dspin_v_rsp_dec =
509      alloc_elems<DspinSignals<rsp_width> >("signal_dspin_v_rsp_dec", xmax, ymax-1, 2);
510
511   // Mesh boundaries DSPIN signals
512   DspinSignals<cmd_width>**** signal_dspin_false_cmd_in =
513      alloc_elems<DspinSignals<cmd_width> >("signal_dspin_false_cmd_in", xmax, ymax, 2, 4);
514   DspinSignals<cmd_width>**** signal_dspin_false_cmd_out =
515      alloc_elems<DspinSignals<cmd_width> >("signal_dspin_false_cmd_out", xmax, ymax, 2, 4);
516   DspinSignals<rsp_width>**** signal_dspin_false_rsp_in =
517      alloc_elems<DspinSignals<rsp_width> >("signal_dspin_false_rsp_in", xmax, ymax, 2, 4);
518   DspinSignals<rsp_width>**** signal_dspin_false_rsp_out =
519      alloc_elems<DspinSignals<rsp_width> >("signal_dspin_false_rsp_out", xmax, ymax, 2, 4);
520
521
522   ////////////////////////////
523   //      Components
524   ////////////////////////////
525
526#if USE_ALMOS
527   soclib::common::Loader loader(almos_bootloader_pathname,
528         almos_archinfo_pathname,
529         almos_kernel_pathname);
530#else
531   soclib::common::Loader loader(soft_name);
532#endif
533
534   typedef soclib::common::GdbServer<soclib::common::Mips32ElIss> proc_iss;
535   proc_iss::set_loader(loader);
536
537   TsarV4ClusterMmu<vci_param, proc_iss, cmd_width, rsp_width>* clusters[xmax][ymax];
538
539#if USE_OPENMP
540
541#pragma omp parallel
542   {
543#pragma omp for
544      for(size_t i = 0; i  < (xmax * ymax); i++)
545      {
546          size_t x = i / ymax;
547          size_t y = i % ymax;
548#pragma omp critical
549
550          std::cout << "building cluster_" << x << "_" << y << std::endl;
551
552          std::ostringstream sc;
553          sc << "cluster_" << x << "_" << y;
554          clusters[x][y] = new TsarV4ClusterMmu<vci_param, proc_iss, cmd_width, rsp_width>
555            (sc.str().c_str(),
556             nb_procs,
557             nb_ttys, 
558             nb_dmas, 
559             x,
560             y,
561             cluster(x,y),
562             maptabd,
563             maptabc,
564             maptabx,
565             x_width,
566             y_width,
567             MEMC_TGTID,
568             XICU_TGTID,
569             FBUF_TGTID,
570             MTTY_TGTID,
571             BROM_TGTID,
572             BDEV_TGTID,
573             CDMA_TGTID,
574             memc_ways,
575             memc_sets,
576             l1_i_ways,
577             l1_i_sets,
578             l1_d_ways,
579             l1_d_sets,
580             xram_latency,
581             (cluster(x,y) == cluster_io_id),
582             xfb,
583             yfb,
584             disk_name,
585             blk_size,
586             loader,
587             frozen_cycles,
588             debug_from,
589             debug_ok and (cluster(x,y) == debug_memc_id),
590             debug_ok and (cluster(x,y) == debug_proc_id) );
591
592         std::cout << "cluster_" << x << "_" << y << " constructed" << std::endl;
593
594       }
595   }
596
597#else  // NO OPENMP
598
599   for (size_t x = 0; x  < xmax; x++)
600   {
601       for (size_t y = 0; y < ymax; y++)
602       {
603
604         std::cout << "building cluster_" << x << "_" << y << std::endl;
605
606         std::ostringstream sc;
607         sc << "cluster_" << x << "_" << y;
608         clusters[x][y] = new TsarV4ClusterMmu<vci_param, proc_iss, cmd_width, rsp_width>
609            (sc.str().c_str(),
610             nb_procs,
611             nb_ttys,
612             nb_dmas,
613             x,
614             y,
615             cluster(x,y),
616             maptabd,
617             maptabc,
618             maptabx,
619             x_width,
620             y_width,
621             MEMC_TGTID,
622             XICU_TGTID,
623             FBUF_TGTID,
624             MTTY_TGTID,
625             BROM_TGTID,
626             BDEV_TGTID,
627             CDMA_TGTID,
628             memc_ways,
629             memc_sets,
630             l1_i_ways,
631             l1_i_sets,
632             l1_d_ways,
633             l1_d_sets,
634             xram_latency,
635             (cluster(x,y) == cluster_io_id),
636             xfb,
637             yfb,
638             disk_name,
639             blk_size,
640             loader,
641             frozen_cycles,
642             debug_from,
643             debug_ok and ( cluster(x,y) == debug_memc_id ),
644             debug_ok and ( cluster(x,y) == debug_proc_id ) );
645
646         std::cout << "cluster_" << x << "_" << y << " constructed" << std::endl;
647
648      }
649   }
650
651#endif   // USE_OPENMP
652
653   ///////////////////////////////////////////////////////////////
654   //     Net-list
655   ///////////////////////////////////////////////////////////////
656
657   // Clock & RESET
658   for (size_t x = 0; x < (xmax); x++){
659      for (size_t y = 0; y < ymax; y++){
660         clusters[x][y]->p_clk     (signal_clk);
661         clusters[x][y]->p_resetn  (signal_resetn);
662      }
663   }
664
665   // Inter Clusters horizontal connections
666   if (xmax > 1){
667      for (size_t x = 0; x < (xmax-1); x++){
668         for (size_t y = 0; y < ymax; y++){
669            for (size_t k = 0; k < 2; k++){
670               clusters[x][y]->p_cmd_out[k][EAST]      (signal_dspin_h_cmd_inc[x][y][k]);
671               clusters[x+1][y]->p_cmd_in[k][WEST]     (signal_dspin_h_cmd_inc[x][y][k]);
672               clusters[x][y]->p_cmd_in[k][EAST]       (signal_dspin_h_cmd_dec[x][y][k]);
673               clusters[x+1][y]->p_cmd_out[k][WEST]    (signal_dspin_h_cmd_dec[x][y][k]);
674               clusters[x][y]->p_rsp_out[k][EAST]      (signal_dspin_h_rsp_inc[x][y][k]);
675               clusters[x+1][y]->p_rsp_in[k][WEST]     (signal_dspin_h_rsp_inc[x][y][k]);
676               clusters[x][y]->p_rsp_in[k][EAST]       (signal_dspin_h_rsp_dec[x][y][k]);
677               clusters[x+1][y]->p_rsp_out[k][WEST]    (signal_dspin_h_rsp_dec[x][y][k]);
678            }
679         }
680      }
681   }
682   std::cout << "Horizontal connections established" << std::endl;   
683
684   // Inter Clusters vertical connections
685   if (ymax > 1) {
686      for (size_t y = 0; y < (ymax-1); y++){
687         for (size_t x = 0; x < xmax; x++){
688            for (size_t k = 0; k < 2; k++){
689               clusters[x][y]->p_cmd_out[k][NORTH]     (signal_dspin_v_cmd_inc[x][y][k]);
690               clusters[x][y+1]->p_cmd_in[k][SOUTH]    (signal_dspin_v_cmd_inc[x][y][k]);
691               clusters[x][y]->p_cmd_in[k][NORTH]      (signal_dspin_v_cmd_dec[x][y][k]);
692               clusters[x][y+1]->p_cmd_out[k][SOUTH]   (signal_dspin_v_cmd_dec[x][y][k]);
693               clusters[x][y]->p_rsp_out[k][NORTH]     (signal_dspin_v_rsp_inc[x][y][k]);
694               clusters[x][y+1]->p_rsp_in[k][SOUTH]    (signal_dspin_v_rsp_inc[x][y][k]);
695               clusters[x][y]->p_rsp_in[k][NORTH]      (signal_dspin_v_rsp_dec[x][y][k]);
696               clusters[x][y+1]->p_rsp_out[k][SOUTH]   (signal_dspin_v_rsp_dec[x][y][k]);
697            }
698         }
699      }
700   }
701   std::cout << "Vertical connections established" << std::endl;
702
703   // East & West boundary cluster connections
704   for (size_t y = 0; y < ymax; y++)
705   {
706      for (size_t k = 0; k < 2; k++)
707      {
708         clusters[0][y]->p_cmd_in[k][WEST]          (signal_dspin_false_cmd_in[0][y][k][WEST]);
709         clusters[0][y]->p_cmd_out[k][WEST]         (signal_dspin_false_cmd_out[0][y][k][WEST]);
710         clusters[0][y]->p_rsp_in[k][WEST]          (signal_dspin_false_rsp_in[0][y][k][WEST]);
711         clusters[0][y]->p_rsp_out[k][WEST]         (signal_dspin_false_rsp_out[0][y][k][WEST]);
712
713         clusters[xmax-1][y]->p_cmd_in[k][EAST]     (signal_dspin_false_cmd_in[xmax-1][y][k][EAST]);
714         clusters[xmax-1][y]->p_cmd_out[k][EAST]    (signal_dspin_false_cmd_out[xmax-1][y][k][EAST]);
715         clusters[xmax-1][y]->p_rsp_in[k][EAST]     (signal_dspin_false_rsp_in[xmax-1][y][k][EAST]);
716         clusters[xmax-1][y]->p_rsp_out[k][EAST]    (signal_dspin_false_rsp_out[xmax-1][y][k][EAST]);
717      }
718   }
719
720   // North & South boundary clusters connections
721   for (size_t x = 0; x < xmax; x++)
722   {
723      for (size_t k = 0; k < 2; k++)
724      {
725         clusters[x][0]->p_cmd_in[k][SOUTH]         (signal_dspin_false_cmd_in[x][0][k][SOUTH]);
726         clusters[x][0]->p_cmd_out[k][SOUTH]        (signal_dspin_false_cmd_out[x][0][k][SOUTH]);
727         clusters[x][0]->p_rsp_in[k][SOUTH]         (signal_dspin_false_rsp_in[x][0][k][SOUTH]);
728         clusters[x][0]->p_rsp_out[k][SOUTH]        (signal_dspin_false_rsp_out[x][0][k][SOUTH]);
729
730         clusters[x][ymax-1]->p_cmd_in[k][NORTH]    (signal_dspin_false_cmd_in[x][ymax-1][k][NORTH]);
731         clusters[x][ymax-1]->p_cmd_out[k][NORTH]   (signal_dspin_false_cmd_out[x][ymax-1][k][NORTH]);
732         clusters[x][ymax-1]->p_rsp_in[k][NORTH]    (signal_dspin_false_rsp_in[x][ymax-1][k][NORTH]);
733         clusters[x][ymax-1]->p_rsp_out[k][NORTH]   (signal_dspin_false_rsp_out[x][ymax-1][k][NORTH]);
734      }
735   }
736
737
738   ////////////////////////////////////////////////////////
739   //   Simulation
740   ///////////////////////////////////////////////////////
741
742   sc_start(sc_core::sc_time(0, SC_NS));
743   signal_resetn = false;
744
745   // network boundaries signals
746   for (size_t x = 0; x < xmax ; x++){
747      for (size_t y = 0; y < ymax ; y++){
748         for (size_t k = 0; k < 2; k++){
749            for (size_t a = 0; a < 4; a++){
750               signal_dspin_false_cmd_in[x][y][k][a].write = false;
751               signal_dspin_false_cmd_in[x][y][k][a].read = true;
752               signal_dspin_false_cmd_out[x][y][k][a].write = false;
753               signal_dspin_false_cmd_out[x][y][k][a].read = true;
754
755               signal_dspin_false_rsp_in[x][y][k][a].write = false;
756               signal_dspin_false_rsp_in[x][y][k][a].read = true;
757               signal_dspin_false_rsp_out[x][y][k][a].write = false;
758               signal_dspin_false_rsp_out[x][y][k][a].read = true;
759            }
760         }
761      }
762   }
763
764   sc_start(sc_core::sc_time(1, SC_NS));
765   signal_resetn = true;
766
767   for (size_t n = 1; n < ncycles; n++)
768   {
769
770      if (debug_ok and (n > debug_from) and (n % debug_period == 0))
771      {
772         std::cout << "****************** cycle " << std::dec << n ;
773         std::cout << " ************************************************" << std::endl;
774
775         // trace proc[debug_proc_id]
776         if ( debug_proc_id < (xmax * ymax * nb_procs) )
777         {
778             size_t proc_x = debug_proc_id / ymax;
779             size_t proc_y = debug_proc_id % ymax;
780
781             clusters[proc_x][proc_y]->proc[0]->print_trace();
782
783             clusters[proc_x][proc_y]->signal_vci_ini_d_proc[0].print_trace("proc_ini_d");
784             clusters[proc_x][proc_y]->signal_vci_ini_c_proc[0].print_trace("proc_ini_c");
785             clusters[proc_x][proc_y]->signal_vci_tgt_c_proc[0].print_trace("proc_tgt_c");
786         }
787
788         // trace memc[debug_memc_id]
789         if ( debug_memc_id < (xmax * ymax) )
790         {
791             size_t memc_x = debug_memc_id / ymax;
792             size_t memc_y = debug_memc_id % ymax;
793
794             clusters[memc_x][memc_y]->memc->print_trace();
795
796             clusters[memc_x][memc_y]->signal_vci_tgt_d_memc.print_trace("memc_tgt_d");
797             clusters[memc_x][memc_y]->signal_vci_ini_c_memc.print_trace("memc_ini_c");
798             clusters[memc_x][memc_y]->signal_vci_tgt_c_memc.print_trace("memc_tgt_c");
799         }
800
801         // clusters[0][0]->signal_vci_tgt_d_xicu.print_trace("xicu_0_0");
802         // clusters[0][1]->signal_vci_tgt_d_xicu.print_trace("xicu_0_1");
803         // clusters[1][0]->signal_vci_tgt_d_xicu.print_trace("xicu_1_0");
804         // clusters[1][1]->signal_vci_tgt_d_xicu.print_trace("xicu_1_1");
805
806         clusters[1][1]->mdma->print_trace();
807         clusters[1][1]->signal_vci_tgt_d_mdma.print_trace("dma_tgt_1_1");
808         clusters[1][1]->signal_vci_ini_d_mdma.print_trace("dma_ini_1_1");
809         if ( clusters[1][1]->signal_irq_mdma[0].read() ) 
810             std::cout << std::endl << " IRQ_DMA_1_1 activated" << std::endl;
811         if ( clusters[1][1]->signal_proc_it[0].read() )
812             std::cout <<  " IRQ_PROC_1_1 activated" << std::endl << std::endl;
813
814         // trace peripherals components
815         if ( false )
816         {
817            size_t io_x   = cluster_io_id / ymax;
818            size_t io_y   = cluster_io_id % ymax;
819
820            clusters[io_x][io_y]->bdev->print_trace();
821            clusters[io_x][io_y]->mdma->print_trace();
822
823            clusters[io_x][io_y]->signal_vci_tgt_d_bdev.print_trace("bdev_1_0_tgt_d  ");
824            clusters[io_x][io_y]->signal_vci_ini_d_bdev.print_trace("bdev_1_0_ini_d  ");
825            clusters[io_x][io_y]->signal_vci_tgt_d_mdma.print_trace("mdma_1_0_tgt_d  ");
826            clusters[io_x][io_y]->signal_vci_ini_d_mdma.print_trace("mdma_1_0_ini_d  ");
827         }
828      }
829
830      sc_start(sc_core::sc_time(1, SC_NS));
831   }
832   return EXIT_SUCCESS;
833}
834
835int sc_main (int argc, char *argv[])
836{
837   try {
838      return _main(argc, argv);
839   } catch (std::exception &e) {
840      std::cout << e.what() << std::endl;
841   } catch (...) {
842      std::cout << "Unknown exception occured" << std::endl;
843      throw;
844   }
845   return 1;
846}
847
848
849// Local Variables:
850// tab-width: 3
851// c-basic-offset: 3
852// c-file-offsets:((innamespace . 0)(inline-open . 0))
853// indent-tabs-mode: nil
854// End:
855
856// vim: filetype=cpp:expandtab:shiftwidth=3:tabstop=3:softtabstop=3
857
858
859
860
Note: See TracBrowser for help on using the repository browser.