Changes in / [3:1]


Ignore:
Location:
/anr
Files:
5 deleted
2 edited

Legend:

Unmodified
Added
Removed
  • /anr/anr.tex

    r3 r1  
    1010\usepackage{xmpmulti}
    1111\usepackage{graphicx}
    12 \usepackage{color}
    13 
    14 \definecolor{gris25}{gray}{0.75}
    15 \definecolor{gris75}{gray}{0.30}
    1612
    1713\title{%
    1814\textbf{COACH:}
    1915\textbf{C}onception d'\textbf{A}rchitecture par
    20 \textbf{C}ompilation et synt\textbf{H}ï¿œse
     16\textbf{C}ompilation et synt\textbf{H}èse
    2117}
    2218
  • /anr/body.tex

    r3 r1  
    22\hspace{2cm}\begin{scriptsize}\begin{verbatim}
    33% 1.    CONTEXTE ET POSITIONNEMENT DU PROJET
    4 % (1 page maximum) Prï¿œsentation gï¿œnï¿œrale du problï¿œme qu'il est proposï¿œ de traiter
     4% (1 page maximum) Présentation générale du problème qu'il est proposé de traiter
    55% dans le projet et du cadre de travail (recherche fondamentale, industrielle ou
    6 % dï¿œveloppement expï¿œrimental).
     6% développement expérimental).
    77\end{verbatim}
    88\end{scriptsize}
     
    1919due to the design and fabrication costs.
    2020Nowadays Field Programmable Gate Arrays (FPGA), like Virtex5 from Xilinx and Stratix4 from Altera,
    21 can implement a SoC with multiple processors and several coprocessors for less than 10K euros
    22 per item. In addition, High Level Synthesis (HLS) becomes more mature and allows to automate
    23 design and to drastically decrease its cost in terms of man power. Thus, both FPGA and HLS
    24 tend to spread over HPC for small companies targeting low volume markets.
     21can implement a SoC with multiple processors and several coprocessors for less than 10K euros the piece.
     22In addition, High Level Synthesis (HLS) becomes more mature and allows to automize design
     23and to decrease drastically its cost in terms of man power. Thus, both FPGA and HLS tends to spread over
     24HPC for small companies targeting low volume markets.
    2525\par
    2626To get an efficient embedded system, designer has to take into account application characteristics when it
     
    7575% 1.1.  CONTEXTE ET ENJEUX ECONOMIQUES ET SOCIETAUX
    7676% (2 pages maximum)
    77 % Dï¿œcrire le contexte ï¿œconomique, social, rï¿œglementaire. dans lequel se situe
    78 % le projet en prï¿œsentant une analyse des enjeux sociaux, ï¿œconomiques, environnementaux,
    79 % industriels. Donner si possible des arguments chiffrï¿œs, par exemple, pertinence et
    80 % portï¿œe du projet par rapport ï¿œ la demande ï¿œconomique (analyse du marchï¿œ, analyse des
    81 % tendances), analyse de la concurrence, indicateurs de rï¿œduction de coï¿œts, perspectives
    82 % de marchï¿œs (champs d'application, .). Indicateurs des gains environnementaux, cycle
     77% Décrire le contexte économique, social, réglementaire. dans lequel se situe
     78% le projet en présentant une analyse des enjeux sociaux, économiques, environnementaux,
     79% industriels. Donner si possible des arguments chiffrés, par exemple, pertinence et
     80% portée du projet par rapport à la demande économique (analyse du marché, analyse des
     81% tendances), analyse de la concurrence, indicateurs de réduction de coûts, perspectives
     82% de marchés (champs d'application, .). Indicateurs des gains environnementaux, cycle
    8383% de vie.
    8484\end{verbatim}
     
    111111various application domains. The ``high end'' lines concern only FPGA with high logic capacity able
    112112to implement complex systems.
    113 This market is in significant expansion and is estimated to 914\,M\$ in 2012.
     113This market is in significant expansion and is estimated to 914 M\$ in 2012.
    114114Using FPGA limits the NRE costs to design cost. This boosts the developpment of methodologies
    115115and tools to automize design and reduce its cost.
     
    140140segments like computing clusters (ad-hoc), servers and storage, networking and Telecom, ASIC
    141141emulation and prototyping, Mil/aero etc. HPC market size is estimated today by FPGA providers
    142 to 214\,M\$.
     142to 214 M\$.
    143143This market is dominated by Multi-core CPUs and GPUs based solutions and the expansion
    144144of FPGA-based solutions is limited by the flow automation. Nowadays, there are neither commercial
     
    149149a synthesized netlist, simulation test bench and custom software library that reflect the hardware
    150150configuration.
    151 Nevertheless, SOPC Builder does not provide any facilities to synthesize coprocessors\emph{I
    152 (Steven) disagree : the C2H compiler bundled with SOPCBuilder does a pretty good job at this} and to
     151Nevertheless, SOPC Builder does not provide any facilities to synthesize coprocessors and to
    153152simulate the platform at a high design level (system C).
    154153In addition, SOPC Builder is proprietary and only works together with Altera's Quartus compilation
     
    164163However, this tool targets only DSP based algorithms.
    165164\\
    166 Consequently, designers developping an embedded system needs to master for example
     165Consequently, designer developping an embedded system needs to master for example
    167166SoCLib for design exploration,
    168167SOPC Builde at the platform level,
     
    170169and Quartus for design implementation.
    171170This requires an important tools interfacing effort and makes the design process very complex
    172 and achievable only by designers skilled in many domains.
     171and achievable only by designers skilled in various domains.
    173172COACH project integrates all these tools in the same framework masking them to the user.
    174173The objective is to allow \textbf{pure software} developpers to realize embedded systems.
     
    189188% 1.2.  POSITIONNEMENT DU PROJET
    190189% (2 pages maximum)
    191 % Prï¿œciser :
    192 % -     positionnement du projet par rapport au contexte dï¿œveloppï¿œ prï¿œcï¿œdemment :
    193 %   vis- ï¿œ-vis des projets et recherches concurrents, complï¿œmentaires ou antï¿œrieurs,
     190% Préciser :
     191% -     positionnement du projet par rapport au contexte développé précédemment :
     192%   vis- à-vis des projets et recherches concurrents, complémentaires ou antérieurs,
    194193%   des brevets et standards.
    195 % - positionnement du projet par rapport aux axes thï¿œmatiques de l'appel ï¿œ projets.
    196 % - positionnement du projet aux niveaux europï¿œen et international.
     194% - positionnement du projet par rapport aux axes thématiques de l'appel à projets.
     195% - positionnement du projet aux niveaux européen et international.
    197196\end{verbatim}
    198197\end{scriptsize}
     
    204203\\% IRISA
    205204The project will also borrow from the ROMA ANR project (2007-2009) and the ongoing
    206 joint INRIA-STMicro Nano2012 project. In particular we will adapt existing pattern
    207 extraction algorithms and datapath merging techniques to the synthesis of customized
     205joint INRIA-STMicro Nano2012 project.  In particular we will adapt
     206existing pattern extraction algorithms and datapath merging techniques to the synthesis of customized
    208207ASIP processors.
    209 \\
    210 \textcolor{gris75}{Steven : Je propose de rajouter un lien avec le projet BioWic~:~on the HPC
    211 application side, we also hope to benefit from the experience in hardware acceleration of
    212 bioinformatic algorithms/workfows gathered by the CAIRN group in the context of the ANR
    213 BioWic project (2009-2011), so as to be able to validate the framework on
    214 real-life HPC applications.}
    215 
    216208\par
    217209%%% 1 -- POUVEZ VOUS CHACUN AJOUTER SVP (SI POSSIBLE) UNE LIGNE
    218210%%% 1 -- REFERANT UN PROJET ANR OU EUROPEEN
    219 %%% 1 -- Projets europï¿œens ou ANR rï¿œutilisï¿œs ou continuï¿œs
     211%%% 1 -- Projets européens ou ANR réutilisés ou continués
    220212%%% 1 LIP6/TIMA/LAB-STIC OK
    221213Regarding the expertise in  High Level Synthesis (HLS), the project leverages on know-how acquired over 15 years
     
    228220Atlantique benefits from several years of expertise in the domain of retargetable compiler (Armor/Calife
    229221since 1996, and the Gecos compilers since 2002).
    230 
    231 
    232222% LIP FIXME:UN:PEU:LONG ET HORS:SUJET
    233223%CA% The source-level transformations required by the HLS tools will be
     
    300290\hspace{2cm}\begin{scriptsize}\begin{verbatim}
    301291% 2.    DESCRIPTION SCIENTIFIQUE ET TECHNIQUE
    302 % 2.1.  ï¿œTAT DE L'ART
     292% 2.1.  ÉTAT DE L'ART
    303293% (3 pages maximum)
    304 % Dï¿œcrire le contexte et les enjeux scientifiques dans lequel se situe le projet
    305 % en prï¿œsentant un ï¿œtat de l'art national et international dressant l'ï¿œtat des
    306 % connaissances sur le sujet. Faire apparaï¿œtre d'ï¿œventuels rï¿œsultats prï¿œliminaires.
    307 % Inclure les rï¿œfï¿œrences bibliographiques nï¿œcessaires en annexe 7.1.
     294% Décrire le contexte et les enjeux scientifiques dans lequel se situe le projet
     295% en présentant un état de l'art national et international dressant l'état des
     296% connaissances sur le sujet. Faire apparaître d'éventuels résultats préliminaires.
     297% Inclure les références bibliographiques nécessaires en annexe 7.1.
    308298\end{verbatim}
    309299\end{scriptsize}
     
    408398
    409399\subsubsection{Application Specific Instruction Processors}
    410 
    411 ASIP (Application-Specific Instruction-Set Processor) are programmable processors in
    412 which both the instruction and the micro architecture have been tailored to a given
    413  application domain (eg. video processing), or to a specific application.
    414 This specialization usually offers a good compromise between performance (w.r.t a pure software
    415 implementation on an embeded CPU) and flexibility (w.r.t an application specific
     400ASIP (Application-Specific Instruction-Set Processor) are programmable
     401processors in which both the instruction and the micro architecture have
     402been tailored to a given application domain (eg. video processing), or
     403in some extreme cases to a specific application (eg H264 specific ASIP).
     404This processor specialization usually offers a good compromise between
     405performance (compared to a pure software implementation on a COTS
     406embeded processor) and flexibility (compared to an application specific
    416407hardware co-processor).
    417 In spite of their obvious advantages, using/designing ASIPs remains a difficult
    418 task, since it involves designing both a micro-architecture and a compiler for this
    419 architecture. Besides, to our knowledge, there is still no available open-source
    420 design flow\footnote{There are commercial tools such a } for ASIP design even if such a tool would
    421 be valuable in the context of a System Level design exploration tool.   
    422 
    423 In this context, ASIP design based on Instruction Set Extensions (ISEs) has
    424 received a lot of interest [NIOSII,TENSILICA]%~\cite{NIOS2,ST70},
    425 as it makes micro architecture synthesis
    426 more tractable \footnote{ISEs rely on a template micro-architecture in which
    427 only a small fraction of the architecture has to be specialized}, and help ASIP
    428 designers to focus on compilers, for which there are still many open problems
    429 [CODES04,FPGA08].
    430 This approach however has a strong weakness, since it also significantly reduces
    431 opportunities for achieving good seedups (most speedup remain between 1.5x and
    432 2.5x), since ISEs performance is generally tied down by I/O constraints as
    433 they generally rely on the main CPU register file to access data.
    434 
    435 % (
    436 %automaticcaly extraction ISE candidates for application code \cite{CODES04},
    437 %performing efficient instruction selection and/or storage resource (register)
    438 %allocation \cite{FPGA08}). 
    439  
    440 
    441 To cope with this issue, recent approaches~[DAC09,DAC08]%\cite{DAC09,DAC08}
    442 advocate the use of
    443 micro-architectural ISE models in which the coupling between the processor micro-architecture
    444 and the ISE component is thightened up so as to allow the ISE to overcome the register
    445 I/O limitations, however these approaches tackle the problem for a compiler/simulation
    446 point of view and not address the problem of generating synthesizable representations for
    447 these models.
    448 
    449 We therefore strongly believe that there is a need for an open-framework which
    450 would allow researchers and system designers to :
    451 \begin{itemize}
    452 \item Explore the various level of interactions between the original CPU micro-architecure
    453 and its extension (for example throught a Domain Specific Language targeted at micro-architecture
    454 specification and synthesis).
    455 \item Retarget the compiler instruction-selection (or prototype nex passes) passes so as
    456 to be able to take advantage of this ISEs.
    457 \item Provide  a complete System-level Integration for using ASIP as SoC building blocks
    458 (integration with application specific blocks, MPSoc, etc.)
    459 \end{itemize}
    460 
    461 \hspace{2cm}
    462 \begin{scriptsize}\begin{verbatim}
    463 
    464 [CODES08] Theo Kluter, Philip Brisk, Paolo Ienne, and Edoardo Charbon, Speculative DMA for
    465 Architecturally Visible Storage in Instruction Set Extensions
    466 
    467 [DAC09] Theo Kluter, Philip Brisk, Paolo Ienne, Edoardo Charbon, Way Stealing: Cache-assisted
    468 Automatic Instruction Set Extensions.
    469 
    470 [CODES04] Pan Yu, Tulika Mitra, Scalable Custom Instructions Identification for
    471 Instruction Set Extensible Processors.
    472 
    473 [FPGA08] Quang Dinh, Deming Chen, Martin D. F. Wong, Efficient ASIP Design for Configurable
    474 Processors with Fine-Grained Resource Sharing.
    475 
    476 [NIOSII] Nios II Custom Instruction User Guide
    477 
    478 \end{verbatim}
    479 
    480 \end{scriptsize}
    481 %, either
    482 %because the target architecture is proprietary, or because the compiler
    483 %technology is closed/commercial.
    484 
    485 
    486 
    487 
    488 % We propose to explore how to tighten the coupling of the extensions and
    489 % the underlyoing template micro-architecture.
    490 % *  Thightne Even if such
    491 % an approach offers less flexiblity and forbids very tight coupling
    492 % between the extensions and the template micro-architecture, it makes the
    493 % design of the micro-architecture more tractable and amenable to a fully
    494 % automated flow.
    495 % \\
    496 % \\
    497 % In the context of the COACH project, we propose to add to the
    498 % infra-structure a design flow targeted to automatic instruction set
    499 % extension for the MIPS-based CPU, which will come as a complement or an
    500 % alternative to the other proposed approaches (hardware accelerator,
    501 % multi processors).
    502 %
     408\\
     409As a consequence, this type of architecture is a very attractive choice
     410as a System on chip building block. In spite of their obvious
     411advantages, using/designing ASIPs remains a difficult task, since it
     412involves designing both an efficient micro-architecture and implementing
     413an efficient compiler for this
     414specific micro-architecture.
     415\\
     416Recently, the use of instruction set extensions has received a lot of
     417interest from the embedded systems design community [NIOS2,FSL,ST70],
     418since it allows to rely on a template micro-architecture in which only a
     419small fraction of the architecture has to be specialized. Even if such
     420an approach offers less flexiblity and forbids very tight coupling
     421between the extensions and the template micro-architecture, it makes the
     422design of the micro-architecture more tractable and amenable to a fully
     423automated flow.
     424\\
     425However, to our knowledge, there is still no available open-source
     426design flow addressing those two design challenges together, either
     427because the target architecture is proprietary, or because the compiler
     428technology is closed/commercial.
     429\\
     430In the context of the COACH project, we propose to add to the
     431infra-structure a design flow targeted to automatic instruction set
     432extension for the MIPS-based CPU, which will come as a complement or an
     433alternative to the other proposed approaches (hardware accelerator,
     434multi processors).
    503435
    504436\subsubsection{Automatic Parallelization}
     
    654586% 2.2.  OBJECTIFS ET CARACTERE AMBITIEUX/NOVATEUR DU PROJET
    655587% (2 pages maximum)
    656 % Dï¿œcrire les objectifs scientifiques/techniques du projet.
    657 % Prï¿œsenter l'avancï¿œe scientifique attendue. Prï¿œciser l'originalitï¿œ et le caractï¿œre
     588% Décrire les objectifs scientifiques/techniques du projet.
     589% Présenter l'avancée scientifique attendue. Préciser l'originalité et le caractère
    658590% ambitieux du projet.
    659 % Dï¿œtailler les verrous scientifiques et techniques ï¿œ lever par la rï¿œalisation du projet.
    660 % Dï¿œcrire ï¿œventuellement le ou les produits finaux dï¿œveloppï¿œs ï¿œ l'issue du projet 
    661 % montrant le caractï¿œre innovant du projet.
    662 % Prï¿œsenter les rï¿œsultats escomptï¿œs en proposant si possible des critï¿œres de rï¿œussite
    663 % et d'ï¿œvaluation adaptï¿œs au type de projet, permettant d'ï¿œvaluer les rï¿œsultats en
     591% Détailler les verrous scientifiques et techniques à lever par la réalisation du projet.
     592% Décrire éventuellement le ou les produits finaux développés à l'issue du projet 
     593% montrant le caractère innovant du projet.
     594% Présenter les résultats escomptés en proposant si possible des critères de réussite
     595% et d'évaluation adaptés au type de projet, permettant d'évaluer les résultats en
    664596% fin de projet.
    665 % Le cas ï¿œchï¿œant (programmes exigeant la pluridisciplinaritï¿œ), dï¿œmontrer l'articulation
     597% Le cas échéant (programmes exigeant la pluridisciplinarité), démontrer l'articulation
    666598% entre les disciplines scientifiques.
    667599\end{verbatim}
     
    683615\item[SoC design] In this phase,
    684616The user can obtain simulators at different abstraction levels of the SoC by giving to COACH framework
    685 a SoC description.  
     617a SoC description.
    686618This description consists of a process network corresponding to the SoC application,
    687619an OS, an instance of a generic hardware platform
     
    695627loading the bitstream on FPGA and running the executable on PC.
    696628\end{description}
    697  
     629
    698630% l'avancee scientifique attendue. Preciser l'originalite et le caractere
    699631% ambitieux du projet.
     
    759691%% %3.1.        PROGRAMME SCIENTIFIQUE ET STRUCTURATION DU PROJET
    760692%% %(2 pages maximum)
    761 %% %Prï¿œsentez le programme scientifique et justifiez la dï¿œcomposition en tï¿œches du
    762 %% %programme de travail en cohï¿œrence avec les objectifs poursuivis.
    763 %% %Utilisez un diagramme pour prï¿œsenter les liens entre les diffï¿œrentes tï¿œches
     693%% %Présentez le programme scientifique et justifiez la décomposition en tâches du
     694%% %programme de travail en cohérence avec les objectifs poursuivis.
     695%% %Utilisez un diagramme pour présenter les liens entre les différentes tâches
    764696%% %(organigramme technique)
    765 %% %Les tï¿œches reprï¿œsentent les grandes phases du projet. Elles sont en nombre limitï¿œ.
    766 %% %N'oubliez pas les activitï¿œs et actions correspondant ï¿œ la dissï¿œmination et ï¿œ la
     697%% %Les tâches représentent les grandes phases du projet. Elles sont en nombre limité.
     698%% %N'oubliez pas les activités et actions correspondant à la dissémination et à la
    767699%% %valorisation.
    768700%%
     
    772704%% %3.2.        MANAGEMENT DU PROJET
    773705%% %(2 pages maximum)
    774 %% %Prï¿œciser les aspects organisationnels du projet et les modalitï¿œs de coordination
    775 %% %(si possible individualisation d'une tï¿œche coordination : cf. tï¿œche 0 du document
     706%% %Préciser les aspects organisationnels du projet et les modalités de coordination
     707%% %(si possible individualisation d'une tâche coordination : cf. tâche 0 du document
    776708%% %de soumission A).
    777709%% \subsection{}
    778710%% %3.3.        DESCRIPTION DES TRAVAUX PAR TACHE
    779 %% %(idï¿œalement 1 ou 2 pages par tï¿œche)
    780 %% %Pour chaque tï¿œche, dï¿œcrire :
    781 %% %-   les objectifs  de la tï¿œche et ï¿œventuels indicateurs de succï¿œs,
    782 %% %-   le responsable de la tï¿œche et les partenaires impliquï¿œs (possibilitï¿œ de
     711%% %(idéalement 1 ou 2 pages par tâche)
     712%% %Pour chaque tâche, décrire :
     713%% %-   les objectifs  de la tâche et éventuels indicateurs de succès,
     714%% %-   le responsable de la tâche et les partenaires impliqués (possibilité de
    783715%% %l'indiquer sous forme graphique),
    784 %% %-   le programme dï¿œtaillï¿œ des travaux par tï¿œche,
    785 %% %-   les livrables de la tï¿œche,
     716%% %-   le programme détaillé des travaux par tâche,
     717%% %-   les livrables de la tâche,
    786718%% %-   les contributions des partenaires (le " qui fait quoi "),
    787 %% %-   la description des mï¿œthodes et des choix techniques et de la maniï¿œre dont
    788 %% %les solutions seront apportï¿œes,
    789 %% %-   les risques de la tï¿œche et les solutions de repli envisagï¿œes.
    790 
    791 
    792 
    793 
    794 
    795 
     719%% %-   la description des méthodes et des choix techniques et de la manière dont
     720%% %les solutions seront apportées,
     721%% %-   les risques de la tâche et les solutions de repli envisagées.
     722
     723
     724
     725
     726
     727
Note: See TracChangeset for help on using the changeset viewer.