【レポート】

Spring Processor Forum 2006 - ARM、組み込み向け新プロセッサ「Cortex-R4」を発表

    福田昭  [2006/05/17]

    英ARM は5月16日(米国時間)、組み込み向けの最新プロセッサコア「Cortex-R4」の概要をSpring Processor Forum(SPF)で明らかにした。最近のARMプロセッサと同様に、論理合成可能な(シンセサイザブル)コアとして提供される。

    講演者のRichard York氏(Product Manager)

    講演タイトル。組み込み向けのARMプロセッサ「Cortex-R4」

    講演の概要。Cotex-R4を、ミッドレンジの組み込み用プロセッサと位置付けている

    ARMアーキテクチャの組み込み向けプロセッサのロードマップ。Cortex-R4の性能は、ARM11アーキテクチャの組み込み向けプロセッサである「ARM1156T2F-S」に近い

    参考までに、ARMアーキテクチャのアプリケーション向けプロセッサのロードマップも掲載する。このロードマップは、2005年秋に開催されたFall Processor Forum(FPF)でARMが発表 したもの。Cortex-A8(赤い四角)はCortexファミリと一応言ってはいるものの、Cortex-R4とはまったく別のプロセッサである

    ARMはこれまで、最新アーキテクチャに基づくプロセッサファミリ「Cortex」ではローエンドの組み込み向けプロセッサ「Cortex-M3」と、ハイエンドのアプリケーション向けプロセッサ「Cortex-A8」を開発し、ライセンス供与を始めていた。今回発表したCortex-R4は、組み込み向けプロセッサのミッドレンジ品と位置付けている。

    SPFの講演では、Cortex-R4の主な用途をハードディスクドライブ(HDD)、デジタルビデオカメラ、デジタルスチルカメラ、自動車のシャシー/ブレーキシステム、モバイル機器の無線モデム、インクジェットプリンタ、ホームゲートウエイと説明した。一定の演算処理性能と高い割り込み性能を必要とする、リアルタイム制御システム用のプロセッサであることが分かる。

    Cortex-R4の開発では、既存の組み込み向けプロセッサが抱える数多くの課題を解決しようと試みている。その結果Cortex-R4は、Thumb-2命令セットの実行に特化してチューニングしてある、外部メモリ(TCM)に高速アクセスを要求しない、といった特徴を備えるようになった。これらの特徴については後述するとして、Cortex-R4の内部構成を先に見ていこう。

    Cortex-R4は、ARMの最新アーキテクチャであるARMv7命令セットがベースの32ビットRISCプロセッサである。2命令を同時発行するスーパースカラー構造を採用した。パイプラインの段数は8段とかなり長い。にもかかわらず、割り込み応答性能は既存のARM9Eファミリに比べると大きく向上した。

    Cortex-R4の主な用途

    Cortex-R4が狙う用途における市場規模(数量ベース、2008年)。ハードディスクドライブ(HDD)とモデムが大半を占めると予測している

    既存の組み込み向けプロセッサが抱える課題

    Cortex-R4の内部ブロック。Thumb-2命令セットに最適化したARMコア、メモリ保護ユニット(MPU)のオプション化、1次キャッシュの信頼性向上、外部メモリ(TCM)に要求する速度の鈍化、64ビットAXIバスを2本搭載、といった特徴を備える

    Cortex-R4のパイプライン。90nmプロセスで製造したときに、8段のパイプラインが400MHzで動くように設計した

    パイプラインのフロントエンド部。二つの命令を同時にデコードおよび発行(issue)する

    割り込み応答サイクル数の比較。Cortex-R4では、割り込みの応答に必要なクロックサイクル数が、既存の組み込み向けARMプロセッサ(ARM9Eファミリ)に比べて大きく減少した

    Cortex-R4がアクセスする外部メモリへのタイミング要求は、ARM9Eファミリよりも緩やかになっている。ARMプロセッサでは通常、外部メモリにキャッシュ(ほかのプロセッサでは2次キャッシュに相当)ではなく、密結合メモリ(TCM:Tightly Coupled Memory)と呼ぶ高速RAMを利用する。密結合メモリに対するタイミング要求を緩やかにすることでRAMの容量当たりのコストを下げ、ユーザーがより大きな容量の密結合メモリを同じ半導体チップに搭載できるようにすることを狙った。

    Cortex-R4が想定した命令セットThumb-2は、ARMが開発した独自の縮小命令セットである。プログラムの格納に必要なメモリ(ROM)容量を減らすとともに、実行性能の低下を抑えることを狙った。従来の縮小命令セットであるThumb-1と同じメモリ容量で、ARM命令セットに近い性能を実現した。今回のSPFでは、コスト低減を優先して実装した場合と、性能を優先して実装した場合で、Thumb-2の効果を示してみせた。

    最後に、Cortex-R4の実装例を示そう。処理性能は1.6D(Dhrystone)MIPS/MHzである。90nmプロセスで製造したときにCortex-R4は400MHzで動くので、600DMIPSを超える性能を実現できることになる。消費電力は0.4mW/MHz未満。なおARMのニュースリリースによると、Cortex-R4は米Broadcomを含む3社にライセンスされた。

    密結合メモリ(TCM)に対するタイミング要求。Cortex-R4では、アドレス入力後にデータを読み込むまでの時間が長く確保されている。この結果、RAMのコストと消費電力が下がる

    密結合メモリ(TCM)を実装したときの違い。Cortex-R4ではアクセス時間が2.1nsとやや長い。このことが、消費電力と回路面積の低減につながっている

    縮小命令セットThumb-2の効果。コスト低減を優先して実装した場合(Ospace)と、性能を優先して実装した場合(Otime)で比較した

    Cortex-R4の実装例。動作周波数は130nmプロセスで290MHz、90nmプロセスで400MHzとなる

    Cortex-R4のまとめ。8Kバイトの1次キャッシュを実装した場合の回路面積は1.43平方ミリメートル

    関連記事

    関連サイト

    新着記事

    特設サイトの情報

      求人情報

      人気記事

      一覧

      イチオシ記事

      新着記事

      特別企画

      転職ノウハウ

      あなたの仕事適性診断

      4つの診断で、自分の適性を見つめなおそう!

      Heroes File ~挑戦者たち~

      働くこと・挑戦し続けることへの思いを綴ったインタビュー

      はじめての転職診断

      あなたにピッタリのアドバイスを読むことができます。

      転職Q&A

      転職に必要な情報が収集できます

      スカウト転職する

      企業からアプローチのメッセージが届きます。

      マイナビニュースマガジン