ブログパーツマイリスト

無料ブログはココログ

« AMDの次世代アーキテクチャBulldozerとFusion | トップページ | Bulldozer、Bobcatと、POWERアーキテクチャの似ている点 »

2009年11月17日 (火)

CPU ロードマップ ヘテロジニアスなBulldozerとBobcat

BulldozerとBobcatは、整数演算と浮動小数点演算のタスクの特徴に、コアをあわせた、ヘテロジニアスなCPUだ。
整数の演算にL1キャッシュをつけたのが特徴的。
まとめると以下のようだ。

1.整数演算
(1)タスクの特徴
・オペランド(処理するデータ)がレジスタとメモリの間を行き来する
・同じオペランドに、複数の演算や、何度も繰り返しの演算を、非リアルタイムで行う(オペランドをスタックさせる)
・L1キャッシュが効くOfficeなど非ストリーミング的なタスク
・DBなど並列的なタスク
(2)主なタスク
・DBアクセス(データセンター)
・Webのクライアントアプリ
・Officeアプリ

2.浮動小数点演算
(1)タスクの特徴
整数演算と逆になる。
・リアルタイム処理
・同じオペランドに繰り返しの演算を行わない(オペランドをスタックさせない)
・受け取って、演算して、吐き出して終わり、というストリーミング的なタスク
・高精度な分岐予測はあまりいらない直列的なタスク
(3)主なタスク
・音楽再生
・ビデオ再生(GPU利用)
・ゲーム(GPU利用)
・動画再生(GPU利用)
・レンダリングやフォトショップ等の画像処理(GPU利用)
※まるで、PC Mark Vantageの項目だ。

さらに分岐予測も、整数、浮動小数点と大きく分けると、大量のトランジスタを割く必要がないように思う。
もちろん、2割8割の法則で、最も頻度の高いout-of-orderを行えば十分な感じがする。少なくとも浮動小数点演算に、高精度の分岐予測は不要だ。

そうなると、消費電力が下がる。クロックもあがるか?

ただ、メモリへのアクセス待ちを減らして、どんどんデータをCPUへ流す必要がある。
そこで、整数演算に適した64bitのアクセスを並列で行う、Ungangedモードが!!

でもさ、PentiumProの頃、Specfp95のような浮動小数点演算が速いことは憧れだった。

整数演算ばかり強化されて、浮動小数点演算はVGAで行う、ヘテロジニアスなCPUはちょっとさびしい
感じがする。

しかし、AlphaのEVバスを使ったAthlon、Opteronは、Alphaのアーキテクチャに近く、今度はPOWERに近い。

Intelは、Coreアーキテクチャで、Pentium以来のCISCをブラッシュアップした。
アーキテクチャの戦いでは、RISCとCISCの戦いは続いているのだね。

« AMDの次世代アーキテクチャBulldozerとFusion | トップページ | Bulldozer、Bobcatと、POWERアーキテクチャの似ている点 »

AMD」カテゴリの記事

コメント

クラスタなんてやめて、単純に4本のALUを2スレッドでシェアすれば、スレッド間の負荷バランスにも対応できるし、シングルスレッドも落ちない。
AMDがこの方法を取る手段もあった(俺もこの方法を想定した、AMDがIntelのHTTを真似する事は判りきっていたので。
ただ、最大8命令発行の大型スケジューラにとなりトランジスターがべらほうに増える。
4命令発行のスケジューラー*2の方がトランジスタ効率に優れていたんだろうね。
何しろAMDはK10の時点でIntelより多くのトランジスタ割いてるから、シングルスレッド性能を犠牲にしてでもトランジスタ効率を高める必要があった。
FPUを統合したのだって、99%は遊んでいると自ら言い放った事への回答なんだろう。

その点、IntelはFP/SSEパイプに別にするような無駄なことはせず、整数パイプと共用していたのは正しいやり方でした。

コメントを書く

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/217868/46789924

この記事へのトラックバック一覧です: CPU ロードマップ ヘテロジニアスなBulldozerとBobcat:

« AMDの次世代アーキテクチャBulldozerとFusion | トップページ | Bulldozer、Bobcatと、POWERアーキテクチャの似ている点 »