ブログパーツマイリスト

無料ブログはココログ

« CPU ロードマップ To be custom logic,not to be. that is the question. | トップページ | CorsairがPhenom II 1090Tでメモリクロック2287MHz達成 »

2010年6月 4日 (金)

CPU ロードマップ Fusionに見る次世代の姿

予想通り、Fusionは、CPUとGPUの接続に、PCI-Expressを使わない。
Fusionの不明な点は、GPUがカスタムロジックになるか否かだ。
また、イメージ図を見るとCPUからメモリに道ができている。

これは、CPUからは直接メインメモリにアクセス、GPUからはメモリコントローラということなのだろうか。まさか、CPU独自のメモコンを持っているとは信じがたい。
HyperTransportの数も増えているようだし、興味は尽きない。


GPGPUのボトルネックはPCI-Express
GPUはhost memmory(メインメモリ)に直接アクセスできず、PCI-Expressを経由してCPUがメインメモリにアクセスする。よって、PCI-Expressがボトルネックになることが、指摘されていた。

メモリコントローラの共有
Fusionでは、PCI-Expressを使わず、CPUとGPUでメモリコントローラを共有する。
これは大きな革新で、PCI-Expressのボトルネックを無くし、GPUがメインメモリにアクセスできるため、スループットが大幅に向上する。

ただし、メインメモリであるDDR3の帯域がボトルネックになる。
つまり、DDR3 1333MHz以上の帯域を使っている、ディスクリートGPUを統合しても、性能をもてあましてしまう。
Radeonでいうと、 HD 5570がDDR3 1600MHzであり、統合にちょうどいいGPUだ。
VRAMの広い帯域を必要とする重いゲームは、Fusionでは難しいので、置き換えることはできない。
同時に、HD 5570以下のローエンド市場は終息する。

ドライバモデルの変更
GPUは、PCI-Expressにつながるドライバモデルなので、単純にPCI-Expressをやめると互換性が無くなり、多くのアプリケーションが動かない。
よって、互換性を持ちつつ、ドライバモデルを変更しなければならない。

GPUの抽象化
OpenCLで、AMDは、Compute Abstraction Layer(CAL)というレイヤーを設けることで、GPUを抽象化した。
また、OpenGLではおなじみのOpenCL ICDを用意し、カーネルとのバイパスを作る。

よって、Fusionでは、OpenCLだけでなく、GPUを完全に抽象化し、CPUと同じようにアクセスできるよう拡張されるだろう。
既に、2D描画はDirect3Dを使ったエミュレーションであり、Windows7からはDirect2Dも実装されている。
OpenGLは、ICDがない場合、OSが変換してGPUに送っていたので、問題はない。

Intelとの差
Intelは、SandyBridgeでも、CPUとGPUの接続にPCI-Expressを内蔵する。
レイテンシは下がるが、帯域は増えないので、決定的な差が生まれる。
さらに、やっかいなのは、PCI-Expressとメモリアクセスの2面を、メンテナンスしなくてはならない。

PCI-Express 2.0 x16の帯域は8GB/sなので、DDR3 1066のデュアルチャネルの17GB/sに比べると、ボトルネックになる。
PCI-Express 3.0になれば、x16は16GB/sになるので、ちょうどバランスがとれる。

しかし、メモリがDDR4や、DDR3のトリプルチャネルになれば、PCI-Express 3.0の帯域を越えるため、またボトルネックになる。
AMDと同様、QPIでつなぎたいだろうが、ICDを作った経験が無く、PCI-Expressを作ったIntelが、ドライバモデルの変更と、PCI-Expressをやめることは、技術的、政治的ともに難しい。

« CPU ロードマップ To be custom logic,not to be. that is the question. | トップページ | CorsairがPhenom II 1090Tでメモリクロック2287MHz達成 »

AMD」カテゴリの記事

コメント

>Intelは、SandyBridgeでも、CPUとGPUの接続にPCI-Expressを内蔵する。


で、結局PCIeでGPUとCPUがつながるのではなく、リングバスによる接続だっただとさ。
事前のうわさで、L3がGPUとCPUで共用されると云われていたのに、あんたの話は突飛に聞こえたんで、ソースを問いただしたんだが、結局外れたね。


まあさ、仮説を立てて話すのは面白いけどさ。
結局見当違いの外れなら、所詮妄想レベルだったことにならないか?

http://pc.watch.impress.co.jp/docs/news/event/20100915_393755.html

応援団気取りの通行人のアホさ加減にも笑ったけどね。

なんで個人のサイト相手にむきになってるんでしょうかね。
事実でも空想でもAMD寄りに書かれてるのがそんなに気に入らないなら
ソースは?とか顔真っ赤にして自慰行為とか書き込む前に
見に来なければいいんじゃないんですかね、2chじゃないんだから

話にならないはこちらの台詞ですがね。

>まず、自分で仮説を立て、考えることが重要です。

断定して書いているから根拠を聞いただけなんですがね。
結局、つまり噂レベルのサイトの情報とあなたの仮説から導き出した憶測でしょう。
憶測を断定して書くとは正に話になりませんね。


仮に百歩譲って憶測を語るサイトだとしても、憶測に偏りにある様じゃ話になりませんが。
AMDに都合の良い憶測をずらずらと書くだけじゃ、ただの自慰行為でしょう。

ここをはじめに覗いた時に、AMDよりの空想サイトであることは判っていましたけど。

いかにも断定している様な話しぶりですか、つまりそんな噂サイトを鵜呑みにした、仮定の話しなわけね。

大変良く判りました。

まず、自分で仮説を立て、考えることが重要です。
正解か、不正解かは、いずれわかるので、問題ありません。
そうではなく、ソースを聞くようでは、文字通り、「話にならない」です。

例えば、以下のURLで、IntelはPCI-Express3.0に対応し、内蔵GPUおよび外付けGPUにも適用されると報じています。

http://www.fudzilla.com/content/view/17846/1/

しかし、自分で仮説を立てて、考えないようでは、ソースがあっているか、判断することができません。

SandybridgeのCPUとGPUの接続について、以下の仮説を立てました。

・PCI-Expressの転送速度は、GPGPUのボトルネック

・ディスクリートGPUの主な用途であるゲームでは、x8とx16のSLIやCrossfireで大きな差が無いように、PCI-Expressの転送速度が、ボトルネックになっていない。

・Intelは、ディスクリートGPUを出荷していない

よって、Intelは、ゲームやディスクリートGPUのために、PCI-Express3.0の対応を進めるインセンティブが無い。

PCI-Expressは、Intelが作った規格なので、イニシアティブをとる必要はあるが、SandyBridgeの内蔵GPUのボトルネックを解消するために、進めている可能性が高い。

Perlmutter氏のキーノートにある、「improved inter-buses」が、PCI-Express3.0でないなら、仮説は間違っていたことになります。

ただ、仮説を立てたから、PCI-Expressを使って、CPUとGPUがキャッシュを共有できるのか、新しい疑問が生まれます。

さらに、いままでのGPUは、テクスチャを使うゲームが主体なので帯域重視だが、GPGPUでは、CPU同様、レイテンシ重視になるのか、興味も生みます。

>Intelは、SandyBridgeでも、CPUとGPUの接続にPCI-Expressを内蔵する。

無駄だと思いいますが一応聞いてみます。
ソースは?

コメントを書く

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/217868/48536953

この記事へのトラックバック一覧です: CPU ロードマップ Fusionに見る次世代の姿:

« CPU ロードマップ To be custom logic,not to be. that is the question. | トップページ | CorsairがPhenom II 1090Tでメモリクロック2287MHz達成 »