Lunar LakeではPコアのハイパースレッディングを廃止 インテル CPUロードマップ

 前回はLunar Lakeのプロセスとタイル構造で話が終わってしまったので、今回はもう少し内部の話をしよう。

lunar lakeではpコアのハイパースレッディングを廃止 インテル cpuロードマップ

Lunar LakeはPコア4つとEコア4つの珍しい組み合わせ

 まずは一番の要であるプロセッサーの構造である。Lunar LakeもPコアとEコアの組み合わせであり、その意味ではAlder Lake(Lakefield)以降で採用されているハイブリッド・テクノロジーを継承した構成である。ただそれが4+4という構成なのはやや珍しい。

 もちろん技術的には可能であるのだが、Eコアが4つというのは、これまでの同社のプロセッサーからするとかなり少ないように感じる。おそらくはであるのだが、1つには次回説明するようにEコアの性能が大幅に上がり、性能的にバランスが取れると判断されたのかもしれないし、Eコアを8つにすると面積的に厳しかったのかもしれない。

 だったらPコアの数を2つに減らせば良かったようにも思うのだが、ハイパースレッディングなしでの2コアはコア数というか同時処理スレッド数が不足すると判断されたのかもしれない。なんというか、微妙なバランスを取った構成になっている。

 またMeteor Lakeで搭載されたI/Oタイル上のLow Power EコアはLunar Lakeでは省かれている。その代わりというべきか、EコアそのものがLow Power Configurationで構成されている。N6プロセス上のLP Eコアより、N3BのLP Eコアの方が消費電力が少なかったのかもしれない。結果としてパワーマネジメント系はMeteor Lakeとまったく異なるものになっている。

 そのあたりの話はいずれ話をするとして、まずはPコアとEコアについて。今回PコアはLion Cove、EコアはSkymontと呼ばれるコアがそれぞれ採用されているが、このLion Cove/Skymont共に、従来のコアから大幅に中身が変わっている。

lunar lakeではpコアのハイパースレッディングを廃止 インテル cpuロードマップ

Lion Coveは

 Alder LakeのGolden CoveからMeteor LakeのRedwood Coveまでは基本同一コアで Golden Cove→Raptor Cove(L2:1.25MB→2MB)→Golden Cove(L1 I-Cache:32KB→64KB) とキャッシュサイズの増量が主要な違い(細かなアップデートは除く)でしかない。

 ということで、Alder Lakeに搭載されたGolden CoveとLion Coveを比較すると下表のように、猛烈に強化されているのがわかる。

 もう少し細かく見てみよう。まずフロントエンドであるがDecodeは1サイクルあたり8 x86命令を処理可能であり、μOp Cacheは最大12 wideまで拡張されている。以前の説明が正しければ、1つのx86命令は1つないし2つのμOpに分解されるので、μOp Cacheは最低でもx86換算で6命令/サイクル、平均しておそらく9命令/サイクル程度の供給が可能になると思われる。

lunar lakeではpコアのハイパースレッディングを廃止 インテル cpuロードマップ

現状ではμOp Cacheのエントリー数は未発表である。ただスループットが1.33倍になっている以上、容量もそれに合わせて大型化されている可能性が高い

 次にIssue Port周りだが、そもそもポートの数が大幅に増やされ、かつ同時発行命令が増えたことに対応して内部バッファの容量(ROBやInstruction Windowなど)も増量されている。

lunar lakeではpコアのハイパースレッディングを廃止 インテル cpuロードマップ

In-Flight Windowはもう少し大型化しているかと思ったが、逆に言えば(主にポートが埋まっていることで)今までフルに使いきれていなかったのかもしれない

 実行ユニットに関して言えば、Golden CoveではPort 00/01/05をIntegerとVectorで共用、という形になっていたが今回これが分離された。これがスループット向上につながるか? というと、短期的にはNoである。

lunar lakeではpコアのハイパースレッディングを廃止 インテル cpuロードマップ

Power Savingが今ひとつピンとこないのだが、あるいはポート単位でのパワーコントロールをしているとすればあり得る話である

 例えばAVX命令などで計算を行ない、その結果を格納するような処理では以下の形で処理される。

Vector→ALU→Vector→ALU→...

 Vectorの処理が終わるまでALUが動くことはない。これはVectorの結果を取り込む、あるいは次の計算のためのパラメーターをレジスターにセットするから、Vectorの処理が終わってからでないと意味がないからで、ポートを共用していても別にそこがボトルネックになるわけではないし、ポートを分けても並列度が上がることはない。

 しかし、これスケジューラーの方からすれば1つのポートにALUとVectorがつながっているのはスケジューリングが複雑になるだけだし、スライドにもあるように将来の拡張性を考えたらポートを分離した方が良い、という判断になったものと思われる。

Pコアのハイパースレッディングを廃止

 ALUはALUが同時に6個動作するほか、シフトや乗算(MUL)、分岐(JMP)も3つずつに増量された。

lunar lakeではpコアのハイパースレッディングを廃止 インテル cpuロードマップ

iDIVはMISCに含まれてしまったのかここには出ていないが、そろそろ×2くらいになっていても不思議ではない

 またFPU/Vectorも同時4命令処理に拡充されている。FMAが256bitとあることからもわかるように、まず間違いなくAVX512は実装されていない。ただほぼ同じアーキテクチャーを利用すると想定されるGranite Rapidsの場合、V0~V3にAVX512の実行ユニットを追加する形になると思われる。

lunar lakeではpコアのハイパースレッディングを廃止 インテル cpuロードマップ

FP ALUは64bit幅なので、同時に稼働すると256bit相当となる。また除算(Div)も×2に強化された

 データキャッシュも変更になった。Golden Cove~Redwood Coveでは48KBのL1 D-CacheとL2という組み合わせだったが、Lion CoveではL1 D-CacheがL0 D-Cacheになり、新たに中間的なLatencyを持つ192KBのL1 D-Cacheが追加された。

lunar lakeではpコアのハイパースレッディングを廃止 インテル cpuロードマップ

L1をL0に改称したのは、Pコア全体の共有キャッシュがL3なので、逆算してL0にせざるを得なかったのだろう。構造的に言えば追加されたものがL1.5 D-Cacheという感じではある

 つまりデータ側はL0~L3まで4レベルのキャッシュ構造となった格好だ。レイテンシーも若干削減されているが、帯域幅自体は変わらないことになっている。

 そして実行ユニットが強化された分、ロード/ストアーユニットも当然強化する必要がある。AGUが6個となり、またロードアクセスとストアーアクセスの両方が3個づつになった。これに合わせてData TLBのエントリー数も96→128に強化されている。

lunar lakeではpコアのハイパースレッディングを廃止 インテル cpuロードマップ

Store Dataそのものは2ポートのまま変わらずなので、ピークのStore Bandwidthは変わらない(そもそもL0 D-CacheのBandwidthが変わっていないからこれは当然だが)。ただ、同時により多くのStoreを発行できるようになったことで効率を上げられる

 もう1つの大きな変更は、Pコアでハイパースレッディングを無効化(というか、削除)したことだ。ハイパースレッディングというか一般にSMT(Symmetric Multi-Threading)のメリットは以下の2つある。

  • メモリーアクセスのレイテンシーの遮蔽(あるスレッドがメモリーアクセス待ちをしている間、他のスレッドがコアを利用することで、無駄な待機時間を減らす)
  • 実行ユニットの利用効率向上(アウト・オブ・オーダー実行では、必ずしも全部の実行ユニットがフルに使われるとは限らないので、複数スレッドを同時に実行することで実行ユニットの利用効率を上げる

 インテルがPentium 4にハイパースレッディングという名前でSMTを実装した時の最初の目的は2番目であり、これで最大30%性能が向上する、とされていた。実際現在でも、ハイパースレッディングを有効にした場合、IPCないしスループットが30%ほど向上し、その一方で消費電力が20%ほど増加するとしている。20%の消費電力増加で30%性能が向上するなら、これは悪くないバーターなわけだ。

 ただ、Lunar Lakeの場合には少しシナリオが異なる。もともとMeteor Lakeの頃からそうだが、雑多な処理はEコアに任せて、処理負荷の重い物だけをPコアに行なわせることで効率を上げるのがインテル・ハイブリッド・テクノロジーであり、これを効果的にするためにAlder Lakeで導入されたのがインテル・スレッド・ディレクターである。

 そしてデスクトップ向けはともかくLunar Lakeの使われ方を考えた場合、シングルスレッド処理性能が高いのが重要で、Pコア全体でのマルチスレッド処理はそれほど重要視されないシナリオが考えやすい。こうなると、ハイパースレッディングというかSMTはむしろシングルスレッドの性能を妨げる要因になりえる。

 つまり本来なら効果的に全部の実行ユニットをフルに使うことで性能が上げられるはずなのに、SMTを利用することで別のスレッドと実行ユニットの取り合いになる可能性があるからだ。

lunar lakeではpコアのハイパースレッディングを廃止 インテル cpuロードマップ

性能/エリア比が落ちているのは、SMTを無効化したことでトータルの性能としては落ちているため。シングルスレッド性能で比較するとおそらく向上している

 またSMTを実装する際には、ある程度エリアサイズのオーバーヘッドが発生する。以前Core 2の時は10%程度とされていたが、具体的には完全にスレッドごとに独立して持つもの(例えばPC:Program Counterなど)はそれほど多くない。

 ただ、例えば内部のレジスターファイルは、どちらのスレッド用かを管理するために1bitの管理フラグを追加する必要がある(から、64bit長のものが65bit必要になる)といった具合に、あちこちに余分な回路が必要であり、そうしたものの合計が大体10%ほどになるわけだ。

 これはデスクトップあるいはサーバー向けには許容されるのだろうが、前回も説明したようにギリギリまで面積を詰めたいLunar Lakeにはこの10%も惜しかったのだろう。

 そしてSMTを無効化することで、消費電力も若干減る(扱うスレッドが1つで済むから、スレッド間の調停も不要だし、SMTをサポートするための回路もなくなる分、そこで費やしていた消費電力も削減できる)。こういう判断に基づき、Lunar Lakeではハイパースレッディングが廃止された。「無効化」ではなく「廃止」なのだそうで、物理的にLunar Lakeではハイパースレッディングが利用できなくなっているらしい。

 このあたりはまだ明確ではないが、おそらくLion CoveもXeon向けに利用されるだろう。それがGranite Rapidsなのか、その次のDiamond Coveなのかは不明だが、こうした転用を考えた場合、ハイパースレッディングの機構そのものは論理設計上は残っており、ただしそれを物理設計に落とす段階で機構そのものを省いた、という形で実装されていると筆者は考えている。これは、同じダイをEPYCとRyzenで共有する(からSMTを無効化することはできても省けない)AMDとの違いである。

 なお、2022年頃はGranite RapidsはRedwood Coveベースという報道もあったが、あれからだいぶロードマップが変わっているので、まだRedwood Coveベースなのかは不明で、Lion Coveベースの可能性もある。

 こうした改良の積み重ねで、Lion CoveのIPCは平均14%の向上を実現したとされている。特に消費電力が少ない(≒動作周波数が低い)時のIPC向上率は18%以上としており、これでSnapdragon Xシリーズに搭載されたNuvia由来のOryonコアを圧倒したい、というわけだ。

lunar lakeではpコアのハイパースレッディングを廃止 インテル cpuロードマップ

Copilot+ PCの動作環境を考えると、TDPはかなり低め(15W前後?)を想定しており、その枠で性能を引き上げるためには右図のような特性がどうしても必要、ということでもある

動作周波数の倍率指定が従来の100MHz刻みから16.67MHz刻みに

 ほかにRedwood Cove(というか、Golden Cove世代)からの違いとして、内部の電力管理が完全にダイナミックになったこと、動作周波数の倍率指定が従来の100MHz刻みから16.67MHz刻みになったこと。それと内部の作り方が変わったことも示された。

lunar lakeではpコアのハイパースレッディングを廃止 インテル cpuロードマップ

内部の電力管理が完全にダイナミックになった。

lunar lakeではpコアのハイパースレッディングを廃止 インテル cpuロードマップ

動作周波数の倍率指定が16.67MHz刻みになった。これまで

lunar lakeではpコアのハイパースレッディングを廃止 インテル cpuロードマップ

TSMC N3Bに特化、というよりも同じ設計でIntel 3や18Aなどを使う可能性も考慮して、移植させやすい構造にしたというのが正確であろう

 こちらはユーザーには関係ない話であるが、これまでPコアはインテルの工場のみで製造されていたのが外部(TSMC N3B)の製造に切り替わったことと無縁ではないだろう。

 Pコアだけで文量があふれてしまったので、Eコアは次回説明する。

OTHER NEWS

2 hrs ago

回転寿司みさき、豪快/贅沢/稀少な寿司が大集合の「みさき夏祭り」

2 hrs ago

フォルクスワーゲンがニューモデルを一気に4台お披露目。今後の戦略やアプローチは「2本立て」で!

2 hrs ago

へずまりゅう、新紙幣の札束ゲット「供託金300万円返金してもらったぜ!!」

2 hrs ago

iClever、カーソルキーやTabキー付きのBluetoothテンキー

2 hrs ago

55歳、海外暮らしの「リアルな食事」。お弁当は前日の残り物、夜は日本のレシピも再現

2 hrs ago

「ふくらむエイジング毛」を解消、必ず見違える! ベストバランスの髪型とは?

2 hrs ago

花蓮の復興支える日本統治時代の橋、台北と結ぶ「大動脈」 台湾東部沖地震3カ月

2 hrs ago

タイ首相、午後のアルコール販売解禁検討-観光業界の要望受け

2 hrs ago

ロシア軍のインド人兵士「早期の帰還を」インド外相がロシア政府に要求 ウクライナ侵攻に大量動員

3 hrs ago

「ブタメンが欲しくなる」おにぎり登場! おやつカンパニー監修の新感覚メシ

3 hrs ago

ハリス副大統領が最有力候補、バイデン氏選挙戦から撤退なら=関係筋

3 hrs ago

松木選考外の理由を山本ND「移籍の可能性があります」SNS「FC東京が発表する前にお漏らししたらマズくない…。」などと反響

3 hrs ago

【サブウェイ】の注文は怖くない!初心者も安心なオーダーのコツやスマートな頼み方・裏ワザも紹介!

3 hrs ago

旧大口病院の3人点滴死、久保木愛弓被告の無期懲役確定へ…死刑求刑の検察も上告断念

3 hrs ago

熱中症か 屋内の作業場で倒れた41歳男性、救急搬送後に死亡 南さつま市

3 hrs ago

一週間座るとビール6杯分の運動効果? コクヨのオフィスチェアはバランスボールより良かった

3 hrs ago

【漫画】「お前が私の味覚を操っているのか!?」肉とビール派だった友人は妊娠を機に甘党になって…?/子どもが欲しいかわかりません(22)

3 hrs ago

冨永愛が「もっとも尊敬する」と公言するトップモデル・山口小夜子の少女時代

3 hrs ago

アニメ「鬼滅の刃」、「無限城」最終決戦は映画3部作に! 制作が正式発表「劇場版『鬼滅の刃』無限城編」

3 hrs ago

NewJeans、音楽番組に制服スカート×長ジャージで登場 日本のJKコーデに反響続々

3 hrs ago

今夜放送の『2024FNS歌謡祭 夏』、豪華出演アーティスト一覧!

3 hrs ago

【こんなの誰も思いつかんわ!!】パックのお刺身盛り合わせを3秒でお皿に盛り直す禁断の裏技

3 hrs ago

METAL BUILDより「ゼータガンダム」と「1.5(アイズ)ガンダム」が商品化決定!新展開で盛り上がる「ゴッドガンダム」も立体化

3 hrs ago

アクションとストラテジーが融合したカプコンの完全新作タイトル『祇:Path of the Goddess』のプレビュー&インタビュー

3 hrs ago

スリクソン新作? 松山英樹は“未発表ボール”で3年ぶりに優勝していた

3 hrs ago

「Football Manager 2024 CONSOLE」や「ペルソナ5 ザ・ロイヤル」が50%オフ!セガの7月オススメセールが実施

3 hrs ago

【2024年7月版】125ccバイクおすすめ15選! 人気の原付二種、国産MTモーターサイクルとAT限定免許OKのカブ系を網羅!

3 hrs ago

ANA、「ANAクオリティアワード」を開催 4年ぶりに国際線も対象

3 hrs ago

のど自慢で大盛り上がり!「エヴァ」作詞家がXで感慨 「くそ嫌味吐いてた人たち」は「いまどう思ってるのか」

3 hrs ago

おかずクラブ・ゆいP、衝撃のダイエット報告「体重110キロ」からなんと…

3 hrs ago

トランプの「公式スニーカー」製造元がコピー商品を提訴

3 hrs ago

「可愛いって言われ待ち」足立梨花の“大胆露出”に賛否、アンチからは“かまってちゃん”の異名

3 hrs ago

大岩ジャパン、パリ五輪に臨むメンバー18人を発表! 藤田、細谷、関根らが選出

3 hrs ago

一つ40億円分の札塊が次々と… 新紙幣発行、日銀横浜支店からも引き渡し 新千円札の裏面は「神奈川沖浪裏」

3 hrs ago

ホモサピエンス最古の狩猟壁画、5万年前か 新手法で5千年以上古く

3 hrs ago

人気美女YouTuberこばしり。、美谷間くっきりビキニ姿で抜群スタイル雑誌初解禁「週刊ヤングジャンプ」初登場

3 hrs ago

乃木坂46中西アルノ、大人っぽい魅力が漂うアップヘアSHOTにドキッ!“唯一無二の存在感”にフォーカス

3 hrs ago

夏アニメ『しかのこ』、【推しの子】公式に便乗で話題 「あんたのシカの子になってやる」にツッコミ殺到

3 hrs ago

現役最強フードファイター&レジェンドの普段の食事にスタジオ仰天「もう顎を…」「仕事思い出しちゃって」

3 hrs ago

【本日】ほっともっと「ビーフレモン弁当」スタート!! 肉×柑橘でさっぱり