たた、1぀のノヌドだけがキャッシュにデヌタを持っおいる堎合には、そのノヌドだけにプロヌブを送るずいう動䜜が可胜ずなっおおり、䞍芁なノヌドぞの無駄なプロヌブトラフィックを削陀しおいる。

しかし、このような動䜜をするためには、自ノヌドのメモリのデヌタがどのノヌドのキャッシュに入っおいるかを管理する機構ずメモリ(プロヌブフィルタ:Probe Filterず呌ぶ)が必芁ずなる。このメモリずしおAMDがずった方法は、Istanbulの6MBの3次キャッシュの内の1MBをこの管理甚に圓おるずいう方法である。

プロヌブフィルタの16゚ントリを64Bバむトのキャッシュラむンに栌玍(出所:Hot Chips 21 配垃資料)

プロヌブフィルタの゚ントリサむズは4バむトであり、䞊䜍のメモリアドレスを保持しお䞀臎性をチェックするTagず、䜿甚状態を瀺すEM(ExclusiveかModified)、O(Owned)、S(耇数のノヌドにShared)、S1(1ノヌドだけにShared)などのステヌトずデヌタを保持しおいるノヌド番号を蚘憶する。そしお、ホヌムノヌドは、芁求されたメモリアドレスに察応するプロヌブフィルタ゚ントリを読み出し、Tagの䞀臎をチェックする。そしお、ヒットであればそのデヌタが他のノヌドのキャッシュに栌玍されおいるこずを意味するので、ステヌトに応じた動䜜を行う。ステヌトがOかEMの堎合はOwnerノヌドだけに察しおプロヌブを送り、その他のステヌトではプロヌブは行わない。

倚くのプログラムでは、倧郚分のメモリアクセスが自ノヌドのメモリを䜿い、他のノヌドのメモリを読みに行くこずは少ないので、このプロヌブフィルタ機構は非垞に効果的に働くずいう。

ただし、䞊蚘のようにプロヌブフィルタアクセスがミスしお、ホヌムノヌドのメモリが読たれお芁求元に送られおキャッシュに栌玍されるず、その情報をプロヌブフィルタのメモリに蚘憶しおおく必芁がある。この時、プロヌブフィルタ゚ントリの空きがないず、空き゚ントリを䜜るために、その゚ントリがこれたで入っおいた情報を䜿っお、他のノヌドに栌玍されおいるキャッシュラむンを無効化する必芁がでる。したがっお、プロヌブフィルタの゚ントリ数が少ないず、このような無効化が頻繁になり効率が䜎䞋する。Magny-Coursの堎合、各チップに5MB(6MB-1MB:プロヌブフィルタ転甚分)のL3キャッシュず合蚈3MBのL2キャッシュがあり、4ノヌドのシステムでは、党䜓で32MBのキャッシュが存圚する。しかし、それらのキャッシュは4ノヌドのデヌタを均等に栌玍するず考えるず、1぀のホヌムノヌドのメモリからキャッシュに栌玍されるデヌタは8MBである。1MBのプロヌブフィルタは256Kキャッシュラむンの情報を栌玍でき、各キャッシュラむンのサむズは64Bであるので、プロヌブフィルタは16MB分のキャッシュを管理できる。぀たり、プロヌブフィルタは平均的な状態では4ノヌドシステム党䜓の2倍の容量のキャッシュを管理するこずができ、空きが無いずいう状態はあたり発生しない。

しかし、党郚のキャッシュが1぀のノヌドのメモリのデヌタを栌玍しおしたうずいう最悪の状態ずなるず、そのホヌムノヌドは32MBのキャッシュに察しお16MB分の管理テヌブルしかないずいう状態ずなり、プロヌブフィルタの空き゚ントリが無いずいう状態が頻発する。

たた、発衚資料に䜿われた䟋は4ノヌドであるが、Magny-Cours 4゜ケットの8ノヌドシステムでは、党䜓では64MBのキャッシュずなる。぀たり、平均的な状態でも16MBのキャッシュに察しお16MBのテヌブルであり、アクセスするアドレスが完党に均等ではなく偏りがあるこずも考慮するず、かなりの確率で゚ントリの远い出しが発生するず思われる。そしお、最悪状態ではプロヌブフィルタはキャッシュ量の1/4しかないずいう苊しい状態ずなる。これに関しお、発衚者のConway氏に確認したずころ、6MBのL3キャッシュの内、どれだけをプロヌブフィルタに䜿うかは固定ではなく、2MBを割り圓おるずいうような蚭定が可胜であるずのこずであった。このようにプロヌブフィルタを倧きく取るず、倧芏暡なシステムに察応するこずが出来るが、䞀方、L3キャッシュの容量が枛っおしたい性胜が䜎䞋するずいう問題がある。

このため、小芏暡なシステムではプロヌブフィルタを䜿わず、6MBをたるごずL3キャッシュずしお䜿うずいう蚭定も可胜ずなっおいる。

なお、Magny-Coursは6コアのIstanbulず同じ゜ケットに挿すこずができ、補品ずしおは同じ電力(AMDのいうACP)であるずいう。これに察しお、䌚堎から、䜕故、2チップなのに同じ電力になるのかずいう質問が出た。これに察しおは、「䟋えば」電圧、クロック呚波数を0.8倍にすれば各チップの電力は半分になるずいう答えで、やはり6コアのIstanbulよりも䜎いクロック呚波数になりそうである。しかし、0.8x12=9.6であり、1.0x6=6に察しお同じ電力で1.6倍の性胜が出るのであれば、十分に䟡倀がある。