カーネギーメロン大学の研究者などが、同一ファイルだけではなく、共通点のある類似ファイルを利用することでP2Pの転送速度を大幅に向上させる技術を開発した。

カーネギーメロン大学のコンピュータ科学部のDavid G. Andersen助教授とIntel Research PittsburghのMichael Kaminsky氏らが設計したP2PシステムはSimilarity-Enhanced Transfer (SET)と呼ばれている。4月11日(米国時間)にマサチューセッツ州ケンブリッジで開催されるネットワークシステムの設計と導入に関するシンポジウムで、SETの論文発表と、システムコードの提供が行われる。

Anderson氏によると、より多くのデータファイルのソースを作ることで、P2Pはデータ転送のボトルネックを解消してくれるはずだが、現実には一般家庭向けのインターネット接続サービスはファイルのアップロードよりもダウンロードが優先されている。そのアンバランスがP2Pのデータ転送速度を低下させるため、「P2Pは期待に現実がとどいていない」と指摘する。

BitTorrentやGnutellaなどと同様に、SETもファイルを細かく分断(1GBのデータの場合、16KBずつの64000に細分)し、複数のソースから少しずつダウンロードすることで効率的なデータ転送を実現する。だが、受信者の通信バンド幅を埋めるだけのソースが見つからなければ、ダウンロードの速度は低下する。そこでデータ転送中に"ハンドプリンティング"という共通点のあるファイルを探すプロセスが実行される。これは検索結果のクラスタ化やスパム検出に使われる技術にヒントを得たテクニックで、サンプリングを使って同一ファイル以外からでも適合するパーツを見分ける。例えば米国のユーザーが、ある映画のドイツ語版をダウンロードしようとすると、従来のシステムではドイツのソースにダウンロードが集中する。だがSETではオーディオ部分を除いて、英語版も利用するため、より多くのソースが対象となる。他のタイプでも、音楽にはヘッダが違うだけで99%共通なファイルが数多く存在するし、ソフトウエアは異なるバージョンで共通部分が多いという。

実験ではmp3の音楽ファイルの転送時間が71%短縮されたほか、47%の共通性を持ったファイルを利用することでファイルサイズ55MBの映画予告ビデオの転送速度が30%向上したそうだ。ただしSETの効果は類似ファイルの存在に左右されるため、実際の利用では転送速度の向上が数パーセントにとどまるケースがあれば、数倍の効果を得られる可能性もある。

Anderson氏は学術論文やソフトウエアの共有への利用を望んでいるものの、同氏らが映画や音楽の配信などを可能にする仕組みを手がける計画はないという。だが、「P2Pの転送をより速く、そして効率的にする技術であり、開発者はこのアイディアを手にして、それぞれのシステムに取り入れるべきだ」と述べている。