富士通研究所は7月30日、分散ストレージにおいて人気データへのアクセス集中を自動的に解消してユーザーのアクセス時間の悪化を抑える技術「レプリカ数動的調整機構(Adaptive Replication Degree)」を開発したと発表した。

同技術は、突発的に人気が出たデータを即座に検出し、そのレプリカを増やすことでサーバへのアクセスを自動的に平準化させるというもの。これにより、従来は人手で対応していた性能低下の解消を自動で対処し、ユーザーのアクセス時間悪化を抑えることができるようになる。

構成する特徴的な技術として、膨大なデータから急激なアクセス集中が起きた人気データを省メモリで迅速に検出する技術があり、これは、急激なアクセス集中を検出するために、最近のアクセスに重みを付けた人気度(重み付き人気度)を少ないメモリ量で推定する人気度推定エンジンとなる。

同じく特徴的な技術として、増減させるレプリカ数を、アクセス集中している期間のアクセス頻度に合わせて変化させるアクセス集中度分析技術を開発。これにより、検出された人気データに対して、自動的に増やすべきレプリカ数を決定する。

人気度推定エンジ

アクセス集中度分析機構

同技術の効果については、インターネット上で実際におきた、ある有名ポップスターの大ニュース発生時の大規模なアクセス集中を模したデータを使い、64台のサーバで検証したところ、サーバごとのアクセス頻度の変化を時刻ごとに調べると、従来の方式では関連したデータを持つサーバのみにアクセス集中が起き、そのアクセス頻度の増加率は約2.3倍であったが、本技術を適用することで、アクセス頻度の増加率は0.7倍までに平準化され、アクセス集中を約70%削減できることを確認したという。

アクセス集中時の各サーバへのアクセス頻度の変化(上は従来方式、下は本技術適用の場合

また、ユーザーから見たアクセス時間に対する効果を検証するために、16台のサーバを用いた実験を実施。同実験は、従来の通常時の全データへの平均アクセス時間を1として、アクセス集中ありの時の全データへの平均アクセス時間およびアクセス集中している人気データへの平均アクセス時間について、従来と本技術を適用した場合とで比較したもので、全データへの平均アクセス時間で見ると、従来はアクセス集中時には通常時と比較して約4倍のアクセス時間がかかっていたが、本技術を適用することで約1.2倍に抑えられることを確認した。特に、アクセス集中を起こしているデータに関して、従来はアクセス時間が約15倍に悪化しているところを、同技術の適用により約1.4倍に抑えることができるという。

同社は、同技術のさらなる性能向上および実証実験を進め、2013年度中の製品・サービスへの適用を目指すとしている。