【レポート】

IPAX Spring 2004 - 日本語処理拡張ライブラリの課題と「サーバに個人情報を持たない技術」

    佐藤晃洋  [2004/05/13]

    IPAX Spring 2004では、IPAが行っている「次世代ソフトウェア開発事業」や「未踏ソフトウェア創造事業」などの成果物の紹介が4日間に渡って行われている。本稿では初日に行われたプレゼンテーションの中から、気になるソフトをいくつかピックアップしてご紹介したい。

    日本語処理の拡張はフォントの整備が今後の課題

    最初にご紹介するのは、レッドハットが開発したオープンソースデスクトップにおける日本語処理拡張ライブラリ。これは大きく分けて2つの部分からなる。

    一つはTrueTypeフォントのラスタライズエンジンである「FreeType」を拡張し、Appleが提唱する「TrueTypeGX」が持つグリフ(文字組み)置換機能を利用可能にしたライブラリ。似たような仕組みとしてはAdobeらが提唱する「OpenType」があるが、今回同社がTrueTypeGXを選択したのは「OpenTypeでは一部定義されていない文字組み規則が存在する」ことに加え、今後広くアジア圏の言語に対応するに当たって「まだ文字コードすら定義されていない言語もあり、そのような言語についてOpenTypeでは当然文字組み規則が存在しないため対応ができないが、TrueTypeGXならフォントファイル内に独自の文字組み規則を記述できるためそのような言語にも対応可能」という理由があったという。

    具体的にはこのライブラリを利用することで、縦書きと横書きで表示位置や方向が異なる文字(句読点など)、縦書きの中に横書きのアラビア数字が含まれる場合(縦中横)などに対応することが可能。現在は拡張したコードをFreeType本体にマージする作業中で、開発を担当した大和正武氏は「年内には作業を終えたい」と語っていたが、問題はTrueTypeGXに対応する日本語フォントが「Mac OS Xに含まれるものを除いては、同社がkochi-substituteをベースに作成した1フォントしか存在しない」(大和氏)ということ。そのため今後はフォントの整備が課題になる、との考えを同氏は示していた。

    縦書きと横書きでの文字組みの違い

    TrueTypeGXでアラビア数字の「縦中横」を実現する場合の状態遷移


    Gnumericで実現した高度な日本語処理

    そしてもう1つが、Gnumericでふりがなや禁則処理、和暦入出力、誤字検出などを行えるようにするライブラリ。こちらは基本的にExcel互換の機能をGnumeric上で実現することを目指したとのことで、OpenOffice.orgではなくGnumericを選択したのは「単に工数の問題」(開発を行った中井幸博氏)だという。ただプログラム自体は他のオフィススイートへの移植も視野に入れて開発したとのことで、今後はOpenOffice.orgへの移植も検討したい、と語っていた。


    Gnumericでふりがな処理を実現したところ

    Excelにはない「誤字検出」機能も搭載した

    個人情報漏えいに対抗する「サーバに個人情報を持たない技術」?

    個人情報漏えいの問題点と解決手法

    もう1つご紹介するのは、ニーモニックセキュリティらが行った「個人情報の大量漏えいを原理的に防止する匿名通信・認証基盤」というプレゼンテーション。ここのところWebサイトの欠陥・内部の人間によるデータの持ち出しなど様々な理由で、企業が管理するデータベースから顧客の個人情報が漏えいするという事件が多発しているが、今回のプレゼンテーションではそれらの問題を根本的に解決するために、同社と富士通プライムソフトテクノロジが共同開発した「アノニミティガード」を紹介した。

    といっても基本的な原理は非常にシンプルで、「企業のデータベースに個人情報をためている限り、ユーザ認証の強化などである程度は情報漏えいを抑止できるものの、正規のアクセス権限を持った人間によるデータの持ち出しは完全には防げない」という問題に対し、「だったら個人情報をデータベースに持たなければいい」という、ある種コロンブスの卵的な発想で対応するというもの。

    具体的には氏名・住所など個人の特定につながる情報の本体をユーザのPC内に置き、企業のデータベースにはその(個人のPC内にある)情報へのリファレンスキーを格納。そして企業が(商品発送などの目的で)氏名や住所などを必要とする場合はその都度リファレンスキーを元に個人情報を読み出しに行くという形を取る。こうすることで万が一企業側のデータベース情報が漏えいしてもその中には個人情報は含まれていないためリスクは軽減されるし、中に含まれるリファレンスキーを元に第三者が個人情報を取りに来たとしても、ユーザ側でリファレンスキーを無効化すればそれに対抗できる、という仕組みだ。

    またこのシステムではさらに匿名性を上げるため、ユーザの発信元IPアドレスを検知されないように匿名P2Pネットワークを利用したパケット伝送を行う。匿名化ルーティングの方式としてはNRL(米国海軍研究所)が開発した「Onion Routing」、東大生産研・今井研究室が開発した「Grape Routing」の2種類が利用可能で、これによりユーザはIPアドレスから個人情報を知られるリスクも気にすることなく、パーソナライズされたサービスを利用することが可能になる。

    Onion RoutingとGrape Routingの解説

    匿名P2Pネット上でリファレンスから個人情報の本体にアクセスする仕組み

    さらに同社では視覚長期記憶を利用した個人認証「ニーモニックガード」をこれに組み合わせることで、パスワード認証などに比べ安全性の高いユーザ認証を、匿名P2Pネットワーク上で実現できるとしている。

    匿名P2P技術の比較

    「ニーモニックガード」の概要


    ヘルスケア事業への応用イメージ図

    現在「アノニミティガード」自体は商品化一歩手前の状態だそうだが、既にヘルスケア事業などの引き合いが来ているということで、個人情報漏えいに対抗できる有力な技術となるかもしれない。

    今回のやり方では個人情報が個人のPC内に置かれるため、PCに電源が入っていないと企業側から個人情報にアクセスすることができないといった問題もあるが、このあたりについて同社は「ユーザの契約するISPが個人情報管理サーバを持つなど、運用で回避する方法もある」としており、今後の応用例に注目していきたい。

    関連記事

    関連サイト

    新着記事

    特設サイトの情報

      人気記事

      一覧

      イチオシ記事

      新着記事

      特別企画

      マイナビニュースマガジン