|
|
インフォマティカ・ジャパン 代表取締役社長 内田雅彦氏 |
インフォマティカは9月16日、データ品質管理製品の新版「Informatica Data Quality 8.6.2」を発表した。
Informatica Data Qualityは、内容に誤りのあるデータや規定形式から外れるデータを排除/修正することができるプラットフォーム製品。データのクレンジングだけでなく、データのマッチングなども行えるため、例えば、入力情報の一部に誤りがあるような個人情報に対しても、既存顧客のものか新規顧客のものかを判定できる、などといった特徴がある。
|
|
インフォマティカ データ品質事業部 上級副社長 兼 ゼネラル・マネジャーのIvan Chong氏 |
発表に当たったインフォマティカ データ品質事業部 上級副社長 兼 ゼネラル・マネジャーのIvan Chong氏は、最初にビジネスの現状を整理。企業内では多様な形式のシステム/データが散在しており、それらを連携させた処理が数多く実行されていることや、パートナー企業のシステムとデータをやり取りするケースも多いことなどに触れたうえで、「最近ではクラウドコンピューティングといった概念も取りざたされており、今後、システムの連携範囲はさらに広がっていくことになる」と説明。そのうえで、「そのような状況でさまざまな処理を効率的に進めるにはデータの品質を高めておくことが必須」と述べ、データ品質管理の重要性を強調した。
そのような背景について説明した後、Chong氏らは、同製品の主な機能を紹介するデモを披露。下図のような処理フローに基づき、機能の一端が示された。
これらのうち、特に強調されたのが上図ステップ1である。これは、システム連携を想定し、CSVファイルの受け取りを実行するという処理。この際にCSVファイル内の各レコードに対する検証処理とクレンジング処理が行われ、問題のあるデータが画面上に表示される。不足や誤りのあるデータに対しては、同画面上で直接修正できる様子が示された。
また、データスチュワード役の業務として、マッチングの結果"グレー"と判定されたデータを確認する処理も紹介され、「氏名は同じだが住所が異なるデータ」など、個人情報に変更があったデータや入力ミスだと思われるデータが抽出され、それを修正する様子が示された。この処理では、既存データとのマッチング処理を実行し、既存データとの一致度合いを表す"マッチングスコア"をレコードごとに算出。事前の設定に従い、例えば、スコア90以上は自動的にコンソリデーション、50未満は新規登録、50~90は人間の目で確認して判断するといった切り分けが行われるという。
さらに、データ入力時にリアルタイムでクレンジングをかける処理も説明。クライアントから住所データを送るとその場で検証処理にかけられ、すぐさま結果が返される様子が示された。なお、住所の表記を検証するモジュール「Japan Address Validation」は、今回のバージョンで追加されたもの。日本向けの固有機能として、富士通と共同で開発され、新たに取り込まれた。
なお、ここではトランザクションデータの例を示したが、Informatica Data Qualityは、マスターデータにも対応する。また、同社のデータ統合プラットフォーム「PowerCenter」と連携し、ビジュアルな画面でデータ品質向上処理とデータ統合処理をまとめて管理できるといった特徴もある。
価格は、Informatica Data Quality 8.6.2が4200万円~、Japan Address Validationが470万円~(毎月の住所データ更新も含む年間サブスクリプション)。9月16日より出荷が開始される。