【レポート】

2007 Office Systemの新機能 - MS-IMEとOpen XMLの詳細

2 新ファイルフォーマット「Office Open XML」

    小山安博  [2006/05/31]

    Open XML

    さて、今回のワークショップで大きく時間を割かれていたのが、SharePoint 2007、Exchange Server 2007といったサーバー関連製品と新しいファイルフォーマットの「Office Open XML」だ。

    ファイルフォーマットの変遷。XMLのファイルフォーマットを最初に採用したのはOffice XP。その後サポート範囲を広げてきた。もちろん、新バージョンでも過去のXML形式のデータを読み込める

    XML文書はテキストなので、サーバーがOffice文書内のデータにアクセスしやすいなどのメリットがある

    新ファイルフォーマットOpen XMLの採用は、マイクロソフトにとってもOffice 97以来という一大変更点だ。2007 Officeは「約10年ぶりのOSとの同時リリース、初めてのUI変更という大規模なバージョンアップだが、これまでバイナリ形式だったOfficeファイルのフォーマットを、XMLベースのオープンな仕様のフォーマットに転換したことは大きな意味があるだろう。

    Open XMLフォーマットを採用したのはWord、Excel、PowerPointの3アプリケーション。これらの3アプリケーションで使われている「doc」「xls」「ppt」という拡張子は、それぞれ「docx」「xlsx」「pptx」となる。

    対応3アプリケーションの利用者であれば、今まで通り普通に保存作業をすればよく、ファイルフォーマットの違いを意識する必要はない。大きな違いは、まずファイルサイズだ。Open XMLでは、普段からZIP技術を使ってファイルを圧縮・伸長しているため、ファイルサイズを減らせる。同じデータをdocxとdocで保存したところ、docxでは5MB弱、docでは126MB程度と、大きな差が出た。

    この顕著な差は、docxファイルが、Open XMLによりテキストデータであるXML文書で構成されている点が大きい。docxは、ファイルコンテナとして文書構造などを示したXML文書や画像、動画といった複数のファイルを内包し、それをZIPで圧縮している。実際、拡張子のdocxをzipに書き換えて解凍ソフトで解凍してみると、各ファイルがフォルダ分けされて保存されているのが分かる。テキスト文書のXML文書は圧縮効率がいいためファイルサイズは小さくなるメリットがあるが、docx文書の場合はZIP圧縮・解凍が逐一必要なため、ファイルオープン時のパフォーマンスに多少影響があるらしい。製品化を前に、これをdocファイル並みに高速化することが目標だという。

    Open XMLのファイル構造

    Word文書「Catalog.docx」の拡張子docxをzipにして解凍したところ。このようにフォルダ分けされている

    さらにフォルダをたどるとさまざまなXMLファイルが含まれている

    実際のXMLファイル

    Open XMLでは表示方法を中心としたリファレンススキーマと、データを示すカスタム定義スキーマに分かれる

    docx文書の例。所有地や売り主のデータなどは、XMLで定義が指定されている

    XML文書の中身を見るとこんな感じ

    docx文書をWordで書き換えるのではなく、XML文書だけを置き換えてもデータは変更される。このように、外部アプリケーションからデータを書き換えるのも容易な仕組みだ

    さて、ファイルフォーマットの変更について、マイクロソフトには反省があるのだという。それはOffice 97のときにバイナリフォーマットの変更を行ったが、既存ユーザーへの配慮をなにもしなかったため、それまでのOffice 95などの旧版ユーザーが、新バージョンで作成されたデータを開けず、大きな混乱を招いたことだ。特に、拡張子は変わらずにdocなどをそのまま使っていたため、混乱が拡大した。

    旧バージョンで作成したファイルは、新バージョンで問題なく読める。新バージョンのOpen XML文書は、アドオンを導入すれば旧バージョンでも読み込みに対応

    今回は拡張子に「x」を追加してこれまでのフォーマットと異なる点を明示。さらに、旧版のユーザーへも救済策を出す。具体的には、Office 2003のような旧版でもOpen XML文書の表示、保存が可能なアドオンを提供。さらに後々、ファイルをダブルクリックして関連付けされたアプリケーションがない場合に表示されるダイアログから、アドオンをすぐにダウンロードできるようにする。

    これがCompatibility Pack。旧バージョンでも「Word "12"」(Word 2007)での保存ができる

    Open XML文書の関連付けがなければ、Compatibility Packを自動的にCompatibility Packをダウンロードしに行ってくれる

    逆に既存のOffice文書をOpen XML文書に変換するコンバータも提供するそうで、マイクロソフト側としては、Open XMLへの変換を推奨していると見て良さそうだ。

    たとえばこのdocx文書を旧バージョンと互換性のあるファイルフォーマットで保存する場合、互換性のない一部の機能を表示してくれる

    Word 2007形式で保存すると、左のように新バージョンの新機能が利用できるが、旧バージョンと互換性のあるファイルフォーマットだと、右のように同じ機能でも内容が変化する

    大量の文書を管理するシステム管理者向けには、コマンドラインベースの分析ツールを提供。これを利用すれば、管理するサーバーやローカルPC内などのOffice文書を検索、Open XML文書に変換しても大丈夫かどうかなどをチェックできる

    そのレポートに従って、一括してファイルを変換することができる

    関連記事

    関連サイト

    新着記事

    特設サイトの情報

      人気記事

      一覧

      イチオシ記事

      新着記事

      特別企画

      マイナビニュースマガジン