2007 Office Systemの大きな変革点の2つ目がOpenXMLだ。OpenXMLは、マイクロソフトが開発した新しいファイルフォーマットで、Word / Excel / PowerPointで採用されている。

このファイルフォーマットで保存すると、それぞれの拡張子の最後に「x」が付与され、Wordであれば「.docx」、Excelであれば「.xlsx」、PowerPointであれば「.pptx」になる。従来の保存形式とは互換性はないが、保存時にたとえば[Word 97-2003文書]での保存を選択すれば旧形式で保存できる。逆に旧形式のファイルは、2007 Office System上でも問題なく読み書きできる。

この新しいファイルフォーマットは、その名前の通りフォーマットのベースにXMLを採用しているのが特徴だ。もともとOffice製品では、Office 2000のころからドキュメントのプロパティにXMLを採用しており、Office XPではExcelで「Spreadsheet ML」という形で最初のXMLファイル形式を導入している。

Office 2003ではそれをWordまで拡張したが、その時点ではまだ「その他の保存形式」でしかなかった。この2007 Office Systemでは、これを標準のファイルフォーマットとして格上げしたことになる。

Officeのファイルフォーマットの変遷

XMLは、エンタープライズ分野ではすでに多く使われているファイルフォーマットであり、さまざまな場所で利用されている。その実体は単なるテキストファイルで、Webブラウザに加えてテキストエディタでもその内容は確認できる。テキストファイルのため、特別な専用ソフトがなくてもWebサービスやデータベースなど多様なアプリケーションから簡単にアクセスして利用できるというメリットがある。

XML自体は構造化言語といわれ、文書の構造を示すためのファイルだ。単純化すれば、文書全体を木構造で示し、木構造を構成する個別の要素を指定していくための言語だ。HTMLも構造化言語の一種だが、それをさらに厳密な形で構造化させることができる。

XMLの例