今回は「Power Query エディター」の画面を構成する要素の表示/非表示について解説していこう。少し余談的な話になってしまうが、効率よく作業を進めるためには知っておくべき内容といえる。今後、複数のクエリを同時に扱うときにも必要となる操作なので、この機会に覚えておくとよいだろう。
画面レイアウトの変更
「Power Query エディター」の画面には、左側に「クエリの一覧」、右側に「クエリの設定」(ステップの一覧)が表示されている。これらの表示/非表示を切り替えたり、補助的な情報を表示したりすることも可能となっている。今回は「Power Query エディター」の画面表示について解説していこう。
まずは、不要な領域を非表示にする方法から解説していこう。「Power Query エディター」の左側には、現在のExcelファイルで利用可能な「クエリの一覧」が表示されている。とはいえ、クエリが1つしかない場合は、この領域を表示しておいても意味がない。少しでも画面を広く使えるように折りたたんでおくとよいだろう。以下の図に示したアイコンをクリックする。
すると、「クエリの一覧」が非表示になり、1列分ほどではあるが「データ表示の領域」を広く使えるようになる。
もしもクエリの選択などが必要になったときは、上図に示したアイコンをクリックすると「クエリの一覧」を再表示できる。些細な事だが、作業効率に多少の影響を及ぼすので、この機会に覚えておくとよい。
画面の右側に表示されている「クエリの設定」(ステップの一覧)も、一時的に非表示にすることが可能だ。その操作手順は、右上にある「×」をクリックするだけ。
これで「データ表示の領域」をさらに広く使えるようになる。ちなみに「クエリの設定」の表示/非表示は、「表示」タブにある「クエリの設定」で切り替えられるようになっている。各ステップの処理内容を確認する場合など、「クエリの設定」を再表示したいときは、この項目をクリックしてONにすればよい。
念のため、数式バーについても補足しておこう。こちらは「表示」タブにある「数式バー」のチェックボックスで表示/非表示を切り替えられるようになっている。
ただし、数式バーを非表示にしても、たいして画面は広くならない。むしろ、各ステップのM言語を確認できなくなるため、弊害の方が大きいと考えられる。よって、数式バーは常に表示しておくのが基本といえる。
データの表示方法に関する設定
続いては、「表示」タブに用意されている各項目について解説していこう。
「等幅」のチェックボックスは、データ表示に使用するフォントを切り替える役割を担っている。このチェックボックスはOFFに初期設定されているため、通常時は各データがプロポーショナルフォント(文字の形状に応じて「文字の幅」が変化するフォント)で表示されている。
「等幅」のチェックボックスをONにすると、各データが「等幅フォント」で表示されるようになり、「半角スペース」の有無などを認識しやすくなる。文字の位置が揃うため、文字数をカウントしやすくなる、という利点もある。
その反面、同じ列幅に表示できる文字数は少なくなってしまう(特に半角文字の場合)。上に示した図では、一部のメールアドレスがセル内に収まりきらず、表示が欠けた状態になっている。よって、「等幅」の項目は、状況に応じてON/OFFを切り替えながら使用していくのが賢い使い方といえる。
「等幅」のすぐ下にある「ホワイトスペースを表示」の項目は、
・各データの先頭にある「半角スペース」
・各データ内に含まれる「改行」
の表示/非表示を切り替える役割を担っている。この項目はONに初期設定されているため、通常時は「先頭にある半角スペース」や「改行」を視認できるようになっている。
「ホワイトスペースを表示」をOFFにすると、これらの表示が省略され、以下の図のようにデータが表示される。
この場合、余計な「半角スペース」や「改行」を見落としてしまう可能性が高くなる。よって、「ホワイトスペースを表示」はONにした状態のまま作業を進めていくのが基本といえる。
データのプレビューに関する表示設定
「表示」タブには、各列の状況を表示できる項目も用意されている。順番に解説していこう。
「列の品質」をONにすると、以下の図に示したような情報欄が追加され、各列にある空白セル(null)やエラー(Error)の割合を一目で把握できるようになる。行数が多いデータ表で「nullやErrorが発生していないか?」を確認するときに活用できるだろう。
「列の分布」をONにすると、各列の「データ分布状況」を示したグラフが表示される。ただし、このグラフは決して見やすいものではない。
それよりも、グラフの下にある「個別XX個、一覧XX個」の文字情報のほうが役に立つと思われる。ここには、それぞれの以下の数値が表示されている。
・個別:各列に何種類のデータがあるか?
・一意:重複していないデータの個数
上図を例に詳しく解説していこう。このデータ表には、全部で32行のデータが記録されている。「氏名」の列には、いずれも異なるデータが記録されているため、データの種類(個別)は32種類、重複していないデータの個数(一意)も32個となる。一方、「所属」の列には、同じデータが入力されているセルもある。これらを集計すると、データの種類(個別)は10種類あり、そのうち重複なしのデータ(一意)が2個ある、ということを確認できる。
これらの情報は「列のプロファイル」でも確認できる。「列のプロファイル」をONにすると、選択している列のデータ数(カウント)、エラー、空白セル(null)、個別、一意、空の文字列などの情報が表示される。また、各データの分布状況(頻度)を示したグラフも表示される。
なお、重複しているデータが1つもない列を選択したときは、以下の図のようなグラフ表示になる。この場合は、左側に表示される数値だけが役に立つ情報となる。
これまでに紹介してきた情報表示は、各列に「空白セルやエラーが含まれていないか?」、もしくは「重複しているデータがないか?」といった確認を行うときに活用できる。頻繁に使うものではないが、このような機能があることも覚えておくとよいだろう。
その他の表示機能
「Power Query エディター」の画面表示について解説したついでに、「表示」タブに用意されている他の項目(機能)についても紹介しておこう。
「列に移動」をクリックすると、「現在のデータ表にある列の名前」が一覧表示される。ここで列を選択して「OK」ボタンをクリックすると……、
その列を即座に選択することが可能となる。列の数が多く、横スクロールが面倒な場合に活用するとよいだろう。
ちなみに、「列に移動」コマンドは「ホーム」タブにある「列の選択」にも収録されている。
「詳細エディター」をクリックすると、現在のクエリに登録されている処理のM言語が表示される。この画面でM言語の記述を変更することも可能だ。こちらは、M言語の知識がある、少し上級者向けの機能となる。
「クエリの依存関係」をクリックすると、各クエリが「どこからデータを取得しているか?」といった情報をチャート図で確認できるようになる。
上図に示した例の場合、「Sheet1」のクエリは、Dドライブの「社員データ」フォルダーにある「名簿.xlsx」からデータを取得している、ということを確認できる。なお、この例では特にクエリ名を指定していないため、データ取得元のシート名(Sheet1)がそのままクエリ名に自動命名されている。
このチャート図は、複数のクエリを連携させながら処理を進めていくときの参考として活用できる。現時点ではクエリが1つしかないため、極めて単純なチャート図になってるが、今後の連載で紹介する「複数のクエリを組み合わせた処理」を行うときには重宝する存在になるかもしれない。念のため、覚いても損はないだろう。