Googleは、機械学習に使うデータセット解析のための2つのオープンソースを公開したことを公式ブログで発表した。公開されたFacets Overview、Facets Diveの二つオープンソースでGitHubに"facets"として設置されている。

機械学習を行うためのデータの粒度を高めるために役立つFacetsは、Googleが推し進める機械学習の理念PAIR(People+AI Research Initiative)のプロジェクトの一環として公開されている。facets公式サイトには、データをブラウザ上からアップしてWeb上でこの2つを試せるように設置してある。

Facets Overviewでは、データの数値上でトラブルになるような特異なデータを色やヒストグラムで示す機能などが提供、Facets Diveでは、異なるデータポイント間での特徴や関係性を色や形状で示すインタフェースを提供するもので、公式ブログでは数々の可視化の例を掲示している。

Facets Overviewを使った数値の分析(公式ブログより)

Facets Diveを使った可視化(公式ブログより)