Microsoftは米国時間2020年10月12日、ONNX(Open Neural Network Exchange) Runtime 1.5.1のリリースを公式ブログで発表した。機械学習フレームワーク間の相互運用を目的とした形式の1つであるONNXだが、最新版では、ビルドに含まれる演算子カーネルをシナリオに応じて縮小できる機能や、モバイルデバイスと組み込みデバイス向けにビルドサイズを最小限に抑える「ONNX Runtime for Mobile Platforms」のプレビュー版を追加した。

  • ONNX Runtime for Mobile Platformsの概要(画像はすべて公式ブログより抜粋)

    ONNX Runtime for Mobile Platformsの概要(画像はすべて公式ブログより抜粋)

すべての標準的なONNXモデルの実行をサポートするONNX Runtime for Mobile Platformsだが、サポートモデルによってランタイムパッケージのサイズは異なるものの、「モバイルデバイスおよびエッジデバイス向けフレームワークであるTensorFlow Liteのビルドパッケージと大差はない」とMicrosoftは説明する。

  • ONNX Runtime for Mobile PlatformsとTensorFlow Liteの比較

    ONNX Runtime for Mobile PlatformsとTensorFlow Liteの比較

この他にもトランスフォーマーモデルの最適化や量子化ツールの改善、実行プロバイダーの拡充などが加わった。詳細はGitHubのリリースノートで確認してほしい。

阿久津良和(Cactus)