Basemark
https://www.basemark.com/products/basemark-cl/

OpenCLの性能比較といえばこれ、ということでこれも久しぶりに。まずOverall(グラフ49)を見ると、個別のテストでは結構暴れている(なぜかFractal TestではGeForce GTX 1080が最速なのに、トータルではそれほどでもない。とはいえGeForce GTX 1080 Tiよりスコアが高い)という不思議なことに。ということで順に見ていく。

Physics Test(グラフ50)では、Soft Bodyが一番暴れていて、一番高速なのがGeForce GTX 1080という結果ではあるのだが、逆にFulid OperationとかSmoothed Particle Hydrodynamicsでは、GeForce GTXとGeForce RTXで明確にグループ分けされている。

これはPascalとTuringのアーキテクチャの差(IntとFPを同時に実行できるか否か)が効いている感じがする。Wave SimulationはCUDA Coreの数の差、という感じだ。なのでSoft Body以外はまぁ理解できる範囲に収まっている。

Image Manupulation(グラフ51)では、逆にNoise ReductionでPascal系がアドバンテージがある感じの結果になっているのが面白い。CUDA Coreの数の差が出ていそうなのはSurface Smoothingだけで、SharpeningやBlurではGeForce GTX 1080 TiがGeForce RTX 2080を上回るあたりも、アーキテクチャが変わるとCUDAの動き方が変わり、最適化の技法が変わってくることを示していると思う。

これを極端にしたのがVideo Manupulation(グラフ52)で、GeForce GTX 1080 Tiを除くと、ほぼ似たり寄ったり、というかなり理解しがたい結果になっている。どうしてこういう結果になるのか謎である。最後のFractal Test(グラフ53)も同様で、なぜか最高速なのがGeForce GTX 1080という不思議な結果になっている。

このあたりをきちんと調べるには、ちゃんとプロファイラを噛まして、コアの利用状況とかメモリバスの利用状況まで確認しないといけない。グラフ49のOverallを見て、一概にOpenCLでの動作がどうこう、とはいえないということだけがわかったというべきか。