ダウンロードはこちら
パズドラ ドロップルート解析君 の計算の遅さは確かに自分でも問題であるとわかっていた。
全経路検索という手段をとっている以上、莫大な演算量を必要とするのは明らか。
というわけで今自分で開発中の「HSPSHAD」というHSP用GPGPUプラグインを使って、あったら便利だろうなと思う命令の追加や、機能向上を行ないながら同時に開発を行なっていたのが「パズドラルート解析GPGPU版」である。
そして今回、まだ精度に微妙な不安定さは残るが上からの落下も考慮したルート解析で、とりあえず正しい答えを出力することに成功!
これはドロップの移動距離が11マスの時の計算結果だ。
初めて正しい演算結果を出してくれたのが非常に嬉しく、思わずアップしたのだが、何が言いたいかというと驚くべきはその速度!なんとミドルレンジ(ローエンドか?)nVidia GT520で1174882通りのルート計算に、GPU 処理time 236ms(ミリ秒)、CPU 処理time 622ms。つまりルート解析アプリの300倍近い速さである!
高性能グラボならさらに早くなる!たとえノーパのオンボードGPUでもアプリの50倍以上は保証できる。
特質すべきはCPU timeというのは演算結果をコンボ数の多い順に並べたりしている時間というだけなので、ほぼ解析の本幹部分は全部GPUで演算しているということ!
つまりアプリで約3~8分くらいかけて行う計算を236msでやってのけたのである。
GPGPUの威力の高さがわかるであろう。
このプログラムはHLSLというシェーダ言語で作成されており、シェーダーモデルは3.0。
シェアードメモリも使えなければ整数演算も擬似的にしかできない。
多くのパソコン上で動くことを優先した形だが、事実上命令数制限完全撤廃されたsm5.0での動作やCUDA 上での実行ならその速度はさらに5~10倍になると予想される。
そしてまた肝心のスクリーンショット読み込みの機能が手付かずという自体になっているが、実装面ではアプリではなくPC上なのでまだ楽である。(と願いたい)
とりあえず精度を高めてインターフェイスを少し作ったら 「パズドラルート解析GPGPU版のテスト版のβ版」をアップしたいと思う。
2/17 α版公開 ダウンロードは一番↑から
パズドラ ドロップルート解析君 の計算の遅さは確かに自分でも問題であるとわかっていた。
全経路検索という手段をとっている以上、莫大な演算量を必要とするのは明らか。
というわけで今自分で開発中の「HSPSHAD」というHSP用GPGPUプラグインを使って、あったら便利だろうなと思う命令の追加や、機能向上を行ないながら同時に開発を行なっていたのが「パズドラルート解析GPGPU版」である。
そして今回、まだ精度に微妙な不安定さは残るが上からの落下も考慮したルート解析で、とりあえず正しい答えを出力することに成功!
これはドロップの移動距離が11マスの時の計算結果だ。
初めて正しい演算結果を出してくれたのが非常に嬉しく、思わずアップしたのだが、何が言いたいかというと驚くべきはその速度!なんとミドルレンジ(ローエンドか?)nVidia GT520で1174882通りのルート計算に、GPU 処理time 236ms(ミリ秒)、CPU 処理time 622ms。つまりルート解析アプリの300倍近い速さである!
高性能グラボならさらに早くなる!たとえノーパのオンボードGPUでもアプリの50倍以上は保証できる。
特質すべきはCPU timeというのは演算結果をコンボ数の多い順に並べたりしている時間というだけなので、ほぼ解析の本幹部分は全部GPUで演算しているということ!
つまりアプリで約3~8分くらいかけて行う計算を236msでやってのけたのである。
GPGPUの威力の高さがわかるであろう。
このプログラムはHLSLというシェーダ言語で作成されており、シェーダーモデルは3.0。
シェアードメモリも使えなければ整数演算も擬似的にしかできない。
多くのパソコン上で動くことを優先した形だが、事実上命令数制限完全撤廃されたsm5.0での動作やCUDA 上での実行ならその速度はさらに5~10倍になると予想される。
そしてまた肝心のスクリーンショット読み込みの機能が手付かずという自体になっているが、実装面ではアプリではなくPC上なのでまだ楽である。(と願いたい)
とりあえず精度を高めてインターフェイスを少し作ったら 「パズドラルート解析GPGPU版のテスト版のβ版」をアップしたいと思う。
2/17 α版公開 ダウンロードは一番↑から
PCでルート見ながらスマホで操作出来ますし