DXPのソースを適当にいじくりまわしてキャッキャウフフしてると、とある事に気が付きました。
CPUがメインメモリに頂点バッファに書き込む処理がけっこうタイムロスになってる…
頂点バッファは最終的にGE側で扱う情報なので、CPUキャッシュ上にデータを残すわけにいかないんですよ。
で、試しにCPUキャッシュを使うようにしてみたら最大で倍速くらいになったわけです。
もちろん、GEが正しい情報を受け取れないので表示がおかしくなります。使い物になりませんねw
でも一つ謎が解けました。横幅の長い画像だとSlice幅が若干長い方が高速になるという謎です。
大方、頂点バッファへの書き込み時間が長くなるとSliceによる速度向上が追いつかないんでしょうな…
というわけで、「さらに頂点バッファを圧縮できるか?」が今後の課題の一つに加わりました。
最後にスクラッチパッド上に頂点バッファ置いてみようとか考えたけれども、そもそもGEからアクセスできないことに気が付いた。
0 件のコメント:
コメントを投稿