GPU実験ノードを共有する際の不便

かなり前に日記に書いた問題が未だに解決していない。


後輩にGPUを弄りたいという人がいるので環境を再構築してたわけだが、未だに問題が解決しないので誰かからサジェスチョンがもらえるといいなあと思いつつメモ。


OpenGLを叩くにはXを叩く必要があるのでSSHで接続して実験というのはやりにくい。とはいえ、glutInitに-display引数を与えてやれば融通が利くのでxhost +とかすればなんとかなる。

しかし、複数のユーザで使う場合は他のGPUプログラムが動いていないか確認できたほうがうれしいというか、GPUは排他的に利用できないと困るけど確認方法ってあったっけ?という話がある。確か、既にプログラムが動いているとGPUを叩いても待ってしまうんだったかなあ?

更に、プログラムのバグなどで一旦ドライバが暴走・再起動なんてことになると、ローカルでXにログインしなおさないといけなかったりして不便。毎回startxでXを起動して使うという解決策も無きにしも非ず?


うーん、なんかうまく解決する方法がないものか。