関東GPGPU勉強会#2

子供の@himajin_2nd連れて、行ってきました。

ATND
togetter
座席表
Ustream
会場は、さくらインターネット研究所セミナールームでした。

@telmin_orcaさん 「GPGPUが100倍速いという幻想をぶち殺せたらいいな ver.2013」
資料
TitanとCorei7とMICの処理時間の調査。やまださん調べでは、Titan > Corei7 > MICとなった。
確かに、MICは遅いんじゃないかと思ってましたが…

@dandelion1124さん 「OpenCVのOpenCL実装oclMat」
資料
OpenCVのOpenCL実装oclMatについて。
OpenCLカーネルをガリガリかかなくても高速化できるので、
使いやすくなると思う。

@_likr さん 「NumbaPro使ってみた」
GPGPUをPythonで使ってみた。
カーネルをコンパイルすれば、Pythonコード内に1行も書かずにGPGPUを使った
実行ができる。便利になったなあ、としみじみ思いました。
やっぱりそろそろPythonに手をつけるべきか…

@ksakiyama134さん 「Boltの話」
Bolt はC++テンプレートライブラリ。STLと類似している。
GPUに最適化してある。AMDが開発した。
Boltは、NVIDIA陣営の擁するThrustに対抗している。
Thrustとの違いは、OpenCLベースであること。
AMDでしか動かない。AMDのOpenCL拡張機能を使用。
OpenCL 1.2が必要。ドキュメントに間違いが多いなど。

@kalab1998さん 「ポータブルスパコンの話」
資料
鈴鹿高専の准教授(だった)方。
高専プロコンで自作した計算機を実演しながらの発表。
高専プロコンは計算パワーで勝負。計算資源は各チーム持ち込み。
バッテリー、特注ケースなどを作って挑戦。

@aokomoriutaさん 「ライブラリを使って大規模疎行列線型方程式を解いてみよう」
資料
青子守唄さんは、計算力学を専門に研究しておられる方。
疎行列線形方程式は、行列とベクトル演算を収束するまで繰り返す。
yamada-systemsを用いたデモをやっていた。

@lindenhutさん 「GTC 2013 San Jose レポート」
技術者でない視点から、GTC 2013のレポートを行っていた。
GPUの仮想化など、いろいろ整備されてきた。
GTC 2013会場の雰囲気が実によく伝わってきたレポートだった。
油冷サーバーなんてあるの初めてみた。

@tanakmuraさん 「Maliちゃん」
資料
ARM社が出してるGPUのMaliについて、ひたすら計測をしていく。
なかなかいい感じの発表。Maliなどについては、


にも触れられている。意外なところで、横浜Androidプラットフォーム部勉強会とつながった。

私はもともと低レイヤの人間ですが、やはりこの手の話は燃えますね!
今日は東京R勉強会や、Boost.勉強会などいろんな勉強会が開かれていたのですが、
これらの分野が相互につながっているのも、実感しました。

今後、資料が公開されているものがあれば、追ってリンクをつけていきます。

おまけ。都庁と付近のラーメン店。
IMAG0146.jpg  IMAG0147.jpg

さくらインターネット株式会社のセミナールームのドア。
IMAG0148.jpg

帰りがけに乗った、京王ミニバス。天井までガラス張りです。めずらしかったのでつい写真撮っちゃいました。
IMAG0149.jpg  IMAG0150.jpg

2012/06/02 関東GPGPU勉強会 #kantogpu

錦糸町のネットエージェントさんのセミナールームで開催された、
関東GPGPU勉強会に行ってきました。
ATND
togetter

低レイヤの話!非常に楽しかったです!

加藤公一さん(@hamukazu)
 「GPGPU、この3年でどう変わったか」
 資料はこちら
・GPUの進化によってアルゴリズムが変わってくる
 例)k近傍探索をn-bodyで解く
 関連のネタ
・開発環境が劇的に変化
 コンパイラにバグ!
 今は非常に優秀

山田さん(@telmin_orca)
 「GPGPU DE いろんな問題を解いてみたりした」
 資料は公開され次第アップします。
 openCLをやっている人 
・Heterogineousが重要
・巡回セールスマン問題を解いてみた
 必ずアントコロニーで解く発表があるらしい
 モナリザを都市に見立てて高速に解く。
 単純化し、GPUで並列処理をするために、問題を分割する(画面を区切る)
 AMDは遅い、CPU:nVIDIA:AMDで2:1:3くらいか
 個人的には、CPUと比較して以外とGPUは性能が上がりません、と思いました。
・Aobenchを走らせてみた
 AMD,nVIDIAとも早い。が、分析してみるとAMDはデータ転送とカーネルの起動が遅い?

@iitakuさん
「LLVM meets GPU」
 資料はこちら
 low level VM
 去年あたりからLLVMの実装がGPU向けに入っている
 これを使っていろいろやってみた
 boost::pythonなんてあるのか

@ponkotuyさん
「GPGPUと流体計算」
 資料はこちら
 GTX680、メモリが削減されている。GK110はこれが改善されている
 1.5TFlops
 流体計算ではシミュレーション領域を矩形に区切る。並列化は簡単。
 
@w_o さん
 「SASSの読み方」
 資料はこちら
 アセンブラ出せるの、知りませんでした。

@fjnli さん
 「NVIDIA GPUのメモリモデルと仲良くなる」
 キャッシュやメモリ階層の話
 Shared Memory、Texture Memory、いろんなメモリ
 Occupancy、スレッドの同時実行性能。Compute Profilerを使うと良い。レイテンシは隠ぺいしやすい。
 Hot Clockはフェルミの後からなくなった。

@foota さん
 TopCoder/NVIDIA主催CUDAプログラミングコンテスト参加記
 CPUとGPUのどちらに処理をやらせるかの切り分けも大事なようです

以下、LT
岡本さん
関西GPGPU勉強会について

おみやげいただきました。
DSC_0237.jpg
また機会があれば、参加したいです。
プロフィール

手ぎつね

Author:手ぎつね
手ぎつねです。
Twitter ID: @_handyfox

サイズを記憶するフォントサイズ変更ボタン
文字を大きくする 文字を規定のサイズに戻す 文字を小さくする
最新記事
最新トラックバック
月別アーカイブ
カテゴリ
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR