プロジェクト一覧に戻る
2023年1月
2 分で読める

FBGEMM_GPU

推薦システムアプリケーション向けの低精度GEMMとPyTorch GPUオペレーターのライブラリ

FBGEMM(Facebook GEneral Matrix Multiplication)は、サーバーサイド推論のための 低精度・高性能な行列積演算および畳み込みライブラリです。

このライブラリは、小さなバッチサイズに対して効率的な低精度の行列積演算を提供し、 行単位の量子化や外れ値を考慮した量子化など、精度低下を最小限に抑える技術をサポートしています。 また、FBGEMMは、低精度での行列積演算におけるユニークな課題を克服するために、 帯域幅制約のある操作での融合機会を活用します。

FBGEMM_GPU(FBGEMM GPUカーネルライブラリ)は、トレーニングと推論のための高性能な PyTorch GPUオペレーターライブラリのコレクションです。このライブラリは、 効率的なテーブルバッチ埋め込みバッグ、データレイアウト変換、量子化サポートを提供します。