Question 1

圧縮は本当にロスレスですか？

Accepted Answer

はい。復元は常にバイト単位で完全一致し、bf16 / fp16 / fp32 の重みと fp32 のオプティマイザ状態について、NaN・±Inf・非正規化数・-0.0 といった敵対的なビットパターンで検証しています。さらに AMI ビルド自体が、ビルド GPU 上での圧縮→展開のラウンドトリップがビット完全でなければ失敗するため、プレーン再構成が壊れたコーデックがお客様のイメージに届くことはありません。

Question 2

どれくらい圧縮できますか？

Accepted Answer

削減量はデータ次第です。all-bf16 や低精度オプティマイザのチェックポイントはよく圧縮され、規模が大きいほど効果が高まります。一方で、間隔を空けて保存される fp32 主体のチェックポイントはあまり圧縮されません。当社はどこで効果が出るかを正直に示しており、固定の圧縮率は主張しません。なお圧縮は常にロスレスで、ブロブを小さな固定ヘッダ分を超えて膨張させることはありません。

Question 3

チェックポイントはどこに保存されますか？

Accepted Answer

圧縮済みチェックポイントは、お客様自身が指定した Amazon S3 レジストリバケットに保存され、アカウント外に出ることはありません。AMI はお客様自身の VPC 内で起動し、PyTorch の学習コードが s4weights.save / s4weights.load（または差分チェーンの save_checkpoint / load_checkpoint）でチェックポイントを書き出すと、各テンソルが GPU 上で圧縮され、ビット完全な圧縮チェックポイントが S3 レジストリへ保存されます。

Question 4

どのインスタンスで動作し、どのように課金されますか？

Accepted Answer

g6 または g6e の GPU インスタンスで動作し、付属の CloudFormation テンプレート（deploy/cfn-train-runner.yaml）がエンドツーエンドで構成します。課金はインスタンスタイプごとの時間課金で、年額オプションもあります。AWS が稼働中のインスタンス時間を自動計測し、runner は起動時に一度だけ RegisterUsage をフェイルクローズドなエンタイトルメント検証として呼び出します（エンタイトルメントのないインスタンスは起動を拒否します）。

Question 5

PyTorch の学習コードへの組み込みは簡単ですか？

Accepted Answer

ドロップインで使えます。透過的な s4weights.save / s4weights.load でチェックポイントを書き出すか、ベース→差分のチェックポイントストアを使う場合は save_checkpoint / load_checkpoint を利用します。各テンソルは GPU 上で圧縮され、頻繁に保存する学習では連続するチェックポイント間のバイト XOR 差分も保存・圧縮されます。

S4 Weights

課題

仕組み

GPU 上でバイトプレーンに分割

チェックポイント間の差分を圧縮

ビット完全に復元し自分の S3 へ保存

特長

含まれるもの

こんな用途に

よくある質問

料金モデル

他のS4製品

S4 — Squished S3

S4 Logs

S4 Metrics