Question 1

它能 100% 阻止失控的代理程式嗎？

Accepted Answer

我們坦誠地將這兩層區分開來。第一層（Layer 1）硬限制是確定性且搶佔式的：任何預留成本超出設定上限的請求都會在轉發前被阻止，即對超出上限的請求進行 100% 搶佔式阻止（輸入狀態相同，決策結果相同，已通過 chaos test 驗證）。第二層（Layer 2）循環偵測是盡力而為的：失控狀態只有在幾次呼叫之後才能被發現，而這幾次呼叫已經產生了帳單，因此它的作用是控制爆炸半徑，將其限制在少量的請求或小額資金內，而不是保證 100% 預防。它隨附了 dry-run 陰影模式，因此您可以在強制執行前測量誤阻止率。

Question 2

如果事先無法得知輸出 token 數量，如何在產生帳單前阻止支出？

Accepted Answer

這是透過先預留後對帳（reserve-then-reconcile）實現的，而不是簡單的估算。在轉發前，預留會使用最壞情況下的成本 —— 輸入 token 立即計算，輸出按 max_tokens 乘以輸出費率進行定價 —— 來做出硬限制決策。當回應返回時，供應商報告的使用量將作為唯一事實來源，並與預留進行對帳。Token 數量會在不同供應商之間進行標準化，並拆分為輸入、輸出、快取讀取（cached-read）和快取寫入（cache-write），以便記帳能反映每家供應商的真實費率卡。

Question 3

我的提示詞儲存在哪裡，發送到哪裡？

Accepted Answer

S4 Firewall 本身不會持久化或傳輸您的提示詞或回應。其唯一的傳出呼叫就是您的應用程式原本就會向提供商發起的請求 —— 防火牆不會增加額外的 egress（出站流量）。帳本和指標僅攜帶 token 數量，不包含內容（counts-not-content，已通過 property test 驗證）。提示詞流向哪裡取決於您選擇的上游：透過 VPC 介面端點（AWS PrivateLink，該 AMI 可選擇性配置）路由到 Amazon Bedrock 可以將這些呼叫保留在您的 AWS 邊界內；而路由到公共網際網路上的第三方提供商，流量則會流出 VPC 並進入網際網路。

Question 4

它需要獨立的控制平面或資料庫嗎？

Accepted Answer

不需要。沒有獨立的控制平面，也沒有外部資料庫。預算狀態在每個執行個體 of 記憶體中儲存，並在重啟時從零重新推導。資料平面是一個運作在加固的 systemd 單元下的單一靜態二進位檔案，不具備任何提權 capability，並被賦予了最小權限的 IAM 角色（包括上游模型呼叫、限定於 S4/Firewall 命名空間的 CloudWatch PutMetricData，以及唯寫到帳本儲存桶的 PutObject）。沒有遙測呼回（telemetry home-call），也沒有授權金鑰檢查。

Question 5

它是如何計費的，我該如何部署它？

Accepted Answer

計費採用 AMI 按小時計費（按執行個體小時計量），並提供年約合約選項，運作在 c6g / c7g（Arm）執行個體上。您可以使用包含的 CloudFormation 範本進行部署 —— 單個執行個體使用 cfn-single.yaml，內部負載平衡器後的冗餘叢集使用 cfn-ha.yaml —— 這些範本可以有選擇地建立 Bedrock VPC 介面端點。然後，您只需將應用程式的 base_url 指向防火牆即可。

請求負載	推薦執行個體	S4 Firewall 實例費用	防止的暴走超支 (假設值)
~10 RPS	t3.medium	$45 / 月	$500–$2,000 / 月
~100 RPS	m5.large	$120 / 月	$2,000–$10,000 / 月
~1k RPS	m5.2xlarge	$310 / 月	$10,000–$50,000+ / 月

S4 Firewall

何時收回成本？

估算您的節省金額

面臨挑戰

運作原理

只需將您的 base_url 指向它

在單個同步管線中進行歸因、預留和決策

雙層攔截，然後與實際使用量進行對帳

產品亮點

包含內容

適用場景

常見問題

為什麼更便宜

按 RPS 選擇 S4 Firewall 實例

計費模式

其他 S4 產品

S4 — Squished S3

S4 Logs

S4 Metrics