AWS Marketplace製品一覧へ
S4 LogForge
セキュリティ

S4 LogForge

リアルなSIEMテストログ生成器

パーサ忠実な13形式 置き換え対象のAWSサービス: SIEMテスト用の手作りログ生成
AWS Marketplaceで入手

13形式のリアルでパーサ忠実なセキュリティログを任意レートで生成。30日分を数秒でバックフィル、あるいはリアルタイムでストリーム。SIEMのPoC、検知ルール開発、ダッシュボード、キャパシティ見積り、負荷試験向け。MITRE ATT&CKタグ付きの相関攻撃シナリオ、決定論的で再現可能な出力。

S4 LogForge は、実機やSIEMスキーマにフィールド忠実なセキュリティログを生成します — 本番ログを使えないがプロダクション相当のデータが必要な場面のために。13の出力形式はそれぞれ実パーサ(Elasticsearch取り込みパイプライン、Elastic統合、Logstash grok/kv/xml/CEFコーデック)に対しエンドツーエンドで検証済み: RFC 3164/5424 syslog、CEF(ArcSight系)、LEEF 2.0(QRadar系)、PAN-OS 10.2 CSV、ECS 8.11 JSON、XDRテレメトリJSON、Windows Event/Winlogbeat、CloudTrail、VPC Flow、Zeek、Suricata。

課題

SIEM を構築・検証するにはリアルなセキュリティログが必要ですが、本番ログは機微情報を含み流用できず、入手も困難です。手作りした偽ログは実際のパーサーを通らず、検知の正解(ground truth)も持ちません。S4 LogForge は、実機・SIEM スキーマに忠実で正解付きのテストログを生成し、本番ログなしで SIEM プロジェクトを前に進めます。

仕組み

  1. 1

    形式とシナリオを選ぶ

    13 種類の出力形式と MITRE ATT&CK タグ付きの攻撃シナリオを選び、必要なら TOML DSL で独自シナリオを記述します。

  2. 2

    バックフィルかリアルタイム生成

    30 日分を数分でバックフィルするか、日内変動カーブのリアルタイムストリームを file・syslog・Elasticsearch・Splunk HEC へ送出します。

  3. 3

    正解と照らして検知を測る

    注入したシナリオは既知の正解なので、検知率と誤検知率を ground truth と突き合わせて評価できます。

特長

パーサ忠実な13形式 — syslog 3164/5424・CEF・LEEF・PAN-OS CSV・ECS JSON・Windows Event/Winlogbeat・CloudTrail・VPC Flow・Zeek・Suricata・XDRテレメトリ — 各々を実パーサに対して検証。「ログっぽい」では終わらせない。

MITRE ATT&CKタグ付きの相関攻撃シナリオをリアルなベースラインノイズに注入。独自シナリオ記述用のTOML DSL付き。既知の正解に対して検知率・誤検知率を測定。

決定論的でレート制御可能: 同一シードでバイト同一のデータを再現。188k〜1.6M events/secを持続、30日分を数分でバックフィル、または日内変動カーブをファイル/syslog/Elasticsearch/Splunk HECへリアルタイム配信。

含まれるもの

  • 実パーサーで検証済みの 13 出力形式(RFC 3164/5424 syslog、CEF、LEEF 2.0、PAN-OS 10.2 CSV、ECS 8.11 JSON、XDR テレメトリ JSON、Windows イベントログ XML / Winlogbeat、CloudTrail、VPC Flow、Zeek、Suricata)
  • Elasticsearch ingest / Elastic integration パイプラインや Logstash の grok・kv・xml・CEF コーデックなど、実際のパーサーに対するエンドツーエンド検証
  • MITRE ATT&CK タグ付きの相関攻撃シナリオを現実的なベースラインノイズに注入、独自シナリオ用の TOML DSL 付き
  • 決定論的なシード再現性: 同じシードでバイト単位で同一のデータを再生成
  • 188k〜1.6M events/sec のスループットと 30 日分を数分で生成するバックフィル
  • 出力シンク: file、syslog、Elasticsearch、Splunk HEC

こんな用途に

SIEM の PoC・評価を本番ログなしで実施する

既知の正解を使って検知ルールを開発・チューニングする

代表的なデータでダッシュボードを構築・検証する

キャパシティサイジングと負荷テストを行う

よくある質問

生成ログは十分にリアルですか?

13 形式すべてを Elasticsearch ingest / Elastic integration パイプラインや Logstash の grok・kv・xml・CEF コーデックといった実際のパーサーに対してエンドツーエンドで検証しています。「ログらしく見える」だけでなく、実機・SIEM スキーマにフィールド忠実です。

実行は再現できますか?

はい。決定論的なシードにより、同じシードを使えばバイト単位で同一のデータが再生成されます。

検知品質はどう測りますか?

MITRE ATT&CK タグ付きの相関シナリオが既知の正解(ground truth)になるため、それと突き合わせて検知率と誤検知率を測定できます。

どこへ出力できますか?

file、syslog、Elasticsearch、Splunk HEC へ出力できます。バックフィルもリアルタイムストリームも同じシンクに送れます。

どれくらい速く、どれだけのデータを生成できますか?

188k〜1.6M events/sec を維持し、30 日分のバックフィルを数分で生成します。

料金モデル

時間課金のソフトウェア利用料 + EC2(t3級〜)。インスタンスタイプ別の従量課金。ライセンスキー不要。

AWS Marketplaceで入手