コンプライアンス

Crawl Hubは用途・domain・出力・保存・負荷を制御する監査可能なWebデータ取得基盤です。

対応サイト優先

初期リリースは対応済みサイト中心です。未確認ドメインは審査または低頻度HTML取得に制限します。

高リスク用途はデフォルト制限

ログイン後ページ、CAPTCHA回避、認証情報転送、個人情報大量収集、口コミ・記事本文・画像の大量再配布は禁止または事前審査です。

CAPTCHA回避・ログイン後取得は非対応

CAPTCHA突破、アクセス制御回避、CookieやAuthorizationなど対象サイト向け認証ヘッダーの転送を目的にした利用は受け付けません。

保存ポリシー

HTML本文、抽出JSON、画像バイナリはデフォルト保存しません。結果ファイル保存を明示した場合だけ保存します。

メタデータ中心のログ

リクエストID、APIキー、ワークスペース、ドメイン、状態、所要時間、HTMLサイズ、Credits、エラーコードなど運用メタデータを記録します。

顧客別の利用制御

利用目的、対応サイト、操作、利用上限、同時実行、ドメインポリシーで利用範囲を制御します。

Domain policy

許可サイト、ブロックドメイン、未確認ドメインの審査、対象サイトごとの頻度制限を分離して管理します。

著作物・商標への配慮

掲載サイトとの非提携を明示し、取得データの再配布可否はユーザー側の責任で確認する前提です。

負荷保護

レート制限、同時実行制御、月次Credits上限により、対象サイトとユーザー請求の双方を保護します。

APIキー監査

平文キーは一度だけ表示し、利用ログはAPI key IDとrequest_id単位で追跡できます。

Artifact opt-in

Customer Contentの永続保存はstore_artifact=trueまたは個別契約で明示されたArtifactに限定します。

法務・請求ゲート

外部法務レビューと決済連携の公開ゲートが完了するまで、有料Checkout URLは発行しません。

対応サイト / 保存ポリシー / 禁止事項