Copilotシークレットスキャンを使用したジェネリックシークレットの責任ある検出

Copilot シークレットスキャンが責任を持って AI を使用し、パスワードなどの非構造化シークレットをスキャンしてアラートを作成する方法について説明します。

この機能を使用できるユーザーについて

Copilot シークレットスキャンは、次のリポジトリで使用できます。

GitHub Advanced Security が有効な GitHub Enterprise Cloud を使用している組織のパブリック、プライベート、および内部リポジトリ

この記事の内容

Copilot シークレットスキャンを使用したジェネリックシークレットの検出について

Copilot シークレットスキャンのジェネリックシークレットの検出は、AI の搭載により、ソースコード内の非構造化シークレット (パスワード) を識別してアラートを生成する、secret scanning の拡張です。

GitHub Advanced Security ユーザーは、パートナーまたは顧客のパターンのソースコードで見つかったシークレットスキャンニングアラートを受け取ることは既にできていますが、非構造化シークレットは簡単には検出できません。 Copilot シークレットスキャンは、大きな言語モデル (LLM) を使用してこの種類のシークレットを識別します。

パスワードが検出されると、secret scanning アラートの「実験的」一覧 (リポジトリ、組織、またはエンタープライズの [セキュリティ] タブの下) にアラートが表示されるため、メンテナンス担当者とセキュリティマネージャーはアラートを確認し、必要に応じて資格情報を削除するか、修正プログラムを実装できます。

ジェネリックシークレットの検出を使用するには、Enterprise オーナーが最初に、Organization のリポジトリで機能を有効または無効にできるかどうかを制御するポリシーを Enterprise レベルで設定する必要があります。既定では、このポリシーは "許可" に設定されています。その後、リポジトリと組織に対して、この機能を有効にする必要があります。

入力処理

入力は、ユーザーがリポジトリにチェックインしたテキスト (通常はコード) に制限されます。システムはこのテキストを LLM に提供し、さらにメタプロンプトを提供して、入力のスコープにおいてパスワードの検索を要求します。ユーザーが直接 LLM と対話することはありません。

LLM を使用してシステムがパスワードをスキャンします。既存の secret scanning 機能によって既に収集されているデータ以外に、システムが追加でデータを収集することはありません。

出力と表示

LLM はパスワードに似ている文字列をスキャンし、結果として見つかった文字列が、入力に実際に存在するかどうかを確認します。

こうして検出された文字列は、secret scanning アラートページにアラートとして表示されますが、通常のシークレットスキャンニングアラートとは別の追加リストに表示されます。別のリストにしておくことで、検出結果の妥当性がより精密に確認され、トリアージされることを意図しています。各アラートは、AI を使用して検出されたことを示しています。

ジェネリックシークレットの検出のパフォーマンスの向上

ジェネリックシークレットの検出のパフォーマンスを向上させるには、誤検知アラートを適切に閉じることをお勧めします。

Copilot シークレットスキャンのジェネリックシークレットの検出は、パートナーパターンの既存の secret scanning 機能よりも多くの誤検知を生成する可能性があるため、これらのアラートの精度を確認することが重要です。アラートが誤検知だと確認した場合は、必ずアラートをクローズし、GitHub UI で理由を「誤検知」としてマークしてください。 GitHub 開発チームは、誤検知のボリュームと検出の場所に関する情報を使用してモデルを改善します。 GitHub は、シークレットリテラル自体にはアクセスできません。

Copilot シークレットスキャンは、明らかに偽のパスワードやテストパスワード、または低エントロピのパスワードであるシークレットを検出しません。
Copilot シークレットスキャンは、プッシュあたり最大 100 個のパスワードしか検出しません。
1 つのファイル内で検出された 5 つ以上のシークレットが誤検知としてマークされている場合、Copilot シークレットスキャンは、そのファイルの新しいアラートの生成を停止します。
Copilot シークレットスキャンは、生成されたファイルまたはベンダー化されたファイル内のシークレットを検出しません。
Copilot シークレットスキャンは、暗号化されたファイル内のシークレットを検出しません。
Copilot シークレットスキャンは、ファイルの種類 (SVG、PNG、JPEG、CSV、TXT、SQLまたは ITEM) のシークレットを検出しません。
Copilot シークレットスキャンは、テストコードのシークレットを検出しません。 Copilot シークレットスキャンは、以下の場合に検出をスキップします。
- ファイルパスに、"test"、"mock"または "spec" が含まれている。
- ファイル拡張子が .cs、.go、.java、.js、.kt、.php、.py、.rb、.scala、.swiftまたは.tsである。

ジェネリックシークレットの検出の評価

ジェネリックシークレットの検出は、責任ある AI レッドチーミングの対象であり、GitHub は、機能の有効性と安全性を経時的に監視し続けます。

参考資料

シークレットスキャンについて

Copilotシークレットスキャンを使用したジェネリックシークレットの責任ある検出

この機能を使用できるユーザーについて

この記事の内容

Copilot シークレットスキャンを使用したジェネリックシークレットの検出について

入力処理

出力と表示

ジェネリックシークレットの検出のパフォーマンスの向上

アラートの精度を確認し、必要に応じてクローズする

ジェネリックシークレットの検出の制限事項

制限付きのスコープ

誤検知のアラートである可能性

不完全なレポートである可能性

設計上の制限事項

ジェネリックシークレットの検出の評価

参考資料