メインコンテンツにスキップ

Googleドライブコネクタ:ファイルアップロードのセキュリティ

APIまたはインデックスモードでAIを使用し、データに対するモデルトレーニングなしでGoogleドライブを安全に検索します。

対応者:Emilio Morales
2か月以上前に更新

Perplexityの Googleドライブコネクタ により、 Enterprise Pro および Enterprise Maxのユーザーは、AI搭載の自然言語クエリを使用して、組織のGoogleドライブファイルを直接検索できます。

最近、データセキュリティ上の懸念とスケーラビリティの制約の両方に対処するため、2つの異なる検索モード(高精度検索[インデックスベース]と標準検索[APIベース])からなるハイブリッド検索アーキテクチャを導入しました。

検索アーキテクチャ:2層アプローチ

標準検索(APIベース)

仕組み:

  • クエリ時にGoogleの検索APIを介してGoogleドライブを直接クエリします

  • クエリで見つかった結果を除き、Perplexityインフラストラクチャにファイルのコピーは保存されません(データ保持ポリシー設定によって軽減できます)

  • ファイル数の制限なしに、ユーザーのGoogleドライブ全体を検索します。

  • コネクタを有効化すると、Enterprise ProおよびEnterprise Maxのすべてのユーザーがすぐに利用可能になります。

セキュリティモデル:

  • データ保持ゼロ: クエリで見つかった結果を除き、ファイルはPerplexityシステムにコピーまたは保存されません(データ保持ポリシー設定によって軽減できます)

  • リアルタイムのアクセス許可: Googleドライブのネイティブアクセス制御を動的に尊重します

  • 最小限のデータコピー: 回答に含まれる引用スニペットのみが保持されます

  • モデルトレーニングなし: 同期されたファイルはAIモデルのトレーニングに使用されることはありません

  • 即時アクセス取り消し: Googleドライブの権限が変更されると、アクセスはPerplexityに即座に反映されます。

ユースケース: 最大限のデータプライバシーと最小限のデータフットプリントを求める組織(特に、企業規模で数百万のファイルを横断して検索する場合)。

高精度検索(インデックスベース)

仕組み:

  • ユーザーは、Perplexityでローカルインデックス作成のために同期する特定のファイル/フォルダーを選択します

  • ファイルはダウンロードされ、解析され、Vespaのベクターエンベディングを使用して専用のAWS S3バケットに保存されます

  • より深いセマンティック分析とより包括的な回答を可能にします

  • ファイル制限: スペースあたり500ファイル(Enterprise Pro)、スペースあたり5,000ファイル(Enterprise Max)

  • 合計ユーザー制限: 15,000ファイル(Enterprise Pro)、50,000ファイル(Enterprise Max)

セキュリティモデル:

  • 専用ストレージ: 各組織のファイルは、Vespaベクトルストレージ内の一意の名前空間を持つ、分離されたAWS S3「フォルダー」に保存されます

  • 暗号化: 保存時はAES-256暗号化、転送時はTLS暗号化

  • ロールベースアクセス制御(RBAC): すべてのシステムで最小権限のアクセスが適用されます(注: PerplexityはGoogleドライブのファイル権限に準拠します)

  • モデルトレーニングなし: 同期されたファイルはAIモデルのトレーニングに使用されることはありません

  • 自動同期: Googleドライブでのファイルの変更や削除は、Perplexityに自動的に反映されます。

ユースケース: 頻繁に参照されるドキュメント、プロジェクト別のファイルコレクション、またはキュレーションされたコンテンツを含む共同作業用スペースで、最大限の回答精度を必要とするチーム。

バックエンドアーキテクチャ & データフロー

接続 & 認証

  • 管理者による有効化: 組織の管理者は、権限設定で Google Drive コネクタを有効にします

  • ユーザー認証: ユーザーはGoogle経由でOAuth 2.0を介して認証されます

  • ドライブの選択: ユーザーは接続するGoogleドライブを選択します

  • 管理者の同意: Google Workspaceの管理者は、Google Admin ConsoleでPerplexityアプリに対して組織全体の同意を付与する必要がある場合があります。

両方のメソッドがアクティブな場合:

  • Perplexityは、ローカルインデックスとGoogleドライブAPIの両方に同時にクエリを実行します。

  • 結果は、最も関連性の高いソースを優先するために再ランク付けされます

  • 引用は、完全なファイルアクセスのためにGoogleドライブに直接リンクします。

インデックス作成プロセス(高精度検索)

ファイルの同期とストレージ:

  1. ファイルの選択: ユーザーはPerplexity UIを介してファイル/フォルダーを選択します

  2. ダウンロード: GoogleドライブAPI経由でGoogleドライブからダウンロードされたファイル

  3. ストレージ: 生ファイルを、組織ごとの専用ネームスペースでAWS S3に保存

  4. 解析: サポートされている形式(PDF、DOCX、XLSX、PPTX、CSV、TXT、MD、JSON)からのテキスト抽出

  5. ベクトル化: コンテンツを埋め込みに変換し、Vespaベクトルデータベースに保存

  6. メタデータのインデックス作成: 検索で取得できるよう、ファイルのメタデータ(名前、パス、アクセス許可)をインデックス化

  7. 削除: ユーザーがGoogleドライブとPerplexityの連携を解除すると、インデックス化されたファイルを削除することができます。

セキュリティ & コンプライアンスインフラストラクチャ

権限の適用

Googleドライブ側の権限:

  • ユーザーがGoogleドライブのファイルへのアクセス権を失うと、そのファイルはPerplexityから即座に削除されます。

  • Googleドライブでファイルを削除すると、Perplexityのインデックスから即座に削除されます。

  • ユーザーは、アクセス権限が明示されているGoogleドライブのファイルのみを検索できます。

Perplexity側のアクセス許可:

  • 管理者は、組織設定を介してコネクタにアクセスできるユーザーを制御します

  • スペースに同期されたファイルはスペースメンバーが検索できますが、ファイルへのアクセスには適切なGoogleドライブの権限が必要です。

  • スレッド共有は、組織管理者が設定した組織の共有ポリシーに準拠します。

ベストプラクティス

高精度検索(インデックス作成)を使用するタイミング

  • スペース内のプロジェクト固有のファイルコレクション

  • 頻繁に参照されるナレッジベースのドキュメント

  • 深いセマンティック分析を必要とするファイル

  • キュレーションされたコンテンツを備えた共同作業環境

標準検索を使用するタイミング(APIのみ)

  • 膨大なファイルリポジトリ(数百万のファイル)を検索

  • 厳格なデータレジデンシーと最小限のデータコピー要件

  • アクセス頻度の低いファイルにわたる探索的検索

  • セキュリティ/コンプライアンスの制約が強化されている組織