メインコンテンツにスキップ

DatabricksとPerplexityの連携

DatabricksデータウェアハウスをPerplexityと統合し、データベース、スキーマ、テーブル、ビューにわたる即時検索を実現します

対応者:Emilio Morales

Databricksコネクターについて

DatabricksコネクターはDatabricks Lakehouseに保存されたデータをPerplexityから直接クエリできるようにします。DatabricksをPerplexityの生産性機能と統合し、手動クエリやコンテキスト切り替えなしに、Databricksのカタログ、スキーマ、テーブルを横断的に関連情報を即座に検索・統合できます。

Databricksコネクターは Perplexity Pro, Perplexity Max, Enterprise Pro, and Enterprise Max ユーザーが利用できます。

Databricksコネクターでできること

有効化後、DatabricksコネクターはDatabricksの認可済みカタログ、スキーマ、テーブルを横断的に検索し、そのデータに基づく回答を提供します。コネクターはOAuth経由で個人のDatabricksアイデンティティで認証するため、クエリはネイティブのDatabricks権限の下で実行されます — 共有サービスアカウントは不要です。

コネクターを使用すると、手動でSQLを記述したりDatabricksコンソールに切り替えることなく、Unity Catalogテーブル、Delta Lakeデータ、ビューを横断して素早く情報を検索できます。Databricksデータが更新されると、コネクターは次回以降のクエリで変更を自動的に反映します。

対応データオブジェクト

Databricksコネクターは以下をサポートしています:

  • Unity Catalogのテーブルとビュー

  • Delta Lakeテーブル

  • スキーマとカタログ

  • Unity Catalogに登録された外部テーブル

  • 構造化データ(CSV、JSON、Parquetバックアップテーブル)

現時点では、非構造化データ(Databricks Volumesに保存された画像、音声、動画、ファイル)はサポートされていません。

認証

DatabricksコネクターはOAuth(個人ユーザー)認証を使用します。各PerplexityユーザーはDatabricksの認証情報で接続し、クエリはそのユーザーのネイティブUnity Catalog権限の下で実行されます — 共有サービスアカウント、PAT、サービスプリンシパルは不要です。

これは以下を意味します:

  • データアクセスは各ユーザーの既存Databricks権限によって管理されます

  • すべてのクエリにはDatabricksでの明確なユーザーごとの監査証跡があります

  • 組織管理者がOAuthアプリを一度設定し、個々のユーザーが自分のアカウントで認証します

注意:OAuthトークンは各ユーザーのDatabricksアイデンティティにバインドされているため、ユーザーはDatabricksで既にアクセス権を持つカタログ、スキーマ、テーブルのみクエリできます。接続前に適切なUnity Catalogの権限が設定されていることを確認してください。

PerplexityがDatabricksで実行できる操作の制御

DatabricksコネクターはSQLをMerge Databricksコネクターから提供されるツールサーフェス経由で実行し、汎用のexecute_sql_statementツールを含みます。execute_sql_statementはDDLやDMLを含む任意のSQLを受け付けるため、Perplexityが実行できる操作を読み取り専用に制限する唯一の信頼できる方法はUnity Catalogレベルでの制御であり、Perplexity UIではありません。

推奨パターン:Unity Catalogの権限で読み取り専用を強制する。

コネクターはOAuth経由でユーザーごとに認証するため、Perplexityが試みるすべてのアクションはそのユーザーのDatabricksアイデンティティで実行され、既存のUnity Catalog権限に従います。使用を読み取り専用に保つために、各ユーザー(または所属するグループ)に以下のみを付与してください:

  • クエリ対象のカタログへのUSE CATALOG

  • クエリ対象のスキーマへのUSE SCHEMA

  • クエリ対象のテーブルとビューへのSELECT

また、明示的にこれらのオブジェクトへのMODIFYCREATEOWN、およびSQL WarehouseへのCAN MANAGE保持しないようにしてください。Unity Catalogをこのように設定することで、呼び出されるツールに関わらず、ユーザーが書き込み権限を持たないオブジェクトへのPerplexityの書き込み試行はDatabricksが拒否します。

注意:PerplexityはDatabricksコネクター設定に利用可能なツールを一覧表示するツール権限パネルを表示します。現在、このパネルは読み取り/書き込み/編集の強制的な制限を提供しません — 上記のUnity Catalogレベルでのアクセス管理がPerplexityの動作を制御する正しい方法です。

プライバシーとデータセキュリティ

Perplexityに接続すると、Databricksコネクターはあなたの代わりに以下の操作を実行できます:

  • SQL WarehouseでDatabricksデータのSQLクエリを実行

  • Unity Catalogのテーブル、ビュー、スキーマのクエリ

  • Delta Lakeテーブルのメタデータとデータの読み取り

Databricksでアクセスを取り消すか権限を削除すると、そのデータはすぐにPerplexityからアクセスできなくなります。PerplexityでDatabricksアカウントを切断した場合、キャッシュデータを保持するか削除するかを選択できます。

エンタープライズグレードのセキュリティと制御

Enterprise組織向けに、PerplexityはSOC 2 Type II認証、エンドツーエンド暗号化、厳格なデータプライバシー対策、きめ細かいユーザーアクセス制御を提供しています。DatabricksデータがAIトレーニングに使用されることはありません。

PerplexityとDatabricksの接続は個人レベルで行われます — 組織内の他の誰もDatabricksデータをクエリできません。ただし、共有スペースにデータを同期した場合、そのスペースへのアクセス権を持つ人は誰でも検索できます。

Organization管理者はOrganization設定権限画面から、すべてのユーザーに対してDatabricksコネクターを有効化・無効化できます。読み取り/書き込みの強制はUnity Catalogレベルで処理されます(上記のPerplexityがDatabricksで実行できる操作の制御を参照)。

有効化の方法

Databricksコネクターの設定は2段階のプロセスです:管理者がOrganization向けにOAuthアプリを一度設定し、各ユーザーがDatabricksアカウントで個別に認証します。

パート1:管理者設定 — OrganizationのDatabricksを構成する

Databricksワークスペース管理者がこのステップを一度完了する必要があります。個々のユーザーは繰り返す必要はありません。

Organization設定 → コネクター → Databricksに、「OrganizationのDatabricksを構成する」というタイトルの3ステップ設定パネルが表示されます:

  • ステップ1: OAuthアプリの管理OAuthアプリの管理をクリックして、DatabricksワークスペースにPerplexityをOAuthクライアントとして登録します。これにより、PerplexityはワークスペースのOAuth経由でユーザーを認証する権限を取得します。

  • ステップ2: Databricksで認証 — 管理者が一度認証して、統合がエンドツーエンドで機能することを確認します。

  • ステップ3: データマップの生成(オプション) — Organizationのデータマップをオプションで生成します(下記パート3とデータマップの理解を参照)。また、補足コンテキストを追加してクエリ精度を向上させます。

注意:このステップを完了するにはDatabricksワークスペース管理者権限が必要です。DatabricksでOAuthアプリを登録する方法が不明な場合は、Databricks OAuthドキュメントを参照してください。

パート2:ユーザー設定 — 認証して接続する

各ユーザーが独立して以下のステップを実行します:

  1. 設定のコネクターに移動し、Databricksコネクターを見つけます。

  2. 有効化コネクターを追加をクリックします。

  3. Databricksで認証をクリックします。自分の認証情報でログインするためにDatabricksにリダイレクトされます。

  4. PerplexityがDatabricksデータにアクセスすることを承認します。

  5. 許可をクリックして設定を完了します。

パート3:データマップの生成(オプション、推奨)

認証後、PerplexityはDatabricks環境のデータマップを生成できます。これによりComputerはカタログ構造を把握し、データに関する質問により正確に回答できるようになります。

  • いつでもデータマップを再生成をクリックしてマップを構築または更新できます。

  • 最良の結果を得るために、補足コンテキストも追加してください — データを説明するファイルをアップロードしたりメモを追加します(例:主要テーブルの意味、ビジネス定義、一般的なクエリパターン)。この追加コンテキストはエージェントがデータを正しく解釈するのに役立ちます。

  • ナレッジを表示をクリックして、PerplexityがDatabricks環境について学習した内容を確認します。

データマップをスキップすると、複雑なデータの質問に対する精度が低下します。初期設定の一部として生成することをお勧めします。詳しくはデータマップの理解をご覧ください。

接続データの利用

接続後、ComputerでDatabricksのタスクを実行できます。カタログ、スキーマ、テーブルを指定すると、Perplexityはそれらをマルチステップのワークフローの一部としてクエリします — すべてセキュアなクラウドサンドボックスで非同期に実行されます。

試してみる

接続後、次のようなクエリを試してください:

  • 「Q4セールステーブルの収益トレンドを要約し、主要指標を強調してください」

  • 「過去30日間に更新されたすべての顧客レコードを検索してください」

  • 「analyticsスキーマに基づいて最もパフォーマンスの高い製品は何ですか?」

  • 「今四半期のパイプラインデータを前四半期の数値と比較してください」

トラブルシューティング

DatabricksがOrganizationで有効になっていない場合

組織管理者がコネクターを無効にしているか、OAuthアプリがまだ設定されていない可能性があります。組織管理者に確認するか、Perplexityサポートにお問い合わせください。

OAuthアプリが設定されていない場合

ユーザーが認証時にエラーが表示される場合、管理者OAuthアプリの設定(パート1)が完了していない可能性があります。ワークスペース管理者はOrganization設定 → コネクター → Databricksに戻ってOAuthアプリの管理ステップを完了してください。

接続後にユーザーが特定のテーブルにアクセスできない場合

DatabricksコネクターはユーザーごとのUnity Catalog権限を尊重します。ユーザーがアクセスできるはずのテーブルをクエリできない場合、Unity Catalogで適切なGRANTが適用されていることを確認してください:

-- Grant access to a catalog
GRANT USE CATALOG ON CATALOG my_catalog TO `user@example.com`;

-- Grant access to a schema
GRANT USE SCHEMA ON SCHEMA my_catalog.my_schema TO `user@example.com`;

-- Grant read access to tables
GRANT SELECT ON TABLE my_catalog.my_schema.my_table TO `user@example.com`;

データマップが古いまたは不正確な場合

PerplexityがDatabricksデータについて不正確または古い回答を生成している場合は、コネクター設定でデータマップを再生成してください。また、補足コンテキストを追加・更新して、エージェントにデータ構造についてより良いガイダンスを提供できます。

接続と認証の問題

  • DatabricksワークスペースでOAuthアプリが正しく設定されていることを確認する

  • DatabricksのOAuthアプリ設定でPerplexityのリダイレクトURIがホワイトリストに登録されていることを確認する

  • ワークスペースでIPアクセスリストを使用している場合、PerplexityのIPがホワイトリストに登録されていることを確認する

  • ワークスペースポリシーの変更後にユーザーにDatabricksコネクターの再接続を依頼する

これらの設定を更新しても問題が解決しない場合は、Perplexityサポートにお問い合わせください。