Databricks Connector के बारे में
Databricks Connector आपको सीधे Perplexity से अपने Databricks Lakehouse में संग्रहीत डेटा को क्वेरी करने की सुविधा देता है। यह Databricks को Perplexity की उत्पादकता सुविधाओं के साथ एकीकृत करता है, जिससे आप अपने Databricks कैटलॉग, स्कीमा और तालिकाओं में प्रासंगिक जानकारी को तुरंत खोज और संयोजित कर सकते हैं—बिना मैन्युअल क्वेरी या संदर्भ बदले।
Databricks Connector Perplexity Pro, Perplexity Max, Enterprise Pro, और Enterprise Max उपयोगकर्ताओं के लिए उपलब्ध है।
Databricks Connector क्या करता है?
सक्षम होने के बाद, Databricks Connector आपको अपने अधिकृत Databricks कैटलॉग, स्कीमा और तालिकाओं में खोज करने और उस डेटा के आधार पर उत्तर प्रदान करने की अनुमति देता है। यह कनेक्टर OAuth के माध्यम से आपकी व्यक्तिगत Databricks पहचान से प्रमाणीकरण करता है, जिसका अर्थ है कि क्वेरी आपकी मूल Databricks अनुमतियों के तहत चलती हैं—किसी साझा सेवा खाते की आवश्यकता नहीं है।
आप कनेक्टर का उपयोग करके मैन्युअल रूप से SQL लिखे बिना या Databricks कंसोल पर स्विच किए बिना Unity Catalog तालिकाओं, Delta Lake डेटा और व्यू में जानकारी तुरंत ढूँढ सकते हैं। जब आपका Databricks डेटा अपडेट होता है, तो कनेक्टर अगली क्वेरी के दौरान उन परिवर्तनों को स्वचालित रूप से प्रतिबिंबित करता है।
समर्थित डेटा ऑब्जेक्ट
Databricks Connector निम्नलिखित का समर्थन करता है:
Unity Catalog तालिकाएँ और व्यू
Delta Lake तालिकाएँ
स्कीमा और कैटलॉग
Unity Catalog में पंजीकृत बाहरी तालिकाएँ
संरचित डेटा (CSV, JSON, Parquet-समर्थित तालिकाएँ)
फ़िलहाल, असंरचित डेटा (Databricks Volumes में संग्रहीत छवियाँ, ऑडियो, वीडियो और फ़ाइलें) समर्थित नहीं है।
प्रमाणीकरण
Databricks Connector OAuth (व्यक्तिगत उपयोगकर्ता) प्रमाणीकरण का उपयोग करता है। प्रत्येक Perplexity उपयोगकर्ता अपने स्वयं के Databricks क्रेडेंशियल का उपयोग करके कनेक्ट करता है, और क्वेरी उस उपयोगकर्ता की मूल Unity Catalog अनुमतियों के तहत चलती हैं—कोई साझा सेवा खाता, PAT, या service principal शामिल नहीं है।
इसका अर्थ है:
डेटा एक्सेस प्रत्येक उपयोगकर्ता की मौजूदा Databricks अनुमतियों द्वारा नियंत्रित होता है।
प्रत्येक क्वेरी Databricks में प्रति-उपयोगकर्ता एक स्पष्ट ऑडिट ट्रेल रखती है।
एक संगठन एडमिन OAuth ऐप को एक बार कॉन्फ़िगर करता है; उसके बाद व्यक्तिगत उपयोगकर्ता अपने स्वयं के खातों से प्रमाणीकरण करते हैं।
नोट: चूँकि OAuth टोकन प्रत्येक उपयोगकर्ता की Databricks पहचान से बँधे होते हैं, उपयोगकर्ता केवल उन कैटलॉग, स्कीमा और तालिकाओं पर क्वेरी कर पाएँगे जिन तक उनकी पहले से Databricks में पहुँच है। कनेक्ट करने से पहले सुनिश्चित करें कि उपयुक्त Unity Catalog अनुमतियाँ (grants) मौजूद हैं।
Databricks में Perplexity क्या कर सकता है, इसे नियंत्रित करना
Databricks Connector एक टूल इंटरफ़ेस (Merge Databricks connector से लिया गया) के माध्यम से SQL निष्पादित करता है, जिसमें एक सामान्य execute_sql_statement टूल शामिल है। चूँकि execute_sql_statement मनमाना SQL—DDL और DML सहित—स्वीकार करता है, इसलिए केवल विश्वसनीय तरीका यह है कि Perplexity क्या कर सकता है, इसे रीड-ओनली या अन्यथा प्रतिबंधित करने के लिए Unity Catalog स्तर पर नियंत्रण लगाया जाए, न कि Perplexity UI में।
अनुशंसित पैटर्न: Unity Catalog अनुमतियों के माध्यम से रीड-ओनली लागू करें।
चूँकि कनेक्टर OAuth के माध्यम से प्रति-उपयोगकर्ता प्रमाणीकरण करता है, इसलिए Perplexity द्वारा किया गया हर एक्शन उस उपयोगकर्ता की Databricks पहचान के तहत चलता है और उसकी मौजूदा Unity Catalog अनुमतियों के अधीन होता है। उपयोग को रीड-ओनली रखने के लिए, सुनिश्चित करें कि प्रत्येक उपयोगकर्ता (या उनके समूह) के पास केवल निम्नलिखित अनुमतियाँ हों:
जिन कैटलॉग पर आप उन्हें क्वेरी करने देना चाहते हैं, उन पर
USE CATALOGजिन स्कीमा पर आप उन्हें क्वेरी करने देना चाहते हैं, उन पर
USE SCHEMAजिन तालिकाओं और व्यू पर आप उन्हें क्वेरी करने देना चाहते हैं, उन पर
SELECT
और यह सुनिश्चित करें कि उन ऑब्जेक्ट्स पर उनके पास MODIFY, CREATE, या OWN नहीं है, और SQL warehouse पर CAN MANAGE भी नहीं है। Unity Catalog को इस प्रकार कॉन्फ़िगर करने पर, Databricks उन ऑब्जेक्ट्स पर Perplexity द्वारा किए जाने वाले किसी भी राइट प्रयास को अस्वीकार कर देगा जहाँ उपयोगकर्ता के पास राइट विशेषाधिकार नहीं हैं—भले ही कोई भी टूल कॉल किया गया हो।
नोट: Perplexity, Databricks कनेक्टर सेटिंग्स में एक Tool permissions पैनल दिखाता है, जो उपलब्ध टूल्स को सूचीबद्ध करता है। फ़िलहाल, यह पैनल विश्वसनीय रीड/राइट/एडिट प्रवर्तन प्रदान नहीं करता—Unity Catalog स्तर (ऊपर बताए अनुसार) पर एक्सेस को नियंत्रित करना ही Perplexity क्या कर सकता है, इसे नियंत्रित करने का सही तरीका है।
गोपनीयता और डेटा सुरक्षा
जब Perplexity से कनेक्ट किया जाता है, तो Databricks Connector आपकी ओर से निम्नलिखित क्रियाएँ कर सकता है:
SQL Warehouses के माध्यम से Databricks डेटा पर SQL क्वेरी निष्पादित करना
Unity Catalog तालिकाओं, व्यू और स्कीमा पर क्वेरी करना
Delta Lake तालिका के मेटाडेटा और डेटा को पढ़ना
यदि आप Databricks में पहुँच रद्द कर देते हैं या अनुमतियाँ हटा देते हैं, तो वह डेटा तुरंत Perplexity से एक्सेस करने योग्य नहीं रहेगा। यदि आप Perplexity में अपना Databricks खाता डिस्कनेक्ट करते हैं, तो आप चुन सकते हैं कि कैश किया गया डेटा रखें या हटा दें।
एंटरप्राइज़-ग्रेड सुरक्षा और नियंत्रण
Enterprise संगठनों के लिए, Perplexity SOC 2 Type II प्रमाणन, एंड-टू-एंड एन्क्रिप्शन, सख़्त डेटा गोपनीयता उपाय, और बारीक स्तर के उपयोगकर्ता एक्सेस नियंत्रण प्रदान करता है। आपके Databricks डेटा का उपयोग कभी भी AI प्रशिक्षण के लिए नहीं किया जाता है।
Perplexity को Databricks से कनेक्ट करना व्यक्तिगत स्तर पर होता है—आपके संगठन में कोई और आपके Databricks डेटा पर क्वेरी नहीं कर सकता। हालाँकि, यदि आप डेटा को किसी साझा Space में सिंक करते हैं, तो उस Space तक पहुँच रखने वाला कोई भी व्यक्ति उसे खोज सकेगा।
संगठन एडमिन Organization Settings में Permissions स्क्रीन से सभी उपयोगकर्ताओं के लिए Databricks Connector को सक्षम या अक्षम कर सकते हैं। रीड/राइट प्रवर्तन Unity Catalog स्तर पर किया जाता है (ऊपर Databricks में Perplexity क्या कर सकता है, इसे नियंत्रित करना देखें)।
इसे कैसे सक्रिय करें
Databricks Connector को सेट अप करना दो-चरणीय प्रक्रिया है: एक एडमिन संगठन के लिए OAuth ऐप को एक बार कॉन्फ़िगर करता है, और फिर प्रत्येक उपयोगकर्ता अपने स्वयं के Databricks खाते से प्रमाणीकरण करता है।
भाग 1: एडमिन सेटअप — अपने संगठन के लिए Databricks कॉन्फ़िगर करें
एक Databricks workspace एडमिन को यह चरण एक बार पूरा करना होगा। व्यक्तिगत उपयोगकर्ताओं को इसे दोहराने की आवश्यकता नहीं है।
Organization Settings → Connectors → Databricks में, आपको "Configure Databricks for your organization" शीर्षक वाला एक तीन-चरणीय सेटअप पैनल दिखाई देगा:
चरण 1: Manage OAuth app — Perplexity को अपने Databricks workspace में OAuth क्लाइंट के रूप में पंजीकृत करने के लिए Manage OAuth app पर क्लिक करें। यह Perplexity को आपके workspace के विरुद्ध OAuth के माध्यम से उपयोगकर्ताओं को प्रमाणित करने की अनुमति देता है।
चरण 2: Authenticate with Databricks — एडमिन यह सत्यापित करने के लिए एक बार प्रमाणीकरण करता है कि एकीकरण एंड-टू-एंड कार्य करता है।
चरण 3: Generate a data map (वैकल्पिक) — वैकल्पिक रूप से संगठन के लिए एक डेटा मानचित्र बनाएँ (नीचे भाग 3 और Understanding the Data Map देखें) और क्वेरी की सटीकता बेहतर करने के लिए पूरक संदर्भ (Supplementary context) जोड़ें।
नोट: इस चरण को पूरा करने के लिए आपको Databricks workspace एडमिन विशेषाधिकारों की आवश्यकता होगी। यदि आपको Databricks में OAuth ऐप पंजीकृत करने का तरीका नहीं पता, तो Databricks OAuth दस्तावेज़ देखें।
भाग 2: उपयोगकर्ता सेटअप — प्रमाणीकरण और कनेक्ट करें
प्रत्येक उपयोगकर्ता निम्नलिखित चरण स्वतंत्र रूप से पूरा करता है:
Settings में Connectors पर जाएँ और Databricks Connector ढूँढें।
Enable → Add Connector पर क्लिक करें।
Authenticate with Databricks पर क्लिक करें। आपको अपने क्रेडेंशियल से लॉग इन करने के लिए Databricks पर पुनर्निर्देशित किया जाएगा।
Perplexity को अपने Databricks डेटा तक पहुँचने की अनुमति दें।
सेटअप पूरा करने के लिए Allow पर क्लिक करें।
भाग 3: डेटा मानचित्र बनाएँ (वैकल्पिक लेकिन अनुशंसित)
प्रमाणीकरण के बाद, Perplexity आपके Databricks वातावरण का एक data map बना सकता है। यह Computer को आपकी कैटलॉग संरचना समझने और डेटा संबंधी प्रश्नों का अधिक सटीक उत्तर देने में मदद करता है।
किसी भी समय मानचित्र बनाने या ताज़ा करने के लिए Regenerate data map पर क्लिक करें।
सर्वोत्तम परिणामों के लिए, पूरक संदर्भ (Supplementary context) भी जोड़ें—अपने डेटा का वर्णन करने वाली फ़ाइलें अपलोड करें या नोट्स जोड़ें (उदाहरण के लिए, मुख्य तालिकाएँ क्या दर्शाती हैं, व्यवसाय परिभाषाएँ, सामान्य क्वेरी पैटर्न)। यह अतिरिक्त संदर्भ एजेंट को आपके डेटा की सही व्याख्या करने में मदद करता है।
Perplexity ने आपके Databricks वातावरण के बारे में क्या सीखा है, इसकी समीक्षा करने के लिए View knowledge पर क्लिक करें।
डेटा मानचित्र को छोड़ देने से जटिल डेटा प्रश्नों पर सटीकता कम हो जाएगी। हम प्रारंभिक सेटअप के हिस्से के रूप में इसे बनाने की अनुशंसा करते हैं। अधिक जानकारी के लिए Understanding the Data Map देखें।
कनेक्ट किए गए डेटा का उपयोग
एक बार कनेक्ट हो जाने पर, आप Computer कार्यों में अपने Databricks डेटा का संदर्भ दे सकते हैं। कैटलॉग, स्कीमा या तालिकाओं का उल्लेख करें और Perplexity बहु-चरणीय वर्कफ़्लो के हिस्से के रूप में उन पर क्वेरी करेगा—सब कुछ एक सुरक्षित क्लाउड सैंडबॉक्स में असिंक्रोनस रूप से।
इसे आज़माना
एक बार कनेक्ट हो जाने पर, इन जैसी क्वेरी चलाने का प्रयास करें:
"Q4 sales तालिका से राजस्व प्रवृत्तियों का सारांश दें और मुख्य मेट्रिक्स पर प्रकाश डालें"
"पिछले 30 दिनों में अपडेट किए गए सभी ग्राहक रिकॉर्ड खोजें"
"analytics स्कीमा के आधार पर सबसे अच्छा प्रदर्शन करने वाले उत्पाद कौन-से हैं?"
"इस तिमाही के पाइपलाइन डेटा की तुलना पिछली तिमाही के आँकड़ों से करें"
समस्या निवारण
आपके संगठन के लिए Databricks सक्षम नहीं है
हो सकता है कि एक संगठन एडमिन ने कनेक्टर को अक्षम कर दिया हो, या OAuth ऐप अभी तक कॉन्फ़िगर न हुआ हो। पुष्टि के लिए अपने संगठन एडमिन से संपर्क करें, या Perplexity सहायता से संपर्क करें।
OAuth ऐप कॉन्फ़िगर नहीं है
यदि उपयोगकर्ताओं को प्रमाणीकरण का प्रयास करते समय कोई त्रुटि दिखाई देती है, तो हो सकता है कि एडमिन OAuth ऐप सेटअप (भाग 1) पूरा न हुआ हो। एक workspace एडमिन को Organization Settings → Connectors → Databricks पर वापस जाकर Manage OAuth app चरण पूरा करना चाहिए।
कनेक्ट करने के बाद उपयोगकर्ता कुछ तालिकाओं तक नहीं पहुँच पा रहा
Databricks Connector प्रत्येक उपयोगकर्ता की मौजूदा Unity Catalog अनुमतियों का सम्मान करता है। यदि कोई उपयोगकर्ता उस तालिका पर क्वेरी नहीं कर पा रहा जिस पर पहुँच की उम्मीद है, तो सत्यापित करें कि Unity Catalog में उपयुक्त GRANT लागू किया गया है:
-- किसी कैटलॉग पर पहुँच प्रदान करें
GRANT USE CATALOG ON CATALOG my_catalog TO `user@example.com`;
-- किसी स्कीमा पर पहुँच प्रदान करें
GRANT USE SCHEMA ON SCHEMA my_catalog.my_schema TO `user@example.com`;
-- तालिकाओं पर रीड पहुँच प्रदान करें
GRANT SELECT ON TABLE my_catalog.my_schema.my_table TO `user@example.com`;
डेटा मानचित्र पुराना या अशुद्ध है
यदि Perplexity आपके Databricks डेटा के बारे में गलत या पुराने उत्तर दे रहा है, तो कनेक्टर सेटिंग्स में Regenerate data map पर क्लिक करने का प्रयास करें। आप अपने डेटा संरचना पर एजेंट को बेहतर मार्गदर्शन देने के लिए पूरक संदर्भ (Supplementary context) को भी जोड़ या अपडेट कर सकते हैं।
कनेक्शन और प्रमाणीकरण संबंधी समस्याएँ
सत्यापित करें कि OAuth ऐप आपके Databricks workspace में सही ढंग से कॉन्फ़िगर किया गया है
पुष्टि करें कि Perplexity के redirect URI आपके Databricks OAuth ऐप सेटिंग्स में allowlist में जोड़े गए हैं
यदि आपका workspace IP access lists का उपयोग करता है, तो सुनिश्चित करें कि Perplexity के IP allowlist में हैं
workspace पॉलिसी में किसी भी बदलाव के बाद उपयोगकर्ताओं से Databricks Connector को पुनः कनेक्ट करने को कहें
इन सेटिंग्स को अपडेट करने के बाद भी यदि समस्याएँ बनी रहती हैं, तो सहायता के लिए Perplexity सहायता से संपर्क करें।

