सीधे मुख्य कॉन्टेंट पर जाएं

Google Drive कनेक्टर: फ़ाइल अपलोड सुरक्षा

API या इंडेक्स्ड मोड का उपयोग करके AI की मदद से Google Drive में सुरक्षित रूप से खोजें, और आपके डेटा पर मॉडल ट्रेनिंग बिलकुल नहीं होती।

Emilio Morales द्वारा लिखा गया
2 महीने पहले अपडेट किया गया

Perplexity का Google Drive कनेक्टर Enterprise Pro और Enterprise Max उपयोगकर्ताओं को AI-संचालित प्राकृतिक भाषा प्रश्नों के माध्यम से सीधे अपने संगठन की Google Drive फ़ाइलों को खोजने की सुविधा प्रदान करता है।

हमने हाल ही में एक हाइब्रिड सर्च आर्किटेक्चर पेश किया है, जो दो अलग-अलग सर्च मोड के ज़रिए डेटा सुरक्षा से जुड़ी चिंताओं और स्केलेबिलिटी की सीमाओं को दूर करता है: हाई-प्रिसिज़न सर्च (इंडेक्सिंग-आधारित) और स्टैंडर्ड सर्च (API-आधारित)।

सर्च आर्किटेक्चर: दो-स्तरीय दृष्टिकोण

स्टैंडर्ड सर्च (API-आधारित)

यह कैसे काम करता है:

  • क्वेरी के समय Google की Search API के माध्यम से सीधे Google Drive को क्वेरी करता है

  • क्वेरी से मिले नतीजों के अलावा, Perplexity के ढाँचे में कोई फ़ाइल कॉपी स्टोर नहीं की जाती (इसे डेटा रिटेंशन पॉलिसी सेटिंग से कम किया जा सकता है)

  • फ़ाइल संख्या की सीमा के बिना उपयोगकर्ता के पूरे Google Drive में खोज करता है

  • कनेक्टर सक्रिय होते ही सभी Enterprise Pro और Enterprise Max उपयोगकर्ताओं के लिए तुरंत उपलब्ध

सुरक्षा मॉडल:

  • शून्य डेटा प्रतिधारण: क्वेरी से मिले परिणामों के अलावा, फ़ाइलों को Perplexity सिस्टम में कॉपी या स्टोर नहीं किया जाता है (डेटा प्रतिधारण नीति सेटिंग्स द्वारा कम किया जा सकता है)

  • रीयल-टाइम अनुमतियाँ: Google Drive के मूल एक्सेस नियंत्रणों का गतिशील रूप से सम्मान करता है

  • न्यूनतम डेटा कॉपी करना: केवल उत्तरों में शामिल उद्धरण स्निपेट ही रखे जाते हैं

  • कोई मॉडल प्रशिक्षण नहीं: सिंक की गई फ़ाइलों का उपयोग कभी भी AI मॉडल को प्रशिक्षित करने के लिए नहीं किया जाता है

  • तत्काल पहुँच निरस्तीकरण: जब Google Drive अनुमतियाँ बदलती हैं, तो Perplexity में पहुँच तुरंत प्रतिबिंबित होती है

उपयोग का मामला: जिन संगठनों को अधिकतम डेटा गोपनीयता और न्यूनतम डेटा फ़ुटप्रिंट की आवश्यकता होती है, खासकर एंटरप्राइज़ स्तर पर लाखों फ़ाइलों में खोज करने के लिए।

उच्च-सटीकता खोज (इंडेक्सिंग-आधारित)

यह कैसे काम करता है:

  • यूज़र Perplexity में लोकल इंडेक्सिंग के लिए सिंक करने के लिए खास फ़ाइलें/फ़ोल्डर चुनते हैं

  • फ़ाइलों को डाउनलोड किया जाता है, पार्स किया जाता है और Vespa में वेक्टर एम्बेडिंग के साथ समर्पित AWS S3 बकेट में स्टोर किया जाता है।

  • गहरे अर्थ विश्लेषण और ज़्यादा विस्तृत जवाबों की सुविधा देता है

  • फ़ाइल सीमाएँ: 500 फ़ाइलें प्रति स्पेस (Enterprise Pro), 5,000 फ़ाइलें प्रति स्पेस (Enterprise Max)

  • कुल यूज़र लिमिट: 15,000 फ़ाइलें (Enterprise Pro), 50,000 फ़ाइलें (Enterprise Max)

सुरक्षा मॉडल:

  • समर्पित स्टोरेज: हर संगठन की फ़ाइलें अलग-अलग AWS S3 "फ़ोल्डर" में स्टोर की जाती हैं, जिनके Vespa वेक्टर स्टोरेज में यूनीक नेमस्पेस होते हैं

  • एन्क्रिप्शन: AES-256 एन्क्रिप्शन एट रेस्ट, TLS एन्क्रिप्शन इन ट्रांज़िट

  • भूमिका-आधारित पहुँच नियंत्रण (RBAC): सभी प्रणालियों में न्यूनतम विशेषाधिकार वाली पहुँच लागू की जाती है (ध्यान दें: Perplexity Google Drive की फ़ाइल अनुमतियों का पालन करता है)

  • कोई मॉडल ट्रेनिंग नहीं: सिंक की गई फ़ाइलों का इस्तेमाल कभी भी AI मॉडल को ट्रेन करने के लिए नहीं किया जाता

  • स्वचालित सिंक्रनाइज़ेशन: Google Drive में की गई फ़ाइल परिवर्तन/हटाने की क्रियाएँ स्वचालित रूप से Perplexity में प्रतिबिंबित होती हैं।

उपयोग का मामला: अक्सर ऐक्सेस किए जाने वाले डॉक्यूमेंट, प्रोजेक्ट-विशिष्ट फ़ाइल कलेक्शन या क्यूरेटेड कॉन्टेंट वाले सहयोगी Spaces के लिए अधिकतम उत्तर सटीकता की आवश्यकता वाली टीमें।

बैकएंड आर्किटेक्चर & डेटा फ़्लो

कनेक्शन & प्रमाणीकरण

  • व्यवस्थापक द्वारा सक्षम करना: संगठन के व्यवस्थापक अनुमतियाँ सेटिंग्स में Google Drive कनेक्टर सक्षम करते हैं

  • उपयोगकर्ता प्रमाणीकरण: उपयोगकर्ता Google के ज़रिए OAuth 2.0 के माध्यम से प्रमाणीकरण करते हैं

  • ड्राइव चयन: उपयोगकर्ता कनेक्ट करने के लिए अपना Google Drive चुनते हैं

  • व्यवस्थापक सहमति: Google Workspace व्यवस्थापकों को Google Admin Console में Perplexity ऐप के लिए संगठन-व्यापी सहमति देनी पड़ सकती है

जब दोनों तरीके सक्रिय हों:

  • Perplexity स्थानीय इंडेक्स और Google Drive API, दोनों को एक साथ क्वेरी करता है

  • सबसे प्रासंगिक स्रोतों को प्राथमिकता देने के लिए परिणामों को फिर से रैंक किया जाता है

  • उद्धरण सीधे Google Drive पर लिंक होते हैं, जहाँ पूर्ण फ़ाइल एक्सेस उपलब्ध है।

इंडेक्सिंग प्रक्रिया (उच्च-सटीकता खोज)

फ़ाइल सिंक और स्टोरेज:

  1. फ़ाइल चयन: उपयोगकर्ता Perplexity UI के माध्यम से फ़ाइलें/फ़ोल्डर चुनता है

  2. डाउनलोड: Google Drive API के माध्यम से Google Drive से फ़ाइलें डाउनलोड की जाती हैं

  3. स्टोरेज: रॉ फ़ाइलें AWS S3 में समर्पित संगठनात्मक नेमस्पेस के साथ स्टोर की जाती हैं

  4. पार्सिंग: समर्थित फ़ॉर्मेट (PDF, DOCX, XLSX, PPTX, CSV, TXT, MD, JSON) से टेक्स्ट निकालना

  5. वेक्टराइज़ेशन: कॉन्टेंट को एम्बेडिंग में बदलकर Vespa वेक्टर डेटाबेस में स्टोर किया जाता है

  6. मेटाडेटा इंडेक्सिंग: खोज पुनर्प्राप्ति के लिए फ़ाइल मेटाडेटा (नाम, पाथ, अनुमतियाँ) इंडेक्स किया जाता है

  7. हटाना: जब कोई उपयोगकर्ता Perplexity से Google Drive को डिस्कनेक्ट करता है, तो वह किसी भी इंडेक्स की गई फ़ाइल को हटाने का विकल्प चुन सकता है।

सुरक्षा & अनुपालन इंफ़्रास्ट्रक्चर

अनुमति का प्रवर्तन

Google Drive-साइड अनुमतियाँ:

  • यदि कोई उपयोगकर्ता Google Drive में किसी फ़ाइल तक पहुँच खो देता है, तो वह फ़ाइल तुरंत Perplexity से हटा दी जाती है।

  • Google Drive में फ़ाइलें हटाए जाने पर Perplexity इंडेक्स से तुरंत हटा दी जाती हैं।

  • उपयोगकर्ता केवल उन फ़ाइलों को खोज सकते हैं, जिनके लिए उनके पास Google Drive की स्पष्ट अनुमति है।

Perplexity-साइड अनुमतियाँ:

  • एडमिनिस्ट्रेटर यह नियंत्रित करते हैं कि कौन-से यूज़र संगठन सेटिंग के ज़रिए कनेक्टर्स को ऐक्सेस कर सकते हैं

  • स्पेस में सिंक की गई फ़ाइलें स्पेस के सदस्य खोज सकते हैं, लेकिन फ़ाइलों तक पहुँचने के लिए उचित Google Drive अनुमतियाँ आवश्यक हैं।

  • Thread शेयरिंग संगठन के व्यवस्थापकों द्वारा निर्धारित संगठनात्मक शेयरिंग नीतियों का सम्मान करती है।

सर्वोत्तम प्रथाएँ

उच्च-सटीकता खोज (इंडेक्सिंग) का उपयोग कब करें

  • Spaces में प्रोजेक्ट-विशिष्ट फ़ाइल संग्रह

  • अक्सर ऐक्सेस किए जाने वाले नॉलेज बेस डॉक्यूमेंट

  • गहरे अर्थ विश्लेषण की ज़रूरत वाली फ़ाइलें

  • क्यूरेटेड कॉन्टेंट के साथ सहयोगी टीम के माहौल

स्टैंडर्ड सर्च (सिर्फ़ API) का इस्तेमाल कब करें

  • बड़े-बड़े फ़ाइल रिपॉज़िटरी (लाखों फ़ाइलें) में खोज करना

  • सख्त डेटा रेज़िडेंसी और न्यूनतम डेटा कॉपी करने की आवश्यकताएँ

  • कभी-कभी ऐक्सेस की जाने वाली फ़ाइलों में एक्सप्लोरेटरी सर्च

  • ऐसे संगठन, जहाँ सुरक्षा/अनुपालन से जुड़ी पाबंदियाँ ज़्यादा होती हैं