Perplexity का SharePoint कनेक्टर और OneDrive कनेक्टर Enterprise Pro और Enterprise Max के यूज़र को AI की मदद से नेचुरल लैंग्वेज क्वेरी के ज़रिए सीधे अपने संगठन की SharePoint साइटों और OneDrive फ़ाइलों को खोजने की सुविधा देता है।
हमने हाल ही में एक हाइब्रिड सर्च आर्किटेक्चर पेश किया है, जो दो अलग-अलग सर्च मोड के ज़रिए डेटा सुरक्षा से जुड़ी चिंताओं और स्केलेबिलिटी की सीमाओं को दूर करता है: हाई-प्रिसिज़न सर्च (इंडेक्सिंग-आधारित) और स्टैंडर्ड सर्च (API-आधारित)।
सर्च आर्किटेक्चर: दो-स्तरीय दृष्टिकोण
स्टैंडर्ड सर्च (API-आधारित)
यह कैसे काम करता है:
क्वेरी के समय Microsoft की सर्च API के ज़रिए सीधे SharePoint/OneDrive को क्वेरी करता है
क्वेरी से मिले नतीजों के अलावा, Perplexity के ढाँचे में कोई फ़ाइल कॉपी स्टोर नहीं की जाती (इसे डेटा रिटेंशन पॉलिसी सेटिंग से कम किया जा सकता है)
फ़ाइल संख्या की सीमा के बिना उपयोगकर्ता की पूरी SharePoint/OneDrive ड्राइव में खोज करता है
कनेक्टर ऐक्टिवेशन के तुरंत बाद सभी Enterprise Pro/Max यूज़र के लिए उपलब्ध
सुरक्षा मॉडल:
शून्य डेटा प्रतिधारण: क्वेरी से मिले परिणामों के अलावा, फ़ाइलों को Perplexity सिस्टम में कॉपी या स्टोर नहीं किया जाता है (डेटा प्रतिधारण नीति सेटिंग्स द्वारा कम किया जा सकता है)
रीयल-टाइम अनुमतियाँ: SharePoint/OneDrive के नेटिव ऐक्सेस कंट्रोल का गतिशील रूप से सम्मान करता है
न्यूनतम डेटा कॉपी करना: केवल उत्तरों में शामिल उद्धरण स्निपेट ही रखे जाते हैं
कोई मॉडल प्रशिक्षण नहीं: सिंक की गई फ़ाइलों का उपयोग कभी भी AI मॉडल को प्रशिक्षित करने के लिए नहीं किया जाता है
तत्काल पहुँच निरस्तीकरण: जब SharePoint/OneDrive अनुमतियाँ बदलती हैं, तो पहुँच तुरंत Perplexity में दिखाई देती है
उपयोग का मामला: जिन संगठनों को अधिकतम डेटा गोपनीयता और न्यूनतम डेटा फ़ुटप्रिंट की आवश्यकता होती है, खासकर एंटरप्राइज़ स्तर पर लाखों फ़ाइलों में खोज करने के लिए।
उच्च-सटीकता खोज (इंडेक्सिंग-आधारित)
यह कैसे काम करता है:
यूज़र Perplexity में लोकल इंडेक्सिंग के लिए सिंक करने के लिए खास फ़ाइलें/फ़ोल्डर चुनते हैं
फ़ाइलों को डाउनलोड किया जाता है, पार्स किया जाता है और Vespa में वेक्टर एम्बेडिंग के साथ समर्पित AWS S3 बकेट में स्टोर किया जाता है।
गहरे अर्थ विश्लेषण और ज़्यादा विस्तृत जवाबों की सुविधा देता है
फ़ाइल सीमाएँ: 500 फ़ाइलें प्रति स्पेस (Enterprise Pro), 5,000 फ़ाइलें प्रति स्पेस (Enterprise Max)
कुल यूज़र लिमिट: 15,000 फ़ाइलें (Enterprise Pro), 50,000 फ़ाइलें (Enterprise Max)
सुरक्षा मॉडल:
समर्पित स्टोरेज: हर संगठन की फ़ाइलें अलग-अलग AWS S3 "फ़ोल्डर" में स्टोर की जाती हैं, जिनके Vespa वेक्टर स्टोरेज में यूनीक नेमस्पेस होते हैं
एन्क्रिप्शन: AES-256 एन्क्रिप्शन एट रेस्ट, TLS एन्क्रिप्शन इन ट्रांज़िट
भूमिका-आधारित एक्सेस कंट्रोल (RBAC): सभी सिस्टम में न्यूनतम विशेषाधिकार वाला एक्सेस लागू किया जाता है
कोई मॉडल ट्रेनिंग नहीं: सिंक की गई फ़ाइलों का इस्तेमाल कभी भी AI मॉडल को ट्रेन करने के लिए नहीं किया जाता
ऑटोमैटिक सिंक: SharePoint/OneDrive में फ़ाइल में किए गए बदलाव/डिलीट किए जाने पर Perplexity में वे अपने आप दिखाई देते हैं
उपयोग का मामला: अक्सर ऐक्सेस किए जाने वाले डॉक्यूमेंट, प्रोजेक्ट-विशिष्ट फ़ाइल कलेक्शन या क्यूरेटेड कॉन्टेंट वाले सहयोगी Spaces के लिए अधिकतम उत्तर सटीकता की आवश्यकता वाली टीमें।
बैकएंड आर्किटेक्चर & डेटा फ़्लो
कनेक्शन & प्रमाणीकरण
एडमिन एनेबलमेंट: संगठन के एडमिन अनुमति सेटिंग में SharePoint/OneDrive कनेक्टर को सक्षम करते हैं
उपयोगकर्ता प्रमाणीकरण: उपयोगकर्ता Microsoft Entra (Azure AD) के माध्यम से OAuth 2.0 के ज़रिए प्रमाणित होते हैं
साइट चयन: उपयोगकर्ता कनेक्ट करने के लिए विशिष्ट SharePoint साइटों का चयन करते हैं
एडमिन की सहमति: Microsoft एडमिन को Microsoft Entra में Perplexity ऐप के लिए संगठन-व्यापी सहमति देनी पड़ सकती है
जब दोनों तरीके सक्रिय हों:
Perplexity लोकल इंडेक्स और SharePoint API, दोनों को एक साथ क्वेरी करता है
सबसे प्रासंगिक स्रोतों को प्राथमिकता देने के लिए परिणामों को फिर से रैंक किया जाता है
पूर्ण फ़ाइल एक्सेस के लिए साइटेशन सीधे SharePoint से लिंक होते हैं
इंडेक्सिंग प्रक्रिया (उच्च-सटीकता खोज)
फ़ाइल सिंक और स्टोरेज:
फ़ाइल चयन: उपयोगकर्ता Perplexity UI के माध्यम से फ़ाइलें/फ़ोल्डर चुनता है
डाउनलोड: फ़ाइलें Microsoft Graph API के ज़रिए SharePoint से डाउनलोड की जाती हैं
स्टोरेज: रॉ फ़ाइलें AWS S3 में समर्पित संगठनात्मक नेमस्पेस के साथ स्टोर की जाती हैं
पार्सिंग: समर्थित फ़ॉर्मेट (PDF, DOCX, XLSX, PPTX, CSV, TXT, MD, JSON) से टेक्स्ट निकालना
वेक्टराइज़ेशन: कॉन्टेंट को एम्बेडिंग में बदलकर Vespa वेक्टर डेटाबेस में स्टोर किया जाता है
मेटाडेटा इंडेक्सिंग: खोज पुनर्प्राप्ति के लिए फ़ाइल मेटाडेटा (नाम, पाथ, अनुमतियाँ) इंडेक्स किया जाता है
हटाना: जब कोई उपयोगकर्ता SharePoint/OneDrive को Perplexity से डिस्कनेक्ट करता है, तो वह किसी भी इंडेक्स की गई फ़ाइलों को हटाने का विकल्प चुन सकता है।
सुरक्षा & अनुपालन इंफ़्रास्ट्रक्चर
अनुमति का प्रवर्तन
SharePoint/OneDrive-साइड अनुमतियाँ:
अगर किसी यूज़र के पास SharePoint/OneDrive में किसी फ़ाइल का ऐक्सेस नहीं रहता, तो वह फ़ाइल तुरंत Perplexity से हटा दी जाती है
SharePoint/OneDrive में फ़ाइलें हटाने पर Perplexity इंडेक्स से उन्हें तुरंत हटा दिया जाता है
यूज़र सिर्फ़ उन फ़ाइलों को खोज सकते हैं, जिन्हें ऐक्सेस करने के लिए उनके पास स्पष्ट SharePoint/OneDrive अनुमतियाँ हैं
Perplexity-साइड अनुमतियाँ:
एडमिनिस्ट्रेटर यह नियंत्रित करते हैं कि कौन-से यूज़र संगठन सेटिंग के ज़रिए कनेक्टर्स को ऐक्सेस कर सकते हैं
स्पेस से सिंक की गई फ़ाइलें स्पेस के सदस्यों द्वारा खोजी जा सकती हैं, लेकिन फ़ाइल की सामग्री के लिए SharePoint/OneDrive की अनुमति की आवश्यकता होती है
Thread शेयरिंग, एडमिन द्वारा सेट की गई संगठनात्मक शेयरिंग नीतियों का सम्मान करती है
सर्वोत्तम प्रथाएँ
उच्च-सटीकता खोज (इंडेक्सिंग) का उपयोग कब करें
Spaces में प्रोजेक्ट-विशिष्ट फ़ाइल संग्रह
अक्सर ऐक्सेस किए जाने वाले नॉलेज बेस डॉक्यूमेंट
गहरे अर्थ विश्लेषण की ज़रूरत वाली फ़ाइलें
क्यूरेटेड कॉन्टेंट के साथ सहयोगी टीम के माहौल
स्टैंडर्ड सर्च (सिर्फ़ API) का इस्तेमाल कब करें
बड़े-बड़े फ़ाइल रिपॉज़िटरी (लाखों फ़ाइलें) में खोज करना
सख्त डेटा रेज़िडेंसी और न्यूनतम डेटा कॉपी करने की आवश्यकताएँ
कभी-कभी ऐक्सेस की जाने वाली फ़ाइलों में एक्सप्लोरेटरी सर्च
ऐसे संगठन, जहाँ सुरक्षा/अनुपालन से जुड़ी पाबंदियाँ ज़्यादा होती हैं
