Il connettore Google Drive di Perplexity consente agli utenti Enterprise Pro e Enterprise Max di cercare direttamente nei file Google Drive della propria organizzazione tramite query in linguaggio naturale basate sull'intelligenza artificiale.

Abbiamo recentemente introdotto un'architettura di ricerca ibrida che affronta sia i problemi di sicurezza dei dati che i limiti di scalabilità attraverso due modalità di ricerca distinte: Ricerca ad alta precisione (basata sull'indicizzazione) e Ricerca standard (basata su API).

Architettura di ricerca: approccio a due livelli

Ricerca standard (basata su API)

Come funziona:

Interroga Google Drive direttamente tramite l'API di ricerca di Google al momento della query
Nessuna copia dei file viene archiviata nell’infrastruttura di Perplexity, a parte i risultati delle query (può essere mitigato tramite le impostazioni dei criteri di conservazione dei dati)
Cerca nell'intero Google Drive dell'utente senza limiti al numero di file.
Disponibile per tutti gli utenti Enterprise Pro ed Enterprise Max subito dopo l’attivazione del connettore

Modello di sicurezza:

Zero Data Retention: I file non vengono copiati né archiviati nei sistemi di Perplexity, a parte i risultati delle query (può essere mitigato tramite le impostazioni dei criteri di conservazione dei dati)
Autorizzazioni in tempo reale: Rispetta dinamicamente i controlli di accesso nativi di Google Drive
Copia minima dei dati: Vengono conservati solo gli snippet delle citazioni inclusi nelle risposte
Nessun addestramento del modello: I file sincronizzati non vengono mai utilizzati per addestrare i modelli di IA
Revoca immediata dell'accesso: Quando le autorizzazioni di Google Drive cambiano, l'accesso viene immediatamente riflesso in Perplexity

Caso d’uso: Organizzazioni che richiedono la massima privacy dei dati e un ingombro minimo, in particolare per la ricerca su milioni di file su scala aziendale.

Ricerca ad alta precisione (basata sull’indicizzazione)

Come funziona:

Gli utenti selezionano file/cartelle specifici da sincronizzare per l'indicizzazione locale in Perplexity
I file vengono scaricati, analizzati e archiviati in bucket AWS S3 dedicati, con embedding vettoriali in Vespa
Consente un'analisi semantica più approfondita e risposte più complete
Limiti dei file: 500 file per Progetti (Enterprise Pro), 5.000 file per Progetti (Enterprise Max)
Limiti totali per l'utente: 15.000 file (Enterprise Pro), 50.000 file (Enterprise Max)

Modello di sicurezza:

Archiviazione dedicata: I file di ogni organizzazione sono archiviati in "cartelle" AWS S3 isolate con spazi dei nomi univoci nell'archiviazione vettoriale Vespa
Crittografia: Crittografia AES-256 a riposo, crittografia TLS in transito
Controllo degli accessi basato sui ruoli (RBAC): Accesso con privilegi minimi applicato su tutti i sistemi (Nota: Perplexity rispetta le autorizzazioni dei file di Google Drive)
Nessun addestramento del modello: I file sincronizzati non vengono mai utilizzati per addestrare i modelli di intelligenza artificiale
Sincronizzazione automatica: Le modifiche o le eliminazioni dei file in Google Drive si riflettono automaticamente in Perplexity.

Caso d’uso: Team che richiedono la massima accuratezza delle risposte per documenti consultati spesso, raccolte di file specifiche del progetto o Progetti collaborativi con contenuti curati.

Architettura back-end & Flusso di dati

Connessione & Autenticazione

Abilitazione amministratore: Gli amministratori dell'organizzazione abilitano il connettore Google Drive nelle impostazioni Autorizzazioni
Autenticazione utente: Gli utenti si autenticano tramite OAuth 2.0 con Google
Selezione di Drive: Gli utenti selezionano il proprio Google Drive da connettere
Consenso dell'amministratore: Gli amministratori di Google Workspace potrebbero dover concedere il consenso a livello di organizzazione per l'app Perplexity nella Google Admin Console

Quando entrambi i metodi sono attivi:

Perplexity interroga contemporaneamente l'indice locale e l'API di Google Drive.
I risultati vengono riclassificati per dare priorità alle fonti più pertinenti
Le citazioni rimandano direttamente a Google Drive per l’accesso completo ai file.

Processo di indicizzazione (ricerca ad alta precisione)

Sincronizzazione e archiviazione dei file:

Selezione file: L'utente seleziona file/cartelle tramite l'interfaccia utente di Perplexity
Download: File scaricati da Google Drive tramite l'API di Google Drive
Archiviazione: File grezzi archiviati in AWS S3 con spazi dei nomi organizzativi dedicati
Analisi: Estrazione del testo dai formati supportati (PDF, DOCX, XLSX, PPTX, CSV, TXT, MD, JSON)
Vettorializzazione: Contenuto convertito in embedding e archiviato nel database vettoriale Vespa
Indicizzazione dei metadati: Metadati dei file (nome, percorso, autorizzazioni) indicizzati per il recupero nei risultati di ricerca
Rimozione: Quando un utente disconnette Google Drive da Perplexity, può scegliere di rimuovere tutti i file indicizzati.

Infrastruttura di sicurezza e conformità

Applicazione delle autorizzazioni

Autorizzazioni lato Google Drive:

Se un utente perde l'accesso a un file in Google Drive, tale file viene immediatamente rimosso da Perplexity.
L'eliminazione di file in Google Drive comporta la rimozione immediata dall'indice di Perplexity.
Gli utenti possono cercare solo i file per i quali dispongono di autorizzazioni esplicite di Google Drive.

Autorizzazioni lato Perplexity:

Gli amministratori controllano quali utenti possono accedere ai connettori tramite le impostazioni dell'organizzazione
I file sincronizzati con gli Progetti sono ricercabili dai membri dello Progetti, ma l’accesso richiede le autorizzazioni Google Drive appropriate.
La condivisione dei thread rispetta le politiche di condivisione dell’organizzazione definite dagli amministratori.

Connettore Google Drive: sicurezza nell’upload dei file

Architettura di ricerca: approccio a due livelli

Ricerca standard (basata su API)

Come funziona:

Modello di sicurezza:

Ricerca ad alta precisione (basata sull’indicizzazione)

Come funziona:

Modello di sicurezza:

Architettura back-end & Flusso di dati

Connessione & Autenticazione

Quando entrambi i metodi sono attivi:

Processo di indicizzazione (ricerca ad alta precisione)

Sincronizzazione e archiviazione dei file:

Infrastruttura di sicurezza e conformità

Applicazione delle autorizzazioni

Autorizzazioni lato Google Drive:

Autorizzazioni lato Perplexity:

Buone pratiche

Quando utilizzare la ricerca ad alta precisione (indicizzazione)

Quando utilizzare la ricerca standard (solo API)