Documentazione

Protezione dei dati

Le modalità di rilevamento, la libreria di 60 rilevatori, il rilevamento dei nomi, l'avviso al modello e la conservazione.

La protezione dei dati gira su ogni richiesta prima dell'inoltro. La modalità predefinita è tokenize: ogni valore rilevato viene sostituito con un token tipizzato stabile come «EMAIL_1». Solo i token raggiungono il provider, e la risposta viene ripristinata ai valori reali sulla via del ritorno verso di te, in streaming o no. La mappa dei token vive in memoria per la durata della richiesta e non viene mai conservata.

Altre modalità: mask riscrive i valori rilevati in modo irreversibile, block rifiuta la richiesta con 422, e allow_log la lascia passare segnalando la riga di audit.

60 rilevatori integrati sono inclusi da subito: 28 per i dati personali, incluso un pacchetto di documenti d'identità nazionali UE validati tramite checksum, e 32 per segreti e credenziali. Ciascuno è attivabile per organizzazione, e i termini personalizzati (testo semplice o regex) coprono qualsiasi cosa specifica della tua attività:

Dati personali · 28EmailPhone numberIBANCredit cardIPv4 addressIPv6 addressMAC addressUS Social Security numberDutch BSNPortuguese NIFGerman Steuer-IDPolish PESELBelgian rijksregisternummerFrench NIR (INSEE)Spanish DNI/NIEItalian codice fiscaleSwedish personnummerDanish CPR numberFinnish henkilötunnusUK National Insurance numberEU VAT numberBIC/SWIFT codeDutch license plateDutch addressPassport numberDate of birthGPS coordinatesVehicle identification number
Segreti e credenziali · 32API key (generic)AWS access keyAWS secret access keyPrivate key (PEM)GitHub tokenGitLab tokenSlack tokenSlack webhook URLDiscord webhook URLGoogle API keyGoogle OAuth refresh tokenStripe keyMollie API keyAnthropic API keyOpenAI API keySluis keyHugging Face tokennpm tokenSendGrid keyTwilio keyShopify tokenVault tokenDatabricks tokenDocker Hub tokenTelegram bot tokenJSON Web TokenCredentials in URL.env file dumpAzure storage key / SASPassword assignmentConfidentiality markerHigh-entropy token (generic)

Rilevazione dei nomi di persona

I nomi sono la classe di PII più difficile: nessun pattern li individua. Sluis aggiunge quattro livelli opzionali: euristiche di contesto (titoli onorifici, formule di saluto, firme), correlazione email (deriva i nomi dagli indirizzi nello stesso testo), una rubrica di nomi del tenant e NER, il modello di riconoscimento multilingue di Sluis che viene distribuito con l'installazione e gira al suo interno, così il testo non lascia mai il tuo perimetro per essere analizzato.

Avviso al modello

Quando la tokenizzazione ha riscritto una richiesta, Sluis inietta un messaggio di sistema iniziale che dice al modello che i token «…» sono segnaposto opachi da mantenere intatti; è questo a rendere affidabile il ripristino. Attivo per impostazione predefinita; personalizzalo o disattivalo per organizzazione.

Conservazione e fedeltà dell'audit

La conservazione dei contenuti (i body di richiesta e risposta per il log di audit) è attiva per impostazione predefinita e cifrata a riposo; la fedeltà dell'audit sceglie se il contenuto conservato memorizza i token o i valori originali. Disattiva la conservazione per un registro di soli metadati; questo disattiva anche le cache di risposta.