Tre porte tra il tuo prompt e il modello.
Ogni richiesta percorre un solo cammino: ispezionata, instradata secondo la tua policy di residenza, sigillata in un registro a prova di manomissione.
Ogni richiesta viene letta prima che un singolo token si muova.
Sluis esegue una scansione DLP deterministica sul prompt: 60 rilevatori integrati per PII, dati sanitari e segreti, incluso un pacchetto di identificativi nazionali UE che convalida tramite checksum il BSN, il PESEL, il codice fiscale e altri nove. Ogni corrispondenza viene classificata e la richiesta etichettata dentro l'UE, prima che qualsiasi cosa parta verso un provider.
I nomi sono i dati personali più difficili da cogliere per pattern, quindi il rilevamento dei nomi è fatto di quattro livelli che attivi tu: euristiche di contesto, correlazione delle email, una rubrica di nomi per tenant e il modello di riconoscimento multilingue di Sluis, che gira dentro il tuo deployment e non invia mai un nome a terzi.
Lavora con dati personali e segreti. Il modello non li vede mai.
Ecco il meccanismo: Sluis scansiona il prompt, sostituisce ogni valore PII e ogni segreto con un token stabile e inoltra al modello solo i token. In uscita ripristina i valori reali, anche in pieno streaming, token dopo token, così il provider non li vede mai. La mappa vive in memoria e non viene mai persistita.
Dichiara dove possono andare i dati. Sluis lo applica a ogni richiesta.
Mappa ogni classe di dati sulle regioni e i provider che può raggiungere, con una catena di riserva esplicita. Sluis valuta la policy a ogni chiamata: nessuna eccezione, nessuna uscita silenziosa.
Sovrano UE di default
Da subito, le richieste raggiungono solo provider di proprietà europea come Mistral e Scaleway, più cloud in regione UE. Anche i provider statunitensi e cinesi diretti sono disponibili, disattivati per impostazione predefinita: autorizzali nella policy e Sluis applica esattamente quella linea.
Proprietà, non solo regione
Sluis segnala ogni provider per giurisdizione e proprietà (owner_is_eu = false) per l'esposizione al CLOUD Act: una rotta statunitense o cinese diretta sarà sempre una scelta che vedi, mai presa al posto tuo.
Blocchi netti, non best-effort
Se nessun provider soddisfa la policy, la richiesta viene respinta alla porta e torna alla tua app con un codice motivo chiaro.
Un registro di cui l'auditor si fiderà, perché dimostra da sé la propria integrità.
L'hash di ogni voce è SHA-256 sull'hash precedente e sulla riga canonica. Altera un solo campo in qualsiasi punto della storia e ogni anello a valle si spezza. Esporta la catena come JSON Lines e chiunque può riverificarla offline.
Il diritto alla cancellazione (art. 17 GDPR) elimina contenuti delle richieste, cache e credenziali dei provider, e conserva la catena dei metadati, così verify-chain continua a passare anche dopo che i dati sono spariti.
Le chiamate agli strumenti passano le stesse tre porte.
Quando il tuo agente ricorre a uno strumento via MCP, quella chiamata segue lo stesso cammino di un prompt: ispezionata, instradata, sigillata. Altri gateway MCP registrano le chiamate agli strumenti; Sluis prova dove sono girate.
Ispeziona la chiamata allo strumento
La stessa passata DLP scansiona argomenti e risultati degli strumenti in cerca di PII, dati sanitari e segreti, prima che raggiungano un server MCP, con le stesse modalità mask, block o allow-log.
Instrada l'uscita dello strumento
Un server MCP è soggetto alla tua policy di residenza come qualsiasi provider: un'uscita di strumento fuori dalla tua policy viene bloccata alla porta. Uno strumento non può portare di nascosto i tuoi dati dove non hai mai autorizzato.
Sigillala nello stesso registro
La chiamata allo strumento e un hash dei suoi argomenti vengono concatenati nello stesso registro a prova di manomissione delle tue chiamate ai modelli: un solo record, un solo verify-chain, prompt e strumenti allo stesso modo.
L'unico gateway MCP in cui ogni invocazione di strumento passa Ispeziona → Instrada → Sigilla, così «è rimasto dentro la tua policy» copre i tuoi strumenti, non solo i tuoi prompt.
Costruito per non intralciare la richiesta.
La conformità non può costarti latenza. L'hot path è progettato perché i controlli girino senza mai bloccarsi su un database, un lock o un buffer.
Senza stato by design
Il piano dati non conserva stato per richiesta, quindi scali aggiungendo repliche. L'hot path non si blocca mai su Postgres: chiavi, policy e registro dei provider arrivano da una cache in-process.
Sigillato fuori dall'hot path
Le scritture di audit sono asincrone e a lotti. Un task in background accoda le righe concatenate per hash, così la risposta non aspetta mai il registro.
In streaming, mai bufferizzato
Le risposte SSE passano dritte attraverso un tee. I token raggiungono la tua app man mano che vengono generati, e il corpo non viene mai trattenuto per intero in memoria.
Una spesa che non va alla deriva
I budget vengono addebitati a ogni richiesta in denaro reale. Se perdi Redis, la spesa si riconcilia dal registro di audit durevole; se entrambi sono illeggibili, il controllo fallisce chiuso.
Misurato, non promesso
I controlli non costano quasi nulla, e non devi crederci sulla parola: l'harness di benchmark è misurato con la porta attiva.
Paga una sola volta la stessa risposta.
Attiva per tenant una cache a corrispondenza esatta e una cache semantica, entrambe isolate per tenant e cifrate AEAD at rest. Un guadagno di costi e latenza che non indebolisce mai la residenza: un hit resta comunque un tuo dato, nella tua regione.
Costruito per lo stack che hai già.
Compatibile OpenAI fino al byte. Tieni il tuo SDK, i tuoi prompt, i tuoi strumenti. Punta una base_url su Sluis e aggiungi un header di residenza quando vuoi vincolare una classe di traffico.
API compatibile OpenAI
/v1/chat/completions, /v1/embeddings, /v1/models: stesse forme di richiesta, stesso streaming. Niente da riscrivere.
Funziona con gli SDK che usi già
Client OpenAI ufficiali, LangChain, semplice curl. Nessuna nuova libreria da imparare, nessun protocollo proprietario.
Una base_url, una chiave
Cambia l'endpoint e conia una chiave virtuale nella console, ognuna con la propria allow-list di modelli, i propri rate limit e il proprio budget di spesa.
Osservabilità integrata
Metriche Prometheus e tracce OTLP, etichettate con jurisdiction, owner e decision, dritte nel tuo Grafana.
# Same API. One endpoint. You set the residency policy. # eu-sovereign is the safe default; allow more deliberately. $ curl https://api.sluis.ai/v1/chat/completions \ -H "Authorization: Bearer $SLUIS_KEY" \ -H "X-Sluis-Residency: eu-sovereign" \ -d '{ "model": "mistral/mistral-large", "messages": [...] }' # → mistral-large @ mistral-fr · in-region # → sealed · #4f9c2a · streamed
Guarda la chiusa al lavoro sul tuo traffico.
Il prezzo di listino del tuo provider più un 10% fisso. Niente postazioni, niente minimi, niente giochi di margine. I tuoi primi 250K di token sono gratis, e nessuna richiesta esce mai dalla tua policy di residenza.