Protección de datos
Los modos de detección, la biblioteca de 60 detectores, la detección de nombres, el aviso al modelo y la retención.
La protección de datos se ejecuta en cada petición antes de despachar. El modo por defecto es tokenize: cada valor detectado se sustituye por un token tipado estable como «EMAIL_1». Solo los tokens llegan al proveedor, y la respuesta se restaura a los valores reales de vuelta hacia usted, en streaming o no. El mapa de tokens vive en memoria durante la vida de la petición y nunca se persiste.
Otros modos: mask reescribe los valores detectados de forma irreversible, block rechaza la petición con 422, y allow_log la deja pasar mientras marca la fila de auditoría.
60 detectores integrados vienen de serie: 28 para datos personales, incluido un paquete de identificadores nacionales de la UE validados por suma de control, y 32 para secretos y credenciales. Cada uno se puede activar o desactivar por organización, y los términos personalizados (texto plano o regex) cubren cualquier cosa específica de su negocio:
Detección de nombres de personas
Los nombres son la clase de PII más difícil: ningún patrón los detecta. Sluis añade cuatro capas opcionales: heurísticas de contexto (tratamientos, saludos, firmas), correlación de correo (deriva nombres de las direcciones en el mismo texto), un directorio de nombres del inquilino y NER, el propio modelo de reconocimiento multilingüe de Sluis que se incluye con el despliegue y se ejecuta dentro de él, de modo que el texto nunca sale de su perímetro para ser analizado.
Aviso al modelo
Cuando la tokenización reescribió una petición, Sluis inyecta un mensaje de sistema inicial que indica al modelo que los tokens «…» son marcadores opacos que debe mantener intactos; eso es lo que hace fiable la restauración. Activado por defecto; personalícelo o desactívelo por organización.
Retención y fidelidad de auditoría
La retención de contenido (los cuerpos de petición y respuesta para el registro de auditoría) está activada por defecto y cifrada en reposo; la fidelidad de auditoría decide si el contenido retenido guarda los tokens o los valores originales. Desactive la retención para un registro solo de metadatos; eso también desactiva las cachés de respuesta.