Informe interno de auditoría de privacidad — HAL9000

Documento público (sin información sensible) para acreditar la privacidad integral del sistema.

Fecha de emisión: marzo de 2026.

1. Resumen ejecutivo

HAL9000 se ha diseñado para operar en un entorno privado del cliente, con procesamiento local de documentos jurídicos y control estricto de los datos. El flujo de adjuntos contempla cifrado en reposo, eliminación física tras el embedding y mecanismos de purga por identificador, evitando la retención innecesaria de información.

Conclusión: el sistema cumple con los principios de confidencialidad, minimización y control, garantizando que los datos permanezcan bajo custodia del cliente y con capacidad de supresión verificable.

2. Alcance y limitaciones

3. Arquitectura de privacidad (alto nivel)

Frontend

  • Interfaz web local que gestiona adjuntos y sesiones.
  • Los secretos y endpoints internos se mantienen fuera del navegador.
  • Historial visible controlado por el propio cliente en su entorno local.

Backend y servicios

  • Proxy de acceso controlado hacia servicios internos.
  • OCR, embeddings, búsqueda y transcripción dentro del entorno privado.
  • Persistencia controlada en bases locales (vectoriales y de archivos).

4. Ciclo de vida de los datos

Etapa Tratamiento Garantías de privacidad
Subida de adjuntos Los archivos se cargan en el entorno privado para extracción y embeddings. Sin exposición pública; control por autenticación interna.
Embedding / indexado El contenido se transforma en embeddings y se asocia a un identificador interno. Segmentación por sesión y trazabilidad para purga.
Eliminación física Tras confirmar el embedding, el archivo original se borra físicamente del servidor. Reduce la persistencia de datos a lo estrictamente necesario.
Retención controlada Los embeddings quedan bajo TTL y purga por identificador. Derecho al olvido mediante limpieza manual o automática.

5. Cifrado y almacenamiento

6. Modelos e inferencia local

HAL9000 utiliza modelos open‑source servidos en infraestructura local. Al ejecutarse íntegramente en el entorno del cliente, no existe canal de envío a terceros ni uso de datos para entrenamiento externo.

El uso de modelos locales garantiza que la información tratada no se utiliza para entrenamiento ni sale del entorno privado del cliente.

7. Transcripción de vídeo (Whisper)

La transcripción se realiza con un contenedor local. El audio/vídeo se usa exclusivamente durante el proceso y no se conserva tras finalizar la tarea.

El archivo multimedia original no se almacena de forma persistente en el sistema.

8. OCR local (PDF escaneados)

El servicio OCR procesa los PDFs en directorios temporales y elimina los archivos al terminar. No se mantiene una copia permanente de los documentos escaneados.

9. Política de logs y retención

10. Websearch y fuentes externas (opcional)

La búsqueda web es opcional. Cuando se activa, solo se envía la consulta textual al buscador, sin exponer documentos internos. Los resultados se descargan y procesan localmente.

En modo websearch se interactúa con fuentes públicas; el contenido interno del cliente no se comparte.

11. Evaluación de riesgos y mitigaciones

12. Conclusión

HAL9000 presenta un enfoque de privacidad integral: los datos se procesan dentro del entorno del cliente, el almacenamiento está cifrado, los archivos originales se eliminan tras el embedding y existen mecanismos claros de purga. Este informe acredita el compromiso con la confidencialidad jurídica y la minimización de retención de datos.