Fundamentos
Bases de datos vectoriales explicadas para directivos no técnicos

En una conversación con un comité de dirección, la base de datos vectorial es probablemente el componente que peor se entiende y el que más decisiones acaba condicionando. Vale la pena explicarla en términos de negocio antes de hablar de proveedores.
La diferencia con la base de datos de siempre
Una base de datos relacional encuentra registros por coincidencia exacta o por rangos. Una base de datos vectorial encuentra contenido parecido en significado, aunque no compartan ni una palabra. Si guardas la frase "el cliente quiere cancelar el contrato" y luego buscas "baja del servicio", el sistema te lo devuelve. No por trucos lingüísticos: porque ambas frases viven cerca en un espacio matemático que representa el sentido.
Esa propiedad cambia lo que puedes hacer con tu documentación. Por primera vez puedes preguntar a un repositorio en lenguaje natural sin que importe si usaste exactamente las mismas palabras que el redactor original.
Lo que exige a la organización
Aquí es donde aparecen las sorpresas. Una base de datos vectorial es relativamente fácil de levantar. Lo difícil es alimentarla bien y mantenerla viva. En los proyectos donde trabajamos, los puntos críticos son siempre los mismos.
- Quién decide qué documentos entran y cuáles no, porque indexarlo todo es la forma más rápida de envenenar el sistema.
- Cada cuánto se reindexa, porque un documento desactualizado sigue siendo recuperado como si fuera válido.
- Cómo se trazan los permisos, para que el sistema no muestre a un usuario información a la que no debería tener acceso.
Cómo elegir sin marearse
El mercado tiene muchas opciones y casi todas funcionan razonablemente bien. La elección rara vez se gana o se pierde por la base vectorial en sí. Se gana o se pierde por la calidad del contenido que metes, por cómo lo segmentas y por cómo encajas la búsqueda con el resto del sistema. Empezar con un proveedor maduro, gestionado, y centrar la energía en el contenido y los procesos suele ser más rentable que dedicar meses a comparar motores.
Lo que sí conviene preguntarse desde el principio es si esta base va a ser un anexo aislado o el corazón del conocimiento de la empresa. La respuesta determina cuánto invertir en ella.


