“Chat con tus documentos” se ha convertido en un caso de uso estándar. Esta semana, el interés se centra en cómo hacerlo bien (no solo en que funcione).
Consultas típicas en tendencia
- Cómo elegir embeddings y tamaño de chunk
- Cómo evaluar RAG (métricas, golden set)
- Cómo reducir alucinaciones (citaciones, filtros)
- Cómo controlar costes (cache, top-k, reranking)
Checklist para pasar de demo a producción
- Datos: limpieza, deduplicación, permisos por usuario
- Indexado: chunking consistente + metadatos
- Recuperación: top-k razonable + reranking si hace falta
- Respuesta: exigir citas y “no inventar”
- Observabilidad: logs de queries, latencia y calidad
