Elegí un escenario
Cada uno está diseñado para mostrar cómo y cuándo el meta-sistema mejora sobre el LLM directo.
LLM directo vs Meta-Sistema sobre la misma pregunta. Mismo modelo, mismas keys. La única diferencia: el pipeline.
Cada uno está diseñado para mostrar cómo y cuándo el meta-sistema mejora sobre el LLM directo.
Para entender la comparación, este es el pipeline del meta-sistema. El LLM directo es solo la caja "M4".
Antes de llamar al LLM, busca en la KB tareas anteriores correctas y similares. Las inyecta como ejemplos few-shot.
Detecta el tipo de tarea (código, math, MCQ, doc) y elige automáticamente qué módulos activar.
Llama al LLM 5 veces con temperaturas distintas y vota por mayoría. Reduce alucinaciones drásticamente.
Le pide al LLM revisar su propia respuesta una vez. Atrapa errores aritméticos y de razonamiento.
Aplica políticas (pre y post) configurables por API key. Ej: bloquear consejos médicos, exigir disclaimers.
Cada respuesta correcta marcada vía /feedback queda en la KB con embedding. M2 la recupera después.
Para tareas de código: genera, ejecuta, valida contra ejemplos, corrige si falla. Hasta 5 iteraciones.
Sube PDFs/imágenes y referenciá los file_ids en /solve. Gemini multimodal lee el contenido como contexto.