Meta-Sistema v2 — Demo Comparativa

Elegí un escenario

Cada uno está diseñado para mostrar cómo y cuándo el meta-sistema mejora sobre el LLM directo.

Pregunta / Tarea

Listo

Seleccioná un escenario y presioná "Ejecutar comparación".

Listo

Seleccioná un escenario y presioná "Ejecutar comparación".

Para entender la comparación, este es el pipeline del meta-sistema. El LLM directo es solo la caja "M4".

Antes de llamar al LLM, busca en la KB tareas anteriores correctas y similares. Las inyecta como ejemplos few-shot.

Detecta el tipo de tarea (código, math, MCQ, doc) y elige automáticamente qué módulos activar.

Llama al LLM 5 veces con temperaturas distintas y vota por mayoría. Reduce alucinaciones drásticamente.

Le pide al LLM revisar su propia respuesta una vez. Atrapa errores aritméticos y de razonamiento.

Aplica políticas (pre y post) configurables por API key. Ej: bloquear consejos médicos, exigir disclaimers.

Cada respuesta correcta marcada vía /feedback queda en la KB con embedding. M2 la recupera después.

Para tareas de código: genera, ejecuta, valida contra ejemplos, corrige si falla. Hasta 5 iteraciones.

Sube PDFs/imágenes y referenciá los file_ids en /solve. Gemini multimodal lee el contenido como contexto.