La mayoría de los equipos no necesita un producto de IA. Necesita una o dos funciones de IA dentro del producto que ya tienen — y necesitan lanzarlas sin desestabilizar todo lo demás. Esa restricción cambia cómo se construye.
Empieza por un caso de uso estrecho y aburrido
La mejor primera función con LLM es aquella donde una respuesta incorrecta es barata y una correcta ahorra tiempo real: redactar una respuesta, resumir un hilo, clasificar un ticket entrante. Evita en la primera iteración cualquier cosa que escriba en la base de datos o mueva dinero.
Trata el modelo como una API de terceros poco fiable
A veces será lento, a veces se equivocará y a veces estará caído. Diséñalo así desde el día uno:
- Envuelve cada llamada con un timeout y una ruta de contingencia determinista.
- Valida la salida contra un esquema antes de que toque tu app — nunca confíes en texto libre.
- Registra cada prompt, respuesta y coste para poder depurar y ponerle precio después.
Lanza evaluaciones antes que funciones
Un pequeño conjunto de entradas de ejemplo con salidas esperadas convierte «parece mejor» en un número. Ejecútalas en cada cambio de prompt. Sin evaluaciones no estás haciendo ingeniería, estás adivinando — y regresarás en silencio.
Por dónde empezamos con los clientes
Solemos dedicar la primera semana a mapear un flujo de alto valor, conectar una única llamada al LLM protegida tras un feature flag, y montar el arnés de evaluación. Aburrido, medible, reversible — y luego expandimos. Si ese es el ritmo que necesitas, escríbenos.