SERA se mantiene consistente porque el enrutamiento es determinista. En lugar de que un LLM decida herramientas y prompts paso a paso, SERA incrusta la consulta y la compara con dos índices: uno para herramientas y otro para plantillas de prompts. Aprende cómo este diseño hace que los sistemas de razonamiento de código abierto sean predecibles, comprobables y escalables 🧵
Sentient
Sentient12 dic 2025
Anunciando SERA-Crypto (Semántic Embedding & Reasoning Agent): nuestra nueva arquitectura de razonamiento creada para la investigación cripto SOTA. #1 agente de código abierto en DMind #1 en nuestro benchmark cripto en directo Supera a GPT-5, Grok 4, Gemini 2.5 Pro y Perplexity Finance... Todo por debajo de 45 segundos.
2/ Enrutamiento repetible a gran escala La mayoría de las pilas de agentes pueden derivar entre secuencias porque la selección de herramientas depende del razonamiento intermedio del modelo. Esto es aún peor en las carreras de largo plazo. Con SERA, preguntas similares activan de forma fiable el mismo conjunto de herramientas y la misma plantilla, por lo que el comportamiento se mantiene consistente mientras escalas herramientas, categorías y tráfico.
3/ En SERA las llamadas paralelas a herramientas son las predeterminadas Una vez elegida la ruta, SERA lanza múltiples llamadas a herramientas en paralelo y luego ejecuta un único pase de síntesis sobre los datos devueltos. Esto te da una cobertura amplia con menos bucles, menor latencia y menos modos de fallo—exactamente lo que buscas cuando intentas mejorar el rendimiento del razonamiento de código abierto.
4/ SERA ofrece un camino más limpio hacia la fiabilidad en producción Como el enrutamiento se gestiona por separado del razonamiento, puedes ampliar la superficie de la herramienta, refinar plantillas y mantener la latencia bajo control sin cambiar el flujo de trabajo general. El sistema entonces se vuelve más fácil de depurar, más barato de ejecutar y más fácil de portar. Esta arquitectura permite a SERA competir con pilas cerradas pesadas sin perder el tiempo de código abierto.
2.13K