SERAはルーティングが決定論的であるため一貫性を保ちます。 LLMがツールやプロンプトを段階的に決定する代わりに、SERAはクエリを埋め込み、ツール用とプロンプトテンプレート用という2つのインデックスと照合します。 この設計がどのようにしてオープンソース推論システムを予測可能でテスト可能かつスケーラブル🧵にするのかを学びましょう
Sentient
Sentient2025年12月12日
SERA-Crypto(セマンティック・エンベディング&推論エージェント):SOTA暗号研究のために構築された新しい推論アーキテクチャを発表します。 #1 DMindのオープンソースエージェント ライブ暗号ベンチマークの#1 GPT-5、Grok 4、Gemini 2.5 Pro、Perplexity Financeを上回るパフォーマンスを発揮します...すべて45秒以内に。
2/ 大規模での再現可能なルーティング ほとんどのエージェントスタックは、ツール選択がモデルの中間的な推論に依存するため、ラン間でドリフトできます。これは長期的なランではさらにひどいです。 SERAでは、同様の質問が同じツールセットとテンプレートを確実に引き起こすため、ツールやカテゴリ、トラフィックをスケールアップしても動作は一貫しています。
3/ SERAでは並列ツール呼び出しがデフォルトです ルートが選択されると、SERAは複数のツールコールを並列に実行し、返還されたデータに対して単一の合成パスを実行します。 これにより、ループが少なく、遅延が低く、故障モードも少なく、オープンソースの推論性能を追求する際にまさに望むものとなります。
4/ SERAは生産の信頼性へのよりクリーンな道を提供します ルーティングは推論とは別に扱われるため、ツールサーフェスを拡張し、テンプレートを洗練させ、遅延をコントロールしながら全体のワークフローを変えずに済みます。 これにより、システムのデバッグが容易になり、運用コストも安く、移植も容易になります。このアーキテクチャにより、SERAはオープンソースでありながら強力なクローズドスタックと競合できます。
2.07K