Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🔥 ByteDance právě vydal Doubao-Seed-1.8 (model agenta) — a zde je podrobné hodnocení od přispěvatele Zhihu toyama nao 👀
🔮 Stručně; DR: Otevření očí uprostřed chaosu.
Během roku 2025 zůstaly modely 1.5 a 1.6 týmu Seed pevně v nejvyšší čínské a globální druhé lize. Od verze 1.5 Seed zdvojnásobil úsilí o jednotné multimodální modelování, což je mezi domácími modely poměrně vzácné.
Nicméně Seed-1.6 byl silně kritizován: rozsáhlé RL zvyšovalo benchmarkové skóre, ale reálná generalizace zaostávala za Qwen3 a byla daleko od světových lídrů. Jak se GLM a MiniMax zaměřily na aplikace agentů, slabé agentní schopnosti Doubaa ho nechávaly v potížích.
Návrat Seed-1.8 do první úrovně však nebyl překvapením — tím překvapením je efektivita (obr. 1)! !️
Střední verze dosahuje stejné inteligence jako Seed-1.6 pomocí 5K tokenů místo 15K, za vstupní cenu ¥2, což ji činí velmi nákladově efektivní — cestou připomínající DeepSeek.
Vyšší třída škáluje s ohledem na větší rozpočty a výrazně se blíží špičkovým americkým modelům. S výrazným viděním a multimodálním porozuměním, plus generováním obrazů/videí jen o půl kroku za ním — je spravedlivé nazvat Seed "mini-Blíženci".
Kde se zlepšuje 🚀
1️⃣ Long-chain uvažování:
Seed-1.8 se zaměřuje na mnohem delší CoT, pečlivě ověřuje větve, aby dosáhl správných řešení.
Jeho síla spočívá spíše v trvalé pozornosti a důkladném pátrání než v hluboké lidské abstrakci. Gemini 3 Pro a GPT-5.2 stále dosahují vyšších skóre s ~60 % tokenů — což je známka silnější surové inteligence.
2️⃣ Extrakce informací:
Vysoká přesnost, ale neefektivní. Seed-1.8 má tendenci během CoT přeformulovat a anotovat celý zdrojový text. Jednoduchý úkol s extrakcí za 10 000 může stát 2× tokenů a přesnost výrazně klesá při nižších rozpočtech na uvažování. Bez zapnutého uvažování je extrakce téměř nepoužitelná. (Gemini 3 Pro zvládá stejnou úlohu v ~4K tokenech.)
3️⃣ Kódování:
Historicky slabé místo, ale zlepšuje se. Seed-1.8 dědí zisky z nedávného Code modelu a je použitelný pro 0→1 "vibe coding". Stále daleko od špičkových inženýrských modelů — zejména v systémovém myšlení.
Kde stále zaostává ⚠️
1️⃣ Koherence s více otáčkami:
Lepší než Seed-1.6, nyní "v podstatě použitelný", ale stále má problém konzistentně sledovat cíle při dlouhých rozhovorech. Po ~10+ tahech se rozum utápí.
2️⃣ Prostorová inteligence:
Omezený trénink se projevuje. Výkon na 2D/3D prostorovém uvažování se oproti verzi 1.6 sotva zlepšuje.
🧠 Závěrečný záběr
Jednotná multimodální strategie Gemini již vytvořila silný příkop. Většina čínských modelů je stále uvězněna v textově zaměřené konkurenci. Brzké rozhodnutí ByteDance usilovat o jednotnou multimodalitu bylo správné — ale historický dluh je těžký....

Top
Hodnocení
Oblíbené
