Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Sonnet 4.5 on julkaistu!
Se on tähän mennessä linjatuin rajamalli; paljon edistystä verrattuna Sonnet 4:ään ja Opus 4.1:een!

Huomattavaa on, että Sonnet 4.5 sanoittaa eval-tietoisuutta paljon enemmän kuin aiemmat mallit. Mitätöikö se tuloksemme?
Teimme auditoinnin mallin sisäisten tekijöiden perusteella ja vastaus on "luultavasti vähän, mutta enimmäkseen ei".

1. Kun tarkastelimme manuaalisesti transkriptioita, joita malli kutsuu väärennöksiksi, arvioimme ne melko selvästi väärennetyiksi, mikä ei antanut meille mitään syytä uskoa, että malli on yli-inhimillinen tietoisuudessa.
2. Ohjasimme erilaisia eval-tietoisuuteen liittyviä SAE-ominaisuuksia. Tämä voi vähentää mallin kohdistuspisteitä, mutta enimmäkseen tekemällä siitä hyödyllisemmän sen sijaan, että se tekisi siitä harhaanjohtavan.
Kaikista kokeilemistamme ohjausvektoreista huolimatta Sonnet 4.5 oli silti kohdistetumpi kuin Sonnet 4
Siitä huolimatta evalinen tietoisuus on erittäin tärkeää pitää silmällä jatkossa!
Olemme saaneet suurta arvoa automaattisesta valvonnasta (pylväsdiagrammi ensimmäisessä viestissä), joka tarjoaa nopean palautesilmukan kohdistusten lieventämisestä.
Tämä oli myös ensimmäinen kerta, kun auditoimme mallin sisäosiin perustuvaa tuotantomallia. Interp-tutkimuksen käytännön sovelluksia!
Olen todella ylpeä tiimistä, oli mahtavaa nähdä, miten tämä kaikki yhdistyi!
66,16K
Johtavat
Rankkaus
Suosikit