DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

Sonnet 4.5 on julkaistu! Se on tähän mennessä linjatuin rajamalli; paljon edistystä verrattuna Sonnet 4:ään ja Opus 4.1:een!

Huomattavaa on, että Sonnet 4.5 sanoittaa eval-tietoisuutta paljon enemmän kuin aiemmat mallit. Mitätöikö se tuloksemme? Teimme auditoinnin mallin sisäisten tekijöiden perusteella ja vastaus on "luultavasti vähän, mutta enimmäkseen ei".

1. Kun tarkastelimme manuaalisesti transkriptioita, joita malli kutsuu väärennöksiksi, arvioimme ne melko selvästi väärennetyiksi, mikä ei antanut meille mitään syytä uskoa, että malli on yli-inhimillinen tietoisuudessa.

2. Ohjasimme erilaisia eval-tietoisuuteen liittyviä SAE-ominaisuuksia. Tämä voi vähentää mallin kohdistuspisteitä, mutta enimmäkseen tekemällä siitä hyödyllisemmän sen sijaan, että se tekisi siitä harhaanjohtavan. Kaikista kokeilemistamme ohjausvektoreista huolimatta Sonnet 4.5 oli silti kohdistetumpi kuin Sonnet 4

Siitä huolimatta evalinen tietoisuus on erittäin tärkeää pitää silmällä jatkossa!

Olemme saaneet suurta arvoa automaattisesta valvonnasta (pylväsdiagrammi ensimmäisessä viestissä), joka tarjoaa nopean palautesilmukan kohdistusten lieventämisestä. Tämä oli myös ensimmäinen kerta, kun auditoimme mallin sisäosiin perustuvaa tuotantomallia. Interp-tutkimuksen käytännön sovelluksia!

Olen todella ylpeä tiimistä, oli mahtavaa nähdä, miten tämä kaikki yhdistyi!

66,16K

Johtavat

Rankkaus

Suosikit