Моделі стають дуже якісними на Patio11-As-A-Service. (Я досить часто отримую електронні листи, які або просять заступництво на кшталт омбудсмена, або поради щодо взаємодії з фінансовою індустрією як споживач. Іноді, щоб перевірити SOTA, я подаю факти в них моделям.)
Репрезентативний приклад: Користувач: Чи (п'ять абзаців пояснення) ймовірно закриє мій акаунт? Я, для себе: Дуже малоймовірно, є чотири основні причини. Я, щоб показати: Що б я відповів цьому користувачу і (окремо) прокоментував реальну правду.
Модель: Ось 75% узгодження з тим, як ви описали це в листі, який я ще не бачив, і 95% узгодження на Ground Truth.
Деякі моделі, ймовірно, краще підходять саме для мене для виконання цього запиту, ніж з коробки, бо окрім мого інтернет-корпусу та інших навчальних даних, вони також мають приватну пам'ять, наприклад, багато подібних листів і сесій чернетки BAM.
Але мене заспокоює, що навіть без пам'яті, у моїх неформальних експериментах і, як мені повідомляли десятки людей на цей момент, є так: «Вони досить ефективні з коробки».
(Це не прохання надсилати мені питання, як у омбудсмена, але враховуючи, що світ продовжує це робити незалежно від моєї роботи чи поглядів на це питання, і я й надалі хочу, щоб люди мали справедливі результати у своїх зустрічах із фінансовою індустрією, я продовжуватиму піклуватися.)
(Я витрачаю значну частину своїх двадцятих, безкоштовно пишучи листи до банків від імені людей, і хоча в моїх сорокових роках життя та професійні обов'язки роблять це здебільшого нереальним, я дуже радий, що зараз існує майже безмежно масштабована технологія, яка може це зробити.)
Вільний коментар: є люди, які мають більш-менш повну зайнятість у різних регуляторах, виконуючи подібну роботу, ймовірно, з більш розчаровуючими листами у їхніх колективних поштових скриньках (через різницю в рівнях навичок тощо у загальній публікі).
Більша частина цієї роботи — це ходіння по телефонному дереву (або паперовому еквіваленті) у регульованій фінансовій установі, щоб змусити їх приділяти більше уваги проблемам клієнтів, які вже траплялися досі. Можна *уявити* регулятора, який вирішує, що, можливо, це варто покращити LLM.
Існує безліч причин, чому ніхто не вмикає це одразу у 2025 році, але я не думаю, що ці причини залишаться безкінечними.
@michael_nielsen Реміснича версія була такою: «Ім'я може бути, скажімо, виразною як ілюстрація, вказівкою в ідеяпросторі.» Версія LLM: «Ні, справді, це дуже корисно, дивіться ваги.»
@michael_nielsen Окрім людей, я думаю, що є й магічні закляття для цього. Бачити Like a State означає щось для багатьох людей у сфері технологій, навіть якщо вони ніколи не читали про німецьке лісове господарство, і LLM також може скористатися цим порадою.
@michael_nielsen Який чудовий час для життя, коли нагорода за важкий робочий день — це промовити нове закляття у всесвіт. І все частіше не в яскравому ілюстраційному сенсі, а «Ні, людство загалом і, можливо, назавжди, може просто клонувати цей випис.»
13,31K