Los modelos están mejorando mucho en Patio11-As-A-Service. (Recibo correos electrónicos con bastante frecuencia que solicitan una intervención similar a la de un defensor del pueblo o consejos sobre cómo interactuar con la industria financiera como consumidor. A veces, para comprobar el SOTA, les introduzco datos a los modelos.)
Ejemplo representativo: Usuario: ¿Es probable que (cinco párrafos de explicación) cierren mi cuenta? Yo, para mí mismo: Muy poco probable, cuatro razones principales por las cuales. Yo, para el modelo: ¿Qué le respondería a este usuario y (por separado) comentar sobre la verdad real?
Modelo: Aquí hay un 75% de alineación sobre cómo realmente lo describiste en un correo electrónico que aún no he visto y un 95% de alineación sobre la visión de la verdad objetiva.
Algunos de los modelos son probablemente mejores para mí específicamente al ejecutar esta consulta que lo que serían directamente, porque además de mi corpus de Internet y otros datos de entrenamiento, también tienen la memoria privada de, por ejemplo, muchos correos electrónicos similares y sesiones de redacción de BAM.
Pero me alegra saber que el estado del arte, incluso sin memoria, en mis experimentos casuales y según me han informado docenas de personas hasta este punto, es que "son bastante efectivos desde el principio."
(Esto no es una solicitud para que me envíen problemas similares a los de un defensor del pueblo, pero dado que el mundo sigue haciendo eso independientemente de mi empleo o mis opiniones sobre el asunto y yo sigo queriendo que las personas tengan resultados justos en sus encuentros con la industria financiera, seguiré preocupándome.)
(Pasé una gran parte de mis veintes escribiendo cartas a bancos en nombre de personas de forma gratuita y, aunque en mis cuarenta la vida y las obligaciones profesionales significan que eso no es mayormente viable, estoy muy feliz de que ahora exista una tecnología casi infinitamente escalable que puede hacer esto.)
Comentario ocioso: hay personas que tienen un trabajo más o menos a tiempo completo en varios reguladores haciendo un trabajo similar en carácter a este, probablemente con correos electrónicos más frustrantes en sus bandejas de entrada colectivas (debido a los diferentes niveles de habilidad, etc. en el público en general).
Gran parte de ese trabajo consiste en recorrer el árbol telefónico (o su equivalente en papel) en la institución financiera regulada para que presten más atención a las preocupaciones de los clientes que han surgido hasta la fecha. Uno podría *imaginar* a un regulador decidiendo, ya sabes, tal vez esto debería ser mejorado con LLM.
Hay todo tipo de razones por las que nadie está activando eso de inmediato en 2025, pero no creo que esas razones prevalezcan indefinidamente.
@michael_nielsen La versión artesanal fue "Un nombre puede ser, digamos, evocador como ilustración, un indicador en el espacio de ideas." La versión de LLM es "No, en serio, eso es súper útil, mira los pesos."
@michael_nielsen Además de las personas, creo que las obras también son potencialmente hechizos mágicos para esto. "Seeing Like a State" significa algo para muchas personas en tecnología, incluso si nunca han leído sobre la gestión forestal alemana, y un LLM puede seguir esa pista también.
@michael_nielsen Qué momento tan maravilloso para estar vivo, donde la recompensa por un día de trabajo duro es pronunciar un nuevo hechizo en el universo. Cada vez más, no en el sentido evocador e ilustrativo, sino "No, la humanidad en general y potencialmente para siempre puede simplemente clonar ese hechizo."
13,29K