Los modelos están mejorando mucho en Patio11-As-A-Service. (Recibo correos electrónicos con bastante frecuencia que solicitan intervención tipo defensor del pueblo o consejos sobre cómo interactuar con la industria financiera como consumidor. A veces, para comprobar SOTA, les doy datos a las modelos.)
Ejemplo representativo: Usuario: ¿Es probable que (cinco párrafos de explicación) cierre mi cuenta? Yo, para mí mismo: Muy poco probable, hay cuatro razones principales. Yo, para modelar: ¿Qué respondería a este usuario y (por separado) comentaría sobre la verdad real.
Modelo: Aquí tienes un 75% de alineación respecto a cómo lo describiste en un correo que aún no he visto y un 95% de alineación en la vista de la verdad sobre el terreno.
Algunos de los modelos probablemente sean mejores para mí ejecutando esta consulta específicamente que de fábrica, porque además de mi corpus de Internet y otros datos de entrenamiento, también tienen la memoria privada, por ejemplo, de muchos correos similares y sesiones de boceto BAM.
Pero me anima que el estado del arte, incluso sin memoria, en mis experimentos casuales y según me han contado decenas de personas a estas alturas, sea que "son bastante efectivos desde el principio."
(Esto no es una petición para que me envíen temas tipo defensor del pueblo, pero dado que el mundo sigue haciéndolo independientemente de mi empleo o de mis opiniones sobre el asunto, y sigo queriendo que la gente tenga resultados justos en sus encuentros con la industria financiera, seguiré preocupándome.)
(Paso una gran parte de mis veinte años escribiendo cartas a bancos en nombre de personas gratis y, aunque en mis cuarenta años la vida y las obligaciones profesionales hacen que eso no sea viable, me alegra mucho que ahora exista una tecnología casi infinitamente escalable que pueda hacerlo.)
Comentario casual: hay personas que tienen un trabajo más o menos a tiempo completo en varios reguladores haciendo un trabajo similar a este, probablemente con más correos frustrantes en sus bandejas colectivas (debido a la diferencia de nivel de habilidad, etc. en el público general).
Gran parte de ese trabajo consiste en recorrer el árbol telefónico (o el equivalente en papel) en la institución financiera regulada para que presten más atención a las preocupaciones de los clientes que se han producido hasta la fecha. Uno podría *imaginar* a un regulador decidiendo que quizá esto debería mejorarse con LLM.
Hay todo tipo de razones por las que nadie va a activar eso inmediatamente en 2025, pero no creo que esas razones prevalezcan necesariamente indefinidamente.
@michael_nielsen La versión artesanal era: "Un nombre puede ser, digamos, evocadoramente como ilustración, un apuntador en el espacio de ideas." La versión del LLM es "No, en serio, eso es súper útil, mira los pesos."
@michael_nielsen Además de las personas, creo que las obras también pueden ser hechizos mágicos para esto. Ver como un Estado significa algo para mucha gente en tecnología, aunque nunca hayan leído sobre la gestión forestal alemana, y un LLM también puede seguir ese consejo.
@michael_nielsen Qué época tan maravillosa para vivir, donde la recompensa por un día duro de trabajo es lanzar un nuevo hechizo al universo. Cada vez más, no en el sentido evocador y ilustrativo, sino "No, la humanidad en general y potencialmente para siempre puede simplemente clonar ese letra."
13.3K