Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Estás en una entrevista para Ingeniero de ML en Stripe.
El entrevistador pregunta:
"Las personas a menudo disputan transacciones que realmente realizaron.
¿Cómo construirías un modelo que prediga estas disputas falsas sin datos etiquetados?"
Tú: "Marcaré las tarjetas con altas tasas de disputa."
Entrevista terminada.
Esto es lo que te perdiste:
Hay una técnica llamada Aprendizaje Activo que te permite construir modelos supervisados sin datos etiquetados. Es más barato y rápido que la anotación manual.
La idea es simple: obtener retroalimentación humana sobre ejemplos donde el modelo tiene más dificultades.
Así es como funciona:
↳ Comienza pequeño: Etiqueta manualmente el 1-2% de tus datos. Construye tu primer modelo con este pequeño conjunto de datos. No será bueno, pero ese es el punto.
↳ Genera predicciones: Ejecuta el modelo en datos no etiquetados y captura las puntuaciones de confianza. Los modelos probabilísticos funcionan bien aquí: observa la diferencia entre las dos clases predichas más altas.
↳ Etiqueta estratégicamente: Clasifica las predicciones por confianza. Haz que los humanos etiqueten solo los ejemplos de menor confianza. No tiene sentido etiquetar lo que el modelo ya conoce.
↳ Repite y mejora: Alimenta los datos etiquetados de nuevo al modelo. Entrena de nuevo. El modelo se vuelve más inteligente sobre lo que no sabe.
Detente cuando el rendimiento cumpla con tus requisitos.
...

Parte superior
Clasificación
Favoritos

