Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Finalmente entendí por qué los reclasificadores son tan poderosos una vez que comprendí la diferencia clave entre los codificadores bi y cruzados.
Además, encontré una manera de combinar sus poderes utilizando una arquitectura unificada.
Déjame explicarte:
RAG es 80% recuperación y 20% generación. Entonces, si RAG no funciona, lo más probable es que sea un problema de recuperación.
Esa es exactamente la razón por la que es tan importante acertar con la arquitectura de recuperación, y comienza con la comprensión de estos dos (en realidad tres) enfoques de codificación.
(consulte la imagen a continuación mientras lee)
1️⃣ Bicodificadores
Los bicodificadores (la columna vertebral de la búsqueda vectorial) procesan consultas y documentos por separado.
- Las incrustaciones de documentos se calculan previamente
- La consulta se incrusta en el momento de la búsqueda
Esto hace que los bicodificadores sean perfectos para la recuperación inicial:
- extremadamente rápido
- Funciona a escala
- pierde información contextual importante
2️⃣ Codificadores cruzados
Los codificadores cruzados adoptan un enfoque completamente diferente para la reclasificación.
Procesan la consulta y cada documento como una sola unidad.
- Combinar consulta con documento ([CLS] Consulta [SEP] Documento [SEP])
- Recorran el modelo juntos para una atención cruzada completa
Esto hace que los codificadores cruzados sean ideales para la segunda etapa:
- Captura relaciones semánticas para una mayor precisión
- pero mucho más lento y con muchos recursos para grandes colecciones
Ahora, ¿qué pasa si podemos combinar lo mejor de ambos mundos?
3️⃣ ColBERT
ColBERT reúne el poder de los codificadores cruzados y la escalabilidad de los bicodificadores.
- Codificar por separado consultas y documentos
- Crear una matriz de interacción con puntuaciones de similitud entre todos los pares de tokens de consulta y documento
- Obtener la puntuación máxima de cada token de consulta en los tokens de documento
- Suma las puntuaciones máximas para la puntuación final
_____
¡Eso es todo!
Si lo encontró perspicaz, vuelva a compartirlo con su red.
Encuéntrame → @akshay_pachaar ✔️
Para obtener más información y tutoriales sobre LLM, agentes de IA y aprendizaje automático.

46.67K
Populares
Ranking
Favoritas