E-commerce con IA: recomendadores, búsqueda semántica y agentes de venta
Cómo integrar IA en un e-commerce sin disparar costos: recomendadores, búsqueda semántica con embeddings, agentes que asisten en la decisión de compra.
E-commerce con IA: recomendadores, búsqueda semántica y agentes de venta
La conversación sobre “IA en e-commerce” suele oscilar entre dos extremos: por un lado, las plataformas grandes prometiendo que agregar IA mágicamente sube la conversión; por el otro, escepticismo total de que sirva más allá de demos. La realidad útil está en el medio: hay tres usos de IA en e-commerce que funcionan medibles hoy, con tecnología accesible y costo razonable.
Este post los recorre sin hype.
Uso 1 — Sistemas de recomendación
Qué resuelve
“Productos que también te pueden interesar”, “los clientes que compraron X también compraron Y”, “productos similares al que estás viendo”. El objetivo: incrementar el ticket promedio y la profundidad de catálogo explorada por sesión.
Cómo funciona técnicamente
Wikipedia describe los sistemas de recomendación como “sistemas de filtrado de información que proveen sugerencias relevantes para un usuario” (fuente). Los enfoques principales:
Collaborative filtering
“Usuarios parecidos compran cosas parecidas”. Se construye una matriz usuario × producto con interacciones (compras, vistas, ratings). Se factoriza con técnicas como SVD, ALS o autoencoders y se predicen interacciones faltantes.
- Funciona bien con dataset grande de usuarios.
- Sufre con productos nuevos (cold start) y usuarios nuevos.
- Implementaciones de referencia:
implicit, Surprise, LightFM en Python.
Content-based
“Productos parecidos al que ya te gustó”. Cada producto se representa como vector de features (categoría, precio, atributos, descripción embebida). Se recomiendan los más cercanos al historial del usuario.
- Funciona desde el día uno (no requiere historia masiva).
- Limitado a la diversidad de los features.
Híbridos
Mezclan ambos. Es lo que usan Amazon, MercadoLibre, etc., en producción. Para una PYME que arranca, un híbrido simple ya supera ampliamente “no tener nada”.
Implementación pragmática para una PYME
Para una tienda con 1.000-50.000 productos:
- Vectorizar productos con embeddings de descripciones + categorías + atributos.
- Vector store: pgvector (PostgreSQL extension), Qdrant, Pinecone, Weaviate.
- Recomendaciones content-based al inicio: “productos similares a este”.
- Cuando hay suficiente histórico de compras (3-6 meses), agregar collaborative filtering.
- Híbrido: ranking final mezclando ambos enfoques.
Métricas que importan
- CTR sobre items recomendados.
- Conversión comparada (recomendados vs. no recomendados).
- Lift sobre ticket medio.
- Diversidad: que no recomiende siempre lo mismo.
Uso 2 — Búsqueda semántica con embeddings
Qué resuelve
Búsqueda tradicional (“LIKE %palabra%” o motores keyword) falla cuando el usuario:
- Busca con sinónimos no contemplados (“joggings” vs “pantalones de deporte”).
- Describe el producto en lenguaje natural (“zapatillas para correr en lluvia”).
- Pone errores de tipeo.
- Busca por intención (“regalo para mi sobrino de 8 años amante del fútbol”).
La búsqueda semántica entiende intención y similitud de significado, no solo coincidencia de strings.
Cómo funciona
Wikipedia define embeddings como “representaciones de palabras (o frases, productos) como vectores en un espacio multidimensional” donde las similitudes geométricas reflejan similitudes semánticas (fuente).
Modelos modernos (OpenAI text-embedding-3, Cohere, modelos open-source como gte-large, bge-large) producen vectores típicamente de 768 a 3072 dimensiones por texto. La documentación oficial de OpenAI sobre embeddings detalla casos de uso y patrones (fuente).
Pipeline típico:
- Indexación (offline): para cada producto, generar embedding de su descripción (título + categoría + atributos + descripción larga).
- Almacenamiento: vector store con índice ANN (HNSW, IVF).
- Búsqueda (online): generar embedding del query del usuario y buscar los K vectores más cercanos por cosine similarity.
- Re-ranking (opcional): tomar los top-100 candidatos y re-rankearlos con un modelo más caro o reglas de negocio.
- Híbrido con keyword search: combinar resultados de búsqueda semántica con BM25 tradicional para no perder coincidencias exactas (modelo, SKU).
Costo
- Indexar 10.000 productos con OpenAI ada-002: muy bajo (centavos de USD totales).
- Indexar con modelos más nuevos: dólares para catálogo medio.
- Costo recurrente: solo se re-indexa producto modificado, no todo el catálogo.
- Búsqueda online: cada query genera un embedding + lookup. Latencia típica < 200 ms end-to-end.
Para evitar costos por query, se puede generar embeddings con modelos open-source corriendo en infraestructura propia (GPU pequeña basta).
Métricas
- % queries con resultados relevantes (vs. cero resultados o resultados fuera de tema).
- CTR desde resultados de búsqueda.
- Tiempo a la compra desde búsqueda.
- Tasa de abandono post-búsqueda.
Uso 3 — Agentes de asistencia comercial
Qué resuelve
El visitante tiene preguntas que normalmente requerirían un vendedor humano: comparar productos, ayudar a decidir entre opciones, confirmar stock, calcular envío, sugerir según intención de uso.
Cómo funciona
Un agente conversacional con acceso a:
- Catálogo (vía API o RAG sobre productos).
- Stock en tiempo real.
- Historial del usuario (si está logueado).
- Políticas de la tienda (envíos, devoluciones, garantías).
Anthropic publica investigación práctica sobre construcción de agentes confiables (Anthropic Research) que aplica directamente: el agente recibe la pregunta, consulta las herramientas necesarias (catálogo, stock, políticas), razona y responde.
Arquitectura típica
[Usuario en chat]
|
[LLM con system prompt + tool definitions]
|
[Tools: search_products, get_stock, get_policy, calculate_shipping]
|
[Backend con APIs de catálogo, stock, etc.]
Caso de uso real
Cliente: “Necesito una zapatilla para correr 10 km dos veces por semana, no más de 80.000 pesos, prefiero negras.”
Agente:
- Llama a
search_productscon query “zapatilla running, hasta 80000 pesos, color negro”.- Recibe 12 resultados.
- Selecciona los 3 más relevantes en función de las palabras “10 km” (pista vs. trail), nivel intermedio.
- Verifica stock en talles disponibles.
- Responde con 3 opciones, breve comparativa, link a cada producto.
Esto en e-commerce reemplaza “WhatsApp con un vendedor que tarda 4 horas en responder” por respuesta inmediata.
Limitaciones honestas
- El agente no debe inventar productos que no están en catálogo. Guardrails en el prompt y validación de output.
- Para preguntas complejas (diseño, comparativas técnicas profundas) la respuesta puede ser superficial y conviene escalar a humano.
- La conversión real depende de que el catálogo esté bien estructurado: si los datos son malos, el agente recomienda mal.
Implementación: por dónde empezar
Para una PYME con e-commerce existente:
Paso 1 — Búsqueda semántica
Es el de menor riesgo y mayor ROI inmediato. Reemplaza la búsqueda interna del sitio. No requiere conversación: usuario ya está acostumbrado a buscar; lo único que mejora es la calidad de los resultados.
Esfuerzo típico: 2-4 semanas para implementación inicial + integración.
Paso 2 — Recomendadores básicos (content-based)
Una vez vectorizado el catálogo (Paso 1 ya lo hizo), agregar “productos similares” en página de detalle es trivial. Mismo embedding, mismo índice, query distinto.
Paso 3 — Agente de asistencia
Solo cuando los pasos 1 y 2 funcionan bien. El agente se beneficia de tener búsqueda y catálogo correctamente estructurado.
Esfuerzo: 4-8 semanas para versión inicial sólida con guardrails.
Errores comunes
”Embeddings nos resuelven todo”
Embeddings ayudan, pero los catálogos con descripciones malas o títulos solo SKU producen resultados malos. La calidad de la indexación depende de la calidad del texto que se vectoriza. A veces el mayor ROI no es comprar IA: es escribir descripciones decentes.
”Sin métricas previas, dale, después medimos”
Sin baseline, es imposible saber si el sistema con IA mejoró algo. Antes de implementar, capturar métricas actuales: CTR de búsqueda, conversión, ticket promedio. Después comparar.
”El agente puede hacer todo”
Algunas operaciones (modificar pedidos, hacer descuentos) requieren políticas claras. Definir el espacio de acciones permitido y donde escalar a humano. No darle al LLM permisos que no entendés.
”Lo dejamos andando y listo”
Modelos drift, catálogo cambia, queries de usuarios evolucionan. Sin monitoreo continuo, en 3-6 meses la calidad se degrada. Reservar tiempo de mantenimiento como parte del costo total.
Conclusión
IA en e-commerce funciona cuando se aplica a casos concretos (búsqueda semántica, recomendadores, asistencia conversacional) sobre catálogos bien estructurados. Los costos son razonables incluso para PYMEs y la implementación se puede hacer escalonada. Lo que separa los proyectos exitosos es el orden: empezar por mejorar la búsqueda, agregar recomendadores cuando hay tracción, y solo después construir agentes conversacionales que dependen de las dos capas anteriores. Saltar al agente sin la base es construir el techo antes que el cimiento.
Fuentes y referencias
- OpenAI — Embeddings Guide
- Wikipedia — Recommender system
- Wikipedia — Word embedding
- Anthropic Research