Cómo el enriquecimiento de datos mejora la detección y prevención del fraude
by Florian Tanant
En SEON, nos enorgullecemos de nuestros procesos de enriquecimiento de datos. Pero el término puede resultar confuso para los propietarios de empresas, e incluso para algunos gestores de fraude. Analicemos qué significa enriquecer los datos y cómo puede proteger a tu empresa a largo plazo.
Enriquecimiento de datos manual y automatizado
El enriquecimiento de datos consiste en recopilar información adicional a partir de unos pocos datos. Una búsqueda en Google utilizando el nombre de alguien, por ejemplo, constituye un enriquecimiento de datos manual. Una solución automatizada agregará datos adicionales de forma automática a partir de varias fuentes, como las bases de datos de código abierto o las redes sociales.
Por qué es importante la recopilación de datos en la detección del fraude
En la detección del fraude, cuantos más datos tengas sobre tus usuarios, más informadas estarán tus decisiones a la hora de calcular el riesgo. El proceso de recopilación de información suele provenir del aumento de datos, ya que permite completar una imagen sin tener que pedir a los usuarios que presenten la información ellos mismos.
Combina la huella avanzada del dispositivo, el buscador de redes sociales en tiempo real,los puntajes de riesgo y los hallazgos de Machine Learning.
Pide una Demo
¿Qué tipo de herramientas de enriquecimiento de datos funcionan para luchar contra el fraude?
Obtener más datos siempre es bueno. Pero no todas las herramientas te ayudarán a obtener la información correcta. A continuación te presentamos un desglose de las herramientas de enriquecimiento de datos más utilizadas en la prevención del fraude.
Pero antes de entrar en profundidad, quizá quieras ver un ejemplo. Escribe tu dirección de correo electrónico o tu número de teléfono en el siguiente campo para ver cómo SEON enriquece los datos para detectar a los estafadores potenciales.
Enriquecimiento de datos de direcciones de correo electrónico
Lo más probable es que todos tus usuarios tengan que registrarse con una dirección de correo electrónico. Este sencillo campo de datos puede revelar mucho si se compara con bases de datos externas:
- ¿La dirección es gratuita o paga?
- ¿Es desechable?
- ¿Está registrado el dominio?
- ¿Ha estado involucrada en alguna filtración de datos?
- ¿Se ha utilizado para registrarse en redes sociales y plataformas (Facebook, Instagram, Spotify, etc.)?
La elaboración de perfiles de redes sociales y la verificación de dominios, por ejemplo, es una ciencia que SEON se enorgullece de ofrecer a través de nuestra API de análisis de riesgo del correo electrónico.
Enriquecimiento de los datos de la dirección IP
Al igual que las direcciones de correo electrónico, la dirección IP de tu usuario puede revelar mucho sobre quién es realmente.
- ¿Dónde se encuentra el usuario?
- ¿Se conecta a través de puertos abiertos y se comunica con otros servidores?
- ¿Utiliza proxies, VPNs o TOR?
- ¿Está la IP en alguna lista negra de spam?
- ¿IP del centro de datos o conexión residencial (perteneciente a un propietario)?
Enriquecimiento de datos de números BIN
Otro gran ejemplo de enriquecimiento de puntos de datos simples a través de fuentes de datos externas. Los números BIN (Bank Identification Numbers), también conocidos como IIN (Issuer Identification Numbers) pueden decirnos mucho sobre una tarjeta:
- ¿Qué banco emitió la tarjeta?
- ¿Qué tipo de tarjeta es?
- ¿Cuál es el número de teléfono del banco?
- ¿Cuál es el nivel de la tarjeta (solo cajero, Gold, Platinium, World Elite o Infinite, según el proveedor)?
Enriquecimiento de los datos del dispositivo
Esto es lo que, en SEON, llamamos Huella digital del dispositivo. Sencillamente, es la capacidad de decir mucho basándose en el dispositivo con el que el usuario se conecta a tu sitio:
- ¿Se ha conectado el usuario con el mismo dispositivo antes?
- ¿Está ejecutando una máquina virtual?
- ¿Qué tipo de navegador tiene instalado?
- ¿Es un móvil o una computadora de escritorio?
Las diferencias entre el enriquecimiento de datos de caja negra y de caja blanca
Por supuesto, todos los puntos anteriores son fáciles de falsificar o introducir con información robada. Por eso, el enriquecimiento de datos solo es realmente valioso en la prevención del fraude cuando se combina con una solución diseñada para entenderlo.
¿Cómo es posible? En dos palabras: machine learning. Ahora que hemos creado un conjunto de datos a gran escala, es el momento de alimentar un modelo de ML para analizar, informar y revelar ideas. En esta fase, las organizaciones pueden crear diferentes modelos en función de sus necesidades.
- Modelo de caja blanca: Un modelo de machine learning que proporciona reglas legibles a través de un algoritmo de árbol de decisiones. Cada regla aplicada crea una nueva rama en la que los nodos son parámetros claros.
- Modelo de caja negra: se basa en una clasificación compleja basada en probabilidades que elimina la transparencia en aras de las puntuaciones.
Sea cual sea el modelo, al alimentarlo a través de un sistema de ML, tu simple punto de datos se ha enriquecido, transformado y convertido en un arma poderosa en tu lucha contra los usuarios fraudulentos.
Conclusión
El enriquecimiento de datos no es solo una opción para la prevención del fraude: es uno de los procesos más cruciales que te permite obtener una imagen clara de quiénes son tus usuarios, ya sea en el sector de los viajes o en una plataforma de juegos de azar en línea.
Sin embargo, la recopilación de datos es solo una parte del proceso. No tiene sentido sin un análisis adecuado. Y la única manera de analizar estos datos para convertirlos en información es mediante herramientas de machine learning. Combinar el enriquecimiento de los datos con el machine learning es lo que mejora la toma de decisiones basada en el riesgo, maximiza los recursos para luchar contra el fraude y supera a los usuarios maliciosos cuyo objetivo es dañar tu negocio.
Preguntas frecuentes
La mayoría de los programas de prevención de fraude incluyen funciones de enriquecimiento de datos como parte de su precio. Sin embargo, es posible que algunos proveedores dividan las herramientas en diferentes módulos en los que solo se paga por el análisis de la IP, el análisis de la dirección de correo electrónico o el análisis del teléfono. Normalmente se paga por cada llamada a la API.
El enriquecimiento de datos es útil en la prevención de fraude, la ciberseguridad, pero también en el marketing y el comercio minorista online. Ayuda a conocer mejor a los usuarios a partir del menor número posible de datos.
Quizás también te interese leer sobre:
- SEON: El mejor software de detección del fraude
- SEON: ¿Qué es el enriquecimiento de datos y por qué es tan importante?
- SEON: Los 7 mejores sistemas de gestión del fraude
Más información sobre:
Huella Digital en Internet | Prevención de fraudes | Monitoreo y detección de fraudes | Detección de fraude con machine learning
Fuentes utilizadas para este artículo
- Techcrunch: APIs are the next big SaaS wave
- University of Cambridge: Explainable Machine Learning for Fraud Detection
Articles
Showing all with `` tag
Fraudes con criptomonedas: Cómo proteger tu plataforma de intercambio
Verificación KYC: Cómo realizarla de forma segura y eficiente
Conoce el fraude de inteligencia artificial y cómo detectarlo
Subscribe to our newsletter
Get anti-fraud and compliance insights and tips from SEONs experts.
Florian Tanant
Florian Tanant es el Escritor de Contenido Senior de SEON. Con más de 10 años de experiencia escribiendo para líderes fintech y de ciberseguridad, su especialidad es desglosar conceptos técnicos para acercarlos a una audiencia amplia. Tiene dos hijos, así que esa es la excusa para las manchas de mantequilla de maní en su teclado.