Cómo el enriquecimiento de datos mejora la detección y prevención del fraude

En SEON, nos enorgullecemos de nuestros procesos de enriquecimiento de datos. Pero el término puede resultar confuso para los propietarios de empresas, e incluso para algunos gestores de fraude. Analicemos qué significa enriquecer los datos y cómo puede proteger a tu empresa a largo plazo.

Enriquecimiento de datos manual y automatizado

El enriquecimiento de datos consiste en recopilar información adicional a partir de unos pocos datos. Una búsqueda en Google utilizando el nombre de alguien, por ejemplo, constituye un enriquecimiento de datos manual. Una solución automatizada agregará datos adicionales de forma automática a partir de varias fuentes, como las bases de datos de código abierto o las redes sociales.

Por qué es importante la recopilación de datos en la detección del fraude

En la detección del fraude, cuantos más datos tengas sobre tus usuarios, más informadas estarán tus decisiones a la hora de calcular el riesgo. El proceso de recopilación de información suele provenir del aumento de datos, ya que permite completar una imagen sin tener que pedir a los usuarios que presenten la información ellos mismos.

Enriquecimiento de datos para prevenir el fraude

Combina la huella avanzada del dispositivo, el buscador de redes sociales en tiempo real,los puntajes de riesgo y los hallazgos de Machine Learning.

Pide una Demo

¿Qué tipo de herramientas de enriquecimiento de datos funcionan para luchar contra el fraude?

Obtener más datos siempre es bueno. Pero no todas las herramientas te ayudarán a obtener la información correcta. A continuación te presentamos un desglose de las herramientas de enriquecimiento de datos más utilizadas en la prevención del fraude.

Pero antes de entrar en profundidad, quizá quieras ver un ejemplo. Escribe tu dirección de correo electrónico o tu número de teléfono en el siguiente campo para ver cómo SEON enriquece los datos para detectar a los estafadores potenciales.

 

Enriquecimiento de datos de direcciones de correo electrónico

Lo más probable es que todos tus usuarios tengan que registrarse con una dirección de correo electrónico. Este sencillo campo de datos puede revelar mucho si se compara con bases de datos externas:

  • ¿La dirección es gratuita o paga?
  • ¿Es desechable?
  • ¿Está registrado el dominio?
  • ¿Ha estado involucrada en alguna filtración de datos?
  • ¿Se ha utilizado para registrarse en redes sociales y plataformas (Facebook, Instagram, Spotify, etc.)?

La elaboración de perfiles de redes sociales y la verificación de dominios, por ejemplo, es una ciencia que SEON se enorgullece de ofrecer a través de nuestra API de análisis de riesgo del correo electrónico.

Enriquecimiento de los datos de la dirección IP

Al igual que las direcciones de correo electrónico, la dirección IP de tu usuario puede revelar mucho sobre quién es realmente.

  • ¿Dónde se encuentra el usuario?
  • ¿Se conecta a través de puertos abiertos y se comunica con otros servidores?
  • ¿Utiliza proxies, VPNs o TOR?
  • ¿Está la IP en alguna lista negra de spam?
  • ¿IP del centro de datos o conexión residencial (perteneciente a un propietario)?

Enriquecimiento de datos de números BIN

Otro gran ejemplo de enriquecimiento de puntos de datos simples a través de fuentes de datos externas. Los números BIN (Bank Identification Numbers), también conocidos como IIN (Issuer Identification Numbers) pueden decirnos mucho sobre una tarjeta:

  • ¿Qué banco emitió la tarjeta?
  • ¿Qué tipo de tarjeta es?
  • ¿Cuál es el número de teléfono del banco?
  • ¿Cuál es el nivel de la tarjeta (solo cajero, Gold, Platinium, World Elite o Infinite, según el proveedor)?

Enriquecimiento de los datos del dispositivo

Esto es lo que, en SEON, llamamos Huella digital del dispositivo. Sencillamente, es la capacidad de decir mucho basándose en el dispositivo con el que el usuario se conecta a tu sitio:

  • ¿Se ha conectado el usuario con el mismo dispositivo antes?
  • ¿Está ejecutando una máquina virtual?
  • ¿Qué tipo de navegador tiene instalado?
  • ¿Es un móvil o una computadora de escritorio?

Las diferencias entre el enriquecimiento de datos de caja negra y de caja blanca

Por supuesto, todos los puntos anteriores son fáciles de falsificar o introducir con información robada. Por eso, el enriquecimiento de datos solo es realmente valioso en la prevención del fraude cuando se combina con una solución diseñada para entenderlo.

¿Cómo es posible? En dos palabras: machine learning. Ahora que hemos creado un conjunto de datos a gran escala, es el momento de alimentar un modelo de ML para analizar, informar y revelar ideas. En esta fase, las organizaciones pueden crear diferentes modelos en función de sus necesidades.

  • Modelo de caja blanca: Un modelo de machine learning que proporciona reglas legibles a través de un algoritmo de árbol de decisiones. Cada regla aplicada crea una nueva rama en la que los nodos son parámetros claros.
  • Modelo de caja negra: se basa en una clasificación compleja basada en probabilidades que elimina la transparencia en aras de las puntuaciones.

Sea cual sea el modelo, al alimentarlo a través de un sistema de ML, tu simple punto de datos se ha enriquecido, transformado y convertido en un arma poderosa en tu lucha contra los usuarios fraudulentos.

Conclusión

El enriquecimiento de datos no es solo una opción para la prevención del fraude: es uno de los procesos más cruciales que te permite obtener una imagen clara de quiénes son tus usuarios, ya sea en el sector de los viajes o en una plataforma de juegos de azar en línea.

Sin embargo, la recopilación de datos es solo una parte del proceso. No tiene sentido sin un análisis adecuado. Y la única manera de analizar estos datos para convertirlos en información es mediante herramientas de machine learning. Combinar el enriquecimiento de los datos con el machine learning es lo que mejora la toma de decisiones basada en el riesgo, maximiza los recursos para luchar contra el fraude y supera a los usuarios maliciosos cuyo objetivo es dañar tu negocio.

Preguntas frecuentes

¿Cuánto cuesta el enriquecimiento de datos con el software de prevención de fraude?

La mayoría de los programas de prevención de fraude incluyen funciones de enriquecimiento de datos como parte de su precio. Sin embargo, es posible que algunos proveedores dividan las herramientas en diferentes módulos en los que solo se paga por el análisis de la IP, el análisis de la dirección de correo electrónico o el análisis del teléfono. Normalmente se paga por cada llamada a la API.

¿Qué sectores utilizan el enriquecimiento de datos?

El enriquecimiento de datos es útil en la prevención de fraude, la ciberseguridad, pero también en el marketing y el comercio minorista online. Ayuda a conocer mejor a los usuarios a partir del menor número posible de datos.

Quizás también te interese leer sobre:

Más información sobre:

Huella Digital en Internet | Prevención de fraudes | Monitoreo y detección de fraudes | Detección de fraude con machine learning

Fuentes utilizadas para este artículo

  1. Techcrunch: APIs are the next big SaaS wave
  2. University of Cambridge: Explainable Machine Learning for Fraud Detection

Compartir artículo

Speak with a fraud fighter.

Click here

Author avatar
Florian Tanant

Florian Tanant es el Escritor de Contenido Senior de SEON. Con más de 10 años de experiencia escribiendo para líderes fintech y de ciberseguridad, su especialidad es desglosar conceptos técnicos para acercarlos a una audiencia amplia. Tiene dos hijos, así que esa es la excusa para las manchas de mantequilla de maní en su teclado.


Suscríbete a nuestro boletín de noticias

Las mejores historias del mes directamente en tu bandeja de entrada