Machine learning para detectar fraude
by Florian Tanant
Rara vez ha habido conferencias de Operaciones de Riesgo en los últimos años donde no se haya abordado el tema de machine learning en la detección del fraude.
Algunos llegan a decir que reemplazará las revisiones manuales. Pero, ¿realmente podemos confiar en los algoritmos para entender cómo los estafadores escogen un negocio? ¿Y de todos modos, qué es el machine learning? Todas las respuestas están en este post.
¿Cómo es la detección de fraude con Machine Learning?
En la detección de fraude, el machine learning es una colección de algoritmos de inteligencia artificial (IA) entrenados con tu información previa para sugerir reglas de riesgo. Entonces, puedes implementar estas reglas para bloquear o permitir ciertas acciones de usuario, como accesos sospechosos, robos de identidad o transacciones fraudulentas.
Cuando se está entrenando el motor del machine learning, se deben seleccionar casos previos de fraude y no fraude para evitar falsos positivos y mejorar la precisión de las reglas de riesgo. Mientras más tiempo se procesen los algoritmos, más precisa será la sugerencia de reglas.
Diferencia entre machine learning e inteligencia artificial
Los términos IA y machine learning son utilizados a menudo de manera indistinta. Sin embargo, mientras cada tipo de machine learning cuenta como inteligencia artificial, no toda la inteligencia artificial utiliza machine learning.
La IA es un concepto más grande diseñado para crear máquinas que simulan el pensamiento humano. El machine learning es un subconjunto de IA que permite a las máquinas aprender de la información sin necesidad de ser reprogramadas.
También vale la pena mencionar que el machine learning tiene su propio subconjunto, llamado deep learning (aprendizaje profundo). El mismo emplea algoritmos y estructuras modeladas a partir del cerebro humano.
Los beneficios del machine learning para el manejo de fraudes
Debido a que las máquinas realizan un mejor trabajo procesando grandes conjuntos de datos que los humanos, lo que obtienes es la habilidad de parcializar y apuntar grandes cantidades de información. Esto significa:
- Detección más rápida y más eficiente: el sistema identifica rápidamente patrones sospechosos y comportamientos que podrían tomar meses a los humanos para ser establecidos.
- Reducción en el tiempo de revisión manual: de manera similar, el tiempo invertido en revisar manualmente la información puede ser drásticamente reducido cuando dejas que las máquinas analizen toda la información por ti.
- Mejores predicciones en grandes conjuntos de información: mientras más información le suministres a un motor de machine learning, más entrenado llega a ser. Esto quiere decir que, aunque es un reto encontrar patrones en grandes conjuntos de información para los humanos, es totalmente lo opuesto con un sistema manejado por IA.
- Solución económica y efectiva: En vez de contratar más agentes de operaciones de riesgo, solo necesitas un sistema de machine learning para analizar toda la información suministrada, independientemente del volumen. Esto es ideal para negocios que tienen temporadas altas ocasionales, gran tráfico de información, pagos en línea o accesos de usuario. Un sistema de machine learning es un gran aliado para hacer crecer tu compañía sin aumentar drásticamente los costos en el departamento de riesgos.
Es importante mencionar que los algoritmos no necesitan descansos, días festivos o dormir. Los fraudes pueden suceder en cualquier momento a cualquier hora del día, hasta los mejores gerentes de fraudes tienen que trabajar un lunes por la mañana revisando los archivos de respaldo de manera manual. Las máquinas pueden agilizar el proceso seleccionando el caso más obvio que parezca fraude o casos aceptables.
Acorde a un estudio realizado por científicos en computación de la Universidad de Yakarta, los algoritmos de machine learning alcanzaron una exactitud por encima del 96% en la reducción del fraude en los negocios de comercio electrónico.
Asociate con SEON para reducir la tasa de fraudes en tu negocio con enriquecimiento de datos en tiempo real y APIs avanzadas.
Hable con expertos
Desventajas del machine learning en la detección de fraudes
A pesar de tener sus ventajas, siempre habrá casos donde las revisiones manuales a la antigua serán preferibles.
- Menos Control: esto es verdad en el lado negativo de los motores de Machine Learning, pueden cometer errores y nadie se dará cuenta.
- Positivos Falsos: si alguna acción legítima es marcada como fraude y tú no te das cuenta, afectará a todo el sistema negativamente. Dicho esto, un motor de Machine Learning incorrectamente calibrado, puede crear un ciclo interminable donde entre más falsos positivos haya que no son marcados como falsos, traerá resultados menos precisos en el futuro.
- Sin entendimiento humano: si estás tratando de entender claramente por qué una acción de un usuario es sospechosa, es difícil vencer la psicología antigua.
Unos pocos ejemplos donde los humanos a menudo prefieren que los sistemas incluyan sistemas automatizados como AML y revisión de transacciones de gran valor, como un pago a una joyería o compra de electrónica de alta calidad.
“Me gusta el lugar a donde las máquinas nos han llevado por que la IA y el Machine Learning pueden sacar esas cosas que son muy muy muy malas, pero en gran parte del tiempo hay falsos positivos. Y, si estás enseñando a una máquina en una cierta manera, tienes que lidiar con las consecuencias de eso. Entonces, hay un espacio intermedio, y ahí es donde me gusta operar”
Jacqueline Hart, Gerente de Trust and Safety de Patreon, escuchada en el podcast de SEON.
Diferencias entre el método blackbox y whitebox en machine learning
Mientras el Machine Learning tiende a volverse más popular para la mayoría de los comercializadores de software en prevención de fraudes, no todas las soluciones son creadas de la misma manera. Notablemente, hay una diferencia clave entre el método Whitebox y Blackbox en Machine Learning.
- Blackbox en Machine Learning: el sistema está diseñado para trabajar en un modo de ‘establecer y olvidar’, donde las decisiones son objetivas y automatizadas. Puede funcionar de una manera excelente para negocios pequeños que no necesitan indagar a fondo en el meollo del ajuste de las reglas de riesgo.
- Whitebox Machine Learning: el sistema te dará explicaciones claras de por qué una regla de riesgo fue sugerida. Esto hace más fácil entender en dónde está el riesgo y le da más flexibilidad a los agentes de riesgo para mejorar su estrategia de prevención de fraude.
Ambos sistemas tienen sus pros y contras. Sin embargo, en SEON, optamos por un sistema Whitebox, que permite a los agentes de riesgo tener más control sobre el sistema de riesgo para modificar, probar y medir los resultados de cada regla de riesgo.
¿Cómo utilizar machine learning para prevención de fraudes?
El término Machine Learning puede parecer un poco intimidante, pero empezar con un sistema algorítmico es bastante sencillo.
En este ejemplo, buscaremos reducir los fraudes de transacción (y por lo tanto, los costos de contracargo)
Introducir los datos de entrada
Cada sistema de IA o AML necesita datos de entrada para poder iniciar. En este escenario, serán datos de transacción como:
- Valor de la transacción
- SKU del Producto
- Tipo de Tarjeta de Crédito
- Etc.
También agregaremos información relacionada de cómo los clientes se conectan con el sitio:
- Información del IP
- Tipo de dispositivo
- VPN, proxy o uso de TOR
- Etc.
Ten en cuenta que cuanto más información tengas para empezar, más precisos serán los resultados. Esto es particularmente importante si tu software de prevención del fraude no permite campos personalizados, ya que podrías estar omitiendo información crucial.
Generar las reglas
El sistema de machine learning de SEON puede generar dos tipos de reglas:
- Reglas de parámetro simple, también conocidas como reglas heurísticas: un ejemplo de una regla de parámetro simple sería: bloquear el IP si es X.
- Reglas Complejas: aquellas que incluyen múltiples parámetros.
Cada regla listada muestra un puntaje de exactitud. Se puede ajustar el umbral de precisión para reforzar o aligerar las condiciones de activación.
Tenga en cuenta que los nombres de las reglas son sumamente descriptivos, permitiendo entender porqué fue generada con un simple vistazo. Claramente se puede ver como todas las reglas son diseñadas para entender cómo el inicio de sesión del cliente puede afectar el valor de la transacción perdido por fraude.
Revisar y activar la regla
SEON te permite filtrar las reglas mediante cualquier dato, incluyendo su tipo y precisión de predicción. La parte de precisión es particularmente útil, y es calculada utilizando una matriz de confusión compleja.
Por defecto, las sugerencias de Machine Learning están desactivadas. Puedes activarlas rápidamente utilizando el switch de ON/OFF. También es posible crear y ajustar manualmente los umbrales para la regla de activación.
Entrenar el algoritmo
Proveer información como retroalimentación es clave para redefinir las reglas y obtener resultados más precisos. Con SEON, hay dos maneras de proveer retroalimentación y etiquetar las acciones:
- A través de la GUI: una simple y visualmente amigable manera de marcar acciones.
- Utilizando la Etiqueta API: puedes crear acciones programáticamente vía llamadas API.
Cualquiera que sea la manera como lo hagas, las acciones deberán ser marcadas como APROBADAS, REVISADAS o NEGADAS.
Los algoritmos se entrenan una y otra vez por sí mismos todos los días basados en los últimos 180 días de información válida. Puedes acceder a ellos en cualquier momento en tu motor de puntaje y back-end (donde manejas todas las reglas de riesgo).
Probar las reglas con información previa
Un buen software de prevención de fraudes debería permitirte visitar casos anteriores para revisar si las reglas han ayudado. Esto es realizado en un ambiente sandbox, donde puedes activar y desactivar las reglas para ser testigo de su precisión en persona.
Realizar una prueba creará una matriz de confusión basada en transacciones previas sobre el intervalo de tiempo seleccionado y destacará la proporción estimada de precisión de la regla. En el campo del machine learning una matriz de confusión o matriz de error es una tabla que permite visualizar el desempeño de un algoritmo. Esto te permite calcular la precisión sobre un rango de información específico, seleccionable desde la última hora, hasta el último año.
En las manos adecuadas, esto le da a los gerentes de fraude control completo sobre su estrategia de riesgo, permitiéndoles no solamente reducir si no también monitorear, probar y modificar resultados a voluntad.
Software de detección de fraude contratado VS machine learning en tu sitio
Mientras es completamente posible para un equipo talentoso construir sus propios modelos de machine learning, vale la pena considerar el tiempo, esfuerzo y costos involucrados:
- Costos de buscar talento: vas a necesitar científicos, ingenieros y especialistas en machine learning para construir los modelos.
- Tiempo para preparar la información: preparar y limpiar los datos sin procesar. Esto puede ser un proceso prolongado que puede tomar del 60% al 80% del tiempo entre recibir información de entrada y sugerir reglas de riesgo.
- Información no compartida: otra ventaja de contratar un servicio de machine learning es que se pueden beneficiar de información compartida de múltiples clientes. Esto no quiere decir que las reglas se van a aplicar a todos, sino que los que ofrecen este servicio utilizan su conocimiento para crear reglas de alta precisión de las que otros competidores se pueden beneficiar.
- Integración no lista para usar: es importante mencionar que integrar el machine learning con una estrategia de manejo de riesgos puede ser prolongado, complejo y costoso.
5 casos de uso de Machine Learning para detección de fraude
La prevención del fraude impulsada por IA es agnóstica de la industria. Solo necesita información para trabajar, y es la razón que por la cual encontrarás que ha sido implementada en una variedad de mercados diferentes como:
Tiendas en línea y fraude de transacciones
Analizar la información de miles de transacciones puede ser difícil. Es por eso que muchos gerentes de fraude de grandes compañías de comercio electrónico utilizan machine learning para entender por qué algunas transacciones no fueron marcadas como fraude por el sistema.
Y más importante aún, Juniper Research estima pérdidas de 50.5 mil millones de dólares debido a fraudes para los minoristas con tiendas en línea para el 2024.
Dicho esto, después de dejar que tu sistema de ML corra por un tiempo puedes aprender cuáles elementos son los más apuntados por los estafadores, qué tipo de información involucra el mayor riesgo y, por supuesto, qué pagos realizados con tarjeta deberían ser bloqueados para evitar tasas de contracargos y más.
Instituciones financieras y de cumplimiento
Las compañías fintech (financieras integrando tecnología) como instituciones financieras establecidas e incluso proveedoras de seguros, tienen requerimientos sumamente estrictos que deben cumplir para evitar multas reglamentarias. En otras palabras, necesitan verificar que están tratando con usuarios reales, no estafadores.
Sin embargo, también tienen que trabajar rápido para mantenerse competitivos. Así es como los estafadores se escabullen en la red. Con un sistema de machine learning en el lugar, muchas compañías pueden ganar información invaluable que hace que un perfíl se vea legítimo contra uno falso.
iGaming y abuso de bonificaciones o cuentas múltiples
Las compañías de juegos en línea, casinos y plataformas de apuestas deben asegurarse de que todos sus jugadores son reales. También tienden a ofrecer atractivas recompensas para nuevos clientes. Esto crea un doble incentivo para los estafadores de crear cuentas múltiples y reclamar las bonificaciones así como participar en un juego colusorio.
De acuerdo a TransUnion, en el 2021 se vio un incremento de 43% en los fraudes de identidad de apuestas en línea, lo que demuestra que es necesario tomar medidas ahora más que nunca.
Un sistema de machine learning puede ser utilizado para analizar información que apunta a comportamientos sospechosos por el usuario. Esto puede trabajar a tu favor para detectar bots, jugadores tramposos e incluso afiliados maliciosos que solo traen tráfico de mala calidad a tu sitio.
BNPL y robo de cuentas
Las cuentas de “Compra ahora, paga después” (BNPL) se están convirtiendo en las carteras digitales de internet. Si un estafador logra acceder a las cuentas de un usuario, puede adquirir bienes y/o servicios de manera ilegal. Esto se denomina robo de cuentas, o ATO.
La mejor manera de proteger las cuentas es entender cómo los usuarios acceden a la plataforma. El problema es que esto puede variar significativamente dependiendo del mercado, de la temporada y otros parámetros. Utilizando un motor de machine learning en tu punto de acceso de usuario puedes entender cómo autentificar mejor a tus usuarios para proteger sus cuentas en línea.
Pagos por puerta de enlace y contracargos por fraude
Este es otro ejemplo donde es sumamente difícil revisar manualmente cada transacción, especialmente cuando la rapidez de respuesta es esencial. Los pagos por puerta de enlace deben procesar miles de transacciones lo más rápido posible, lo que vuelve imposible emplear agentes humanos para revisarlas todas.
Un motor de machine learning puede actuar como un sistema analítico de monitoreo de fraude, donde puedes entrenarlo para detectar transacciones fraudulentas que incurrirán en costos de contracargo.
Descubre cómo podemos ayudar a hacer crecer tu negocio
Hable con expertos
¿Cómo SEON ayuda a combinar Machine Learning con revisiones manuales?
Claramente, dejar que un sistema de machine learning supervise tu estrategia de prevención de fraudes tiene muchas ventajas. Pero algunas veces tu enfoque no debería ser solo bloquear o aceptar acciones del usuario, sino también entregar toda la información correcta a tus analistas de riesgo lo más rápido posible. Siempre existen casos que caen en un área gris donde los mejores algoritmos no pueden funcionar por sí mismos.
Aquí es precisamente donde puedes utilizar el sistema whitebox de machine learning para sugerir reglas. Con nuestro motor que también incluye un poderoso enriquecimiento de información, tienes un completo entendimiento de las reglas donde el humano todavía tiene la última palabra.
La transparencia de SEON ayuda a tus analistas a tener una visualización total del problema y una solución potencial. Ellos pueden probar las reglas con tu propia información previa y modificarlas para obtener mejores resultados en un ambiente sandbox.
Efectivamente, esto quiere decir que obtienes lo mejor de los dos mundos: un poderoso sistema de IA impulsado para indicar dónde están los estafadores e inteligencia humana para supervisar las sugerencias.
En resumen, las máquinas son fantásticas a la hora de procesar información y conocimiento pero los humanos son mejores aplicándolo. Esta es la razón por la que SEON cree que combinar el conocimiento y el machine learning es la mejor manera de luchar contra los estafadores en línea.
Preguntas Frecuentes
Un sistema de detección de fraudes será capaz de detectar riesgos basados en el historial de tu información. Puede sugerir o implementar reglas para reducir el riesgo de fraude automáticamente.
Casi todos los sistemas de Machine Learning están completamente integrados con el sistema de prevención del fraude del cliente. El precio varía, e inclusive, puedes encontrar soluciones donde el pago depende del número de revisiones API que realices cada mes.
El Blackbox Machine Learning está diseñado para correr automáticamente bajo poca supervisión humana. El Whitebox Machine Learning, por otro lado, ofrece sugerencias claras y legibles que puedes aceptar, actualizar o negar basado en tu información.
También puedes estar interesado en:
- SEON: ¿Qué es la huella digital en internet y cómo funciona?
- SEON: Guía para la detección y prevención de fraudes online
- SEON: Compara los mejores 7 sistemas de gestión de fraude
- SEON: El mejor software de detección de fraudes
Relacionado
- Data Preprocessing vs Data Wrangling in Machine Learning Projects
- Juniper Research forecasts a $50.5B loss to fraud for online retailers by 2024
- TransUnion gaming report: 2021 saw a 43% increase in online gambling identity fraud
Articles
Showing all with `` tag
Detección y prevención del fraude financiero: Los enfoques en 2023
Entender el AML en bancos: Riesgos y cumplimiento
Tendencias de fraude para 2023: Cómo influencian a los estafadores y a tu empresa
Subscribe to our newsletter
Get anti-fraud and compliance insights and tips from SEONs experts.
Florian Tanant
Florian Tanant es el Escritor de Contenido Senior de SEON. Con más de 10 años de experiencia escribiendo para líderes fintech y de ciberseguridad, su especialidad es desglosar conceptos técnicos para acercarlos a una audiencia amplia. Tiene dos hijos, así que esa es la excusa para las manchas de mantequilla de maní en su teclado.