Glosario

Caja negra machine learning

Aprende qué es la caja negra de inteligencia artificial y cómo combate el fraude.

¿Qué es el modelo caja negra de machine learning?

En términos generales, la caja negra de inteligencia artificial se refiere a los modelos de inteligencia artificial que te dan un resultado o toman una decisión sin explicar o mostrar cómo lo hicieron. Los procesos internos utilizados y los múltiples factores ponderados permanecen desconocidos. 

En otras palabras, hay una falta de transparencia en esta tecnología. Un modelo caja negra significa no humano, ni siquiera los programadores y administradores de la máquina o el algoritmo saben o entienden cómo se llegó al resultado. 

Solo el algoritmo mismo es consciente de exactamente cómo se tomaron las decisiones. 

¿Cómo funciona el modelo caja negra de machine learning?

La caja negra de inteligencia artificial en la prevención de fraude te otorga una puntuación de riesgo sin decirte o mostrarte cómo se alcanzó esa puntuación. El usuario únicamente conoce el resultado de estos cálculos complejos.

Así que los datos se ingresan, y un resultado -puntuación de riesgo- se obtiene, pero no sabemos qué sucede mientras tanto. Por ello, no podemos ajustar o modificar estos procesos internos. 

En un sentido, esto significa que estamos a merced del algoritmo, ya que no estamos conscientes de qué informa la puntuación de riesgo que resulta.

1. En su forma más simple, el inteligencia artificial involucra alimentar grandes cantidades de datos ejemplares al algoritmo y dejarlo que aprenda por sí mismo.   

2. Siguiendo este “entrenamiento”, el modelo de inteligencia artificial está listo para recibir datos del mundo real, procesarlos y dar un resultado; en la detección de fraude, una puntuación de riesgo.

3. Mientras tanto, conforme recibe más y más información, escala su algoritmo, métodos y conocimiento con esta nueva información. 

¿Pero cómo lo hace exactamente? ¿Qué rol juega cada fragmento de información en el proceso que nos dio ese resultado?

Un sistema de caja negra no puede decírnoslo. En otras palabras, no podemos ver dentro de la caja que está pintada de negro, ni sabemos cómo funciona cada modelo de inteligencia artificial de caja engra. 

¿Por qué es importante el modelo de caja negra machine learning?

A pesar de la inherente falta de transparencia, la inteligencia artificial caja negra es muy popular, y puede ser útil en ciertas configuraciones. De hecho, la mayoría de los modelos de inteligencia artificial en uso en 2021 y más son de caja negra.

La caja negra de inteligencia artificial hace uso de tecnología como:

  • Ell big data
  • Similitud de strings
  • Deep learning
  • Redes neurales

Con la caja negra de inteligencia artificial, podemos responder a la pregunta “¿Cuál es la puntuación de riesgo de X?”, pero nunca seremos capaces de responder a la pregunta “¿Por qué el sistema piensa que esta es una puntuación de riesgo precisa para X?”.

Si pudiéramos responder este “por qué”, el sistema automáticamente se clasificaría como un sistema de caja blanca de inteligencia artificial. 

¿Cómo ayuda el modelo de caja negra contra el fraude?

Como herramienta de combate al fraude, la caja negra de inteligencia artificial puede ayudarnos a averiguar conexiones y factores complejos.

  • Se basa en clasificaciones complejas basadas en la probabilidad, pero no hay transparencia, que sí la tienes en una solución whitebox.
  • Nos permite procesar más información de lo que es humanamente posible, y de forma rápida.
  • Es mejor que la caja blanca para atrapar intentos de fraude nuevos, únicos y sofisticados.

Sin embargo, también tiene sus desventajas.

En la detección de fraude, usar exclusivamente una plataforma de inteligencia artificial caja negra significa que tú, el usuario, no estás completamente al tanto de sus maquinaciones internas, así que no puedes saber si funciona para ti y tus necesidades. Tampoco eres capaz de cambiar los parámetros y el árbol de decisiones que usa para tomar sus decisiones.

Dependiendo de los requisitos, se considera ventajoso elegir soluciones whitebox donde sea posible, o incluso una combinación de ambas. 

¿Por qué escoger caja negra sobre caja blanca?

En la prevención y detección de fraude, la caja negra de inteligencia artificial ofrece ciertas ventajas:

  • Velocidad: el sistema puede procesar grandes cantidades de datos y entregar resultados más rápido que los humanos, así como resultados más rápidos que un sistema de caja blanca.
  • Utilización del big data: los grandes conjuntos de datos operan bien en los sistemas de caja negra. 
  • Trabaja sin supervisión: no hay necesidad de que los humanos modifiquen o aprueben las funciones internas del sistema y la forma en la que se llega a las decisiones. 
  • Puede identificar nuevos patrones: los modelos de caja negra son más propensos a predecir y perfeccionar nuevos y únicos intentos de fraude sofisticados. 

Dicho esto, la mejor respuesta es que hay instancias en las que la caja negra es mejor, y otras donde el enfoque de caja blanca es ideal.

¿Existe un beneficio en tener algoritmos y cálculos transparentes (conocidos)? ¿O es aceptable que sean opacos, sólo proporcionando el resultado sin revelar exactamente cómo se obtuvo?

El modelo de caja negra significa que puedes ver el ingreso y el resultado, pero no sabes qué es lo que pasa a la mitad. En términos simples, la caja negra es inteligencia artificial inexplicable (la caja negra es inteligencia artificial explicable).

Cuando la esencia es la velocidad y la precisión es secundaria, una solución caja negra puede ser recomendable. Las soluciones whitebox, por otro lado, optan por la calidad (y precisión) sobre la cantidad. 

Claro que todo el inteligencia artificial permite reducir el tiempo invertido en revisar manualmente la información, y cada método tiene su propio uso.