Ley de Benford: La increíble técnica matemática para detectar fraudes

El análisis de frecuencia digital ha surgido en los últimos años como una potente herramienta analítica en la detección de irregularidades y fraudes.

Guía de: Matemáticas

En un día cualquiera de 1881, el  astrónomo y matemático Simon Newcomb estaba realizando unos cálculos con un viejo libro de logaritmos cuando se dio cuenta de que las páginas del libro estaban más viejas y usadas cuanto más cercanas estaban del principio, es decir, aquellos números que comenzaban con 1. La única conclusión posible es que a lo largo de los años había consultado mucho más el logaritmo de los números que comenzaban por 1. Si pensamos en las teclas de un ascensor de un edificio, por ejemplo, sería normal que el 1 estuviera más gastado. Es claro que el 9 es el número que más vemos como último dígito en todos los catálogos de precios de productos.

Revisando los datos que él utilizaba en sus observaciones astronómicas, dedujo que los dígitos iniciales de los números no eran equiprobables y que, de hecho, el 1 aparecía de manera más frecuente seguido del 2 y así hasta el 9 que era el menos frecuente.

Mediante un breve e ingenioso razonamiento matemático, pero informal, Newcomb enunció verbalmente una ley logarítmica:

benford

Foto: Internet

“La ley de probabilidad de ocurrencia de números es tal que las mantisas de sus logaritmos son equiprobables”.

El aporte de Benford

El tema paso rápidamente al olvido hasta 1938 cuando un físico de General Electric, Frank Benford, redescubrió el mismo patrón. Este hombre estudió 20.229 números provenientes de 20 muestras completamente dispares: constantes y magnitudes físicas, longitudes de ríos, estadísticas de béisbol, direcciones de personas y hasta cifras de portadas de revistas.

De esta manera empírica comprobó que la probabilidad de que un número en una serie de datos comience por el dígito d es de log(1 + 1/d) y enunció la “ley de los números anómalos de Benford”.

Es decir, la probabilidad de que en una serie de muchos datos, el primer dígito de un número sea 1 es de alrededor del 30%, de un 17,6% para el 2, 12,5% para el 3 etc….

Sin embargo, a pesar de constatar el hecho, Benford no fue capaz de explicar las causas de este fenómeno tan extraño.

El primer paso en esta dirección lo dio el matemático Roger Pinkham en 1961. Su argumento era que si realmente existía una ley de frecuencias de dígitos esta debía ser universal. Es decir, cumplirse si realizamos los  cálculos en pesos chilenos, euros, dólares o si medimos la longitud en metros o pulgadas. Esto se conoce en matemáticas como invariante ante cambios de escala. Luego simplemente demostró que la única ley de frecuencias de dígitos que es invariante frente a cambios de escala es la Ley de Benford.

Hubo que esperar hasta 1996 a que el matemático Ted Hill diera una demostración matemática satisfactoria.

Si bien resulta claramente interesante para la comunidad matemática, lo cierto es que esta ley tiene múltiples aplicaciones prácticas.

De hecho, el análisis de frecuencia digital que corresponde justamente a estudiar la frecuencia de aparición de los dígitos en conjuntos de datos ha surgido en los últimos años como una potente herramienta analítica en la detección de irregularidades y fraudes. Este análisis es cada vez más utilizado por las Direcciones de Auditoría Interna más modernas, en su lucha contra el fraude.

Por ejemplo, si alguien trata de falsificar su declaración de la renta, irremediablemente tendrá que inventar algún dato. Al hacer esto la tendencia es utilizar demasiados números que comienzan por dígitos a mitad de la escala, 5, 6, 7 y pocos que empiezan por 1. Esto causaría una violación a la Ley de Benford, que de por sí no implica fraude, pero sí un buen indicio para justificar una inspección más detallada.

El Departamento de Hacienda de EE.UU determinó que si una cifra empieza por tres y aparece el 40% de las veces, en vez de un 12,5% que es lo habitual hay motivos para investigar el fraude fiscal.

Hay ideas para utilizar esto mismo en mejores sistemas de almacenamiento de datos en computadores, irregularidades en casos clínicos y modelos demográficos.

Una de las aplicaciones más polémicas de esta ley se denomina “forénsica eleccionaria” y es liderada por el profesor de Ciencias Políticas en la Universidad de Michigan Walter Mebane. Por ejemplo la aplicó la Ley de Benford con algunas modificaciones a a las elecciones de Irán en el 2009 donde Ahmadinejad sacó el 63% de los votos. Las desviaciones eran tan grandes que el fraude era obvio. Existe un estudio más polémico y cuestionado que hizo la Universidad de Puerto Rico para detectar manipulaciones en los votos de las mesas automatizadas del referéndum revocatorio en Venezuela.

Más sobre Matemáticas

Comentarios Deja tu comentario ↓
Síguenos en Facebook X