Enunciada simplemente, la ley de Stigler afirma que un descubrimiento o ley científica no suele llevar el nombre del descubridor. Stephen Stigler expuso la "ley" en 1980 atribuyendo la paternidad al sociólogo Robert K. Merton aunque coherentemente con el enunciado la posteridad asignó la autoría a Stigler y no al verdadero genitor. Hay muchísimos ejemplos de esta ley, el más conocido es sin duda el de la Teoría de la Relatividad Especial de Einstein? que es, la verdad sea dicha, de Poincaré.

La ley de Benford -en honor del ingeniero de la General Electric, Frank Benford- enunciada en 1938 como "Ley de los números anómalos" (The law of anomalous numbers) también confirma la de Stigler pues el primero en observarla y dejar constancia escrita (1881, American Journal of Mathematics) fue el astrónomo norteamericano Simon Newcomb.

Un método sencillo para apostar, y ganar, la ronda de vinos

Como introducción a la ley de Benford, a quien esto lea le vamos a soplar indiscretamente al oído un truco de viejo pirata para que gane de vez en cuando a los amigos, sin abusar, unas rondas de vinos. Con este ejemplar de periódico en mano o el del día de las rondas de vino español -el mejor del mundo- propondrá a otro eventual jugador la siguiente apuesta. Abrir aleatoriamente el periódico por cualquier página y anotar el primer número que encuentren. Si el primer dígito significativo por la izquierda -es decir, ceros excluidos- está comprendido entre 4 y 9, ambos incluidos, usted pagará las copas pero si aparece 1, 2 ó 3, invitará el otro jugador. Si su rival en el juego desconoce la ley de Benford seguramente aceptará la apuesta al considerar que la esperanza de probabilidad de ganar es 2/3 (apuesta por 6 dígitos) mientras que la de usted es 1/3 (apuesta por 3 dígitos) Sin embargo no es así toda vez que los dígitos significativos mencionados no están distribuidos uniformemente ya que obedecen a una ley logarítmica. La probabilidad que tiene usted de ganar jugando solamente los tres primeros dígitos de la serie -60,2%- domina ampliamente a la de su rival -39,8%- que juega los seis siguientes dígitos.

El 1 domina al 2 y el dos al 3?

Por sorprendente que pueda parecer, en ciertos conjuntos o listas de números la ley de Benford predice los anteriores resultados siempre y cuando los datos cumplan una serie de condiciones (por ejemplo, independencia, invariancia de escala y base respecto a la ley y que además abarquen varios órdenes de magnitud) sistematizadas en 1995 por T. Hill aunque posteriormente, 2008, Nicolas Gauvrit y Jean-Paul Delahaye propusieron condiciones más generales y sencillas.

La ley logarítmica es la única distribución de probabilidad que cumple la doble condición de invariancia de escala y base. Esto es importante porque cuando la distribución de datos se ajusta a la ley de Benford es indiferente que se expresen en euros o pesetas (invariancia de escala) no así cuando los datos se desajustan: el impacto al utilizar distintas escalas es muy visible. Asimismo, está claro que muchos conjuntos de números -por ejemplo, todos los teléfonos que empiezan por 986- no se ajustan a la ley de Benford. Y una curiosidad aun más sorprendente en apariencia resalta que se obtiene el mejor ajuste cuando se reúnen varios conjuntos de números que no cumplen la ley tomados independientemente. Además, suponiendo que en cada página de este periódico encontráramos conjuntos de números de distinta naturaleza que no obedecieran a la ley de Benford, si realizamos un muestro no sesgado de cada página la lista obtenida por reunión la obedecería.

La ley de Benford, contraintuitiva, no es verdaderamente una "ley" o teorema matemático sino una observación. En una lista de datos estadísticos que cumplan ciertas condiciones, la primera cifra significativa más frecuente es 1 (30,1% de observaciones) seguida de 2 (17,6% de observaciones) 3 (12,5%) así hasta 9 (4,6%) en consonancia con una distribución logarítmica. De ahí que según el consejo de viejo pirata la esperanza de probabilidad de ganar los vinos sea 60,2% (30,1+17,6+12,5).

Fraude contable

De forma general, se considera que quien maquilla datos de una contabilidad u otro tipo de fraude con datos socioeconómicos tiende a distribuir por inadvertencia los dígitos significativos de forma relativamente uniforme. Mark J. Nigrini ha desarrollado eficaces test basados en la ley de Benford para detectar fraudes fiscales o contables. Se requiere, eso sí, que los datos sean suficientemente numerosos y con varios órdenes de magnitud, verbigracia, 100, 1.000, 10.000, etc.

Si a partir del conjunto de datos contables, registrados en los asientos de entradas y salidas, las primeras cifras significativas siguen la ley de Benford, la declaración no ha sido, probablemente, manipulada. Pero si la contabilidad ha sido manipulada el análisis estadístico obtendrá una distribución de frecuencias de los primeros dígitos significativos que no se ajustará a la "ley de los números anómalos". A veces, 5 y 6 predominan con frecuencias respectivas de 40% y 20%. En algunos casos los test son muy complicados y necesitan potentes ordenadores para llevarlos a cabo en tiempo razonablemente corto pero en otros casos son muy sencillos. A ojo de buen cubero, si hay pocas cantidades que comiencen por 1 y muchas por 5 y 6 hay que desconfiar de la contabilidad que se analiza.

También existen otras astucias estadísticas sencillas para detectar cierto tipo de fraudes. Por ejemplo, el propio Hill propuso a sus alumnos el ejercicio, para casa, de lanzar una moneda 200 veces al aire y anotar cuando salía cara y cuando cruz. Los más perezosos, y tramposos, no se tomaron la molestia de lanzar realmente 200 veces la moneda y anotaron aleatoriamente cara y cruz de forma bastante uniforme pero a ninguno se le ocurrió anotar seis veces seguidas cara o cruz pues intuitivamente no consideraron probable que se dieran series consecutivas tan largas de cara o cruz lo cual es falso cuando se realizan 200 lanzamientos reales. Por ese fallo detectó Hill a los tramposos.

Aplicación de la ley de Benford a la contabilidad de Bárcenas

Días pasados, el matemático Miguel Lacruz utilizó los datos que se observan en los asientos de la columna de entradas de la supuesta contabilidad del señor Bárcenas y, apoyado en la metodología de Nigrini, llegó a la conclusión de que no hay conformidad entre los datos y la ley de Benford. En consecuencia, el profesor Lacruz considera que la contabilidad del señor Bárcena es una manipulación. El ingeniero vigués Fernando Pérez-González, también profesor, entró en el debate negándole validez probatoria a la conclusión anterior habida cuenta que los datos no cumplen alguna condición necesaria. Por nuestra parte no vamos a emitir ningún juicio salomónico toda vez que ambos profesores son, a buen seguro, mejores conocedores que nosotros de la ley de Benford. No obstante, creemos que los datos son insuficientes para un análisis estadístico riguroso basado en la ley de Benford pero suficientes para la aplicación del teorema de Hoeffding.

Una propuesta basada en el teorema de Hoeffding

Proponemos -y creemos que es una novedad que esperamos sirva a algún estudiante para hacer un doctorado en un marco más general- una aplicación del teorema de Hoeffding (1956, AMS, 27, p. 713-721) a los datos de la supuesta contabilidad paralela del señor Bárcenas y a un muestreo, obtenido mediante un método sin sesgo, del mismo número de asientos de la contabilidad oficial del PP.

El teorema de Hoeffding es fascinante por contraintuitivo, casi más sorprendente que la ley de Benford. Este teorema se ha aplicado a campos tan diversos como la gestión de calidad, la teoría del voto o los seguros. Lo que viene a decir el teorema es que la frecuencia media de una variable se concentra tanto más en torno a su esperanza cuanto más heterogéneas son las probabilidades de los distintos eventos (independientes) observados. Estamos seguros que algún estadístico sabrá hacer astutamente uso del teorema de Hoeffding sabiendo que los datos manipulados, si lo fuesen, deberían estar distribuidos más uniformemente que los que surgen de una contabilidad oficial inalterada.