Это наверное самый неинтуитивный закон природы, из тех, что мне встречались. Казалось бы, что появление любой цифры в результатах измерений равновероятно. Но это не так. Например, если взять данные по этажности зданий по стране, то зданий у которых количество этажей начинается на единицу, выше, чем у которых на двойку. А на двойку больше чем на тройку.
И дело не ограничивается зданиями. Подобные закономерности выявлены при анализе большого количества данных с результатами голосований, различных экономических показателей, количества жителей населенных пунктов, размера генома.
Еще в в 1881 г. американский астроном Саймон Ньюкомб заметил, что страницы библиотечного логарифмического справочника ( такие справочники использовались в то время для выполнения логарифмических вычислений ), на которых числа начинались с 1, гораздо сильнее захватаны и истрепаны, чем страницы, на которых числа начинались с 2 и так далее до 9 – те выглядели чистыми, как будто их вообще не открывали. Ньюкомб сделал смелое предположил, что те страницы, которые больше всего истрепались, чаще всего и открывали, а значит ученые, которые до него брали тетрадь, работали с данными, отражавшими подобное распределение цифр.
Повторно эта закономерность была отмечена в 1938 году физиком Франком Бенфордом, которые испытал его на данных из 20 различных областей знания. Бенфорд работал с наборами данных, включающих площадь поверхности 335 рек, размеры 3259 американских населенных пунктов, 104 физическими константами , 1800 молекулярными весами , 5000 записями из математического справочника, 308 номерами, содержащихся в выпуске Reader’s Digest , уличные адреса первых 342 лиц, перечисленных в American Men of Science и 418 смертей. Общее количество данных, используемых в исследовании, составило 20 229. А в 1995 году Тед Хилл подтвердил результаты.
Точность, с которой многие финансовые данные описываются законом Бенфорда, позволила использовать его как один из инструментов для борьбы с финансовыми мошенничествами. Если человек вписывает в отчет вымышленные цифры, он интуитивно старается распределять их равномерно, а они, скорее всего, должны распределяться по Бенфорду.
Именно так было раскрыто мошенничество Кевина Лоуренса. На данный момент в Соединенных Штатах доказательства, основанные на законе Бенфорда, принимаются в уголовных делах на федеральном, государственном и местном уровнях.
В то же время стоит помнить, что статистические закономерности — это не закон Ньютона и они действуют не всегда. Рост взрослого человека почти всегда начинается с 1 при измерении в метрах. но почти всегда начинается с 4, 5, 6 или 7 при измерении в футах, то есть появляется зависимость от единиц измерений. Не подчиняются закону Бенфорда телефонные номера, психологически привлекательные цены (например 29,99) и целый ряд других данных.
Подробности смотрите в источниках:
Интерактивный сайт с наборами данных, подчиняющихся закону Бенфорда : http://testingbenfordslaw.com/
Статья В. Арнольда из журнала Квант http://kvant.mccme.ru/pdf/1998/01/kv0198arnold.pdf