Значения вероятностей появления первой цифры
(Закон аномальных чисел)
p = lg (n + 1) – lg (n)
Цифра | Частота появления первой цифры по Бенфорду |
Pi = log (1+1/ i ) | |
1 | 0,30103 |
2 | 0,17609 |
3 | 0,12494 |
4 | 0,9691 |
5 | 0,07918 |
6 | 0,06695 |
7 | 0,05799 |
8 | 0,05115 |
9 | 0,04576 |
Характеристика видов анализа числовых массивов
Вид анализа проверки числовых массивов на соответствие закону Бенфорда | Характеристика вида анализа |
Анализ частоты первой цифры | Применяется непосредственно сам закон Бенфорда. |
Анализ частоты первой и второй цифры | При использовании данного теста отдельно проверяется частота цифры от 1 до 9 на первой позиции и частота цифры от 0 до 9 на второй. После составляется таблица соответствий, которая анализируется на отличие частоты цифр от эталонной последовательности Бенфорда. |
Анализ дублей | Данный метод опирается только на методологию Бенфорда, а не на сам закон. Проверка выявляет частоту числовых повторов в большом количестве документации. Числа, которые повторяются в исследуемых данных, сортируются в зависимости от частоты повторений, а далее проверяется уплотнения повторов ряда чисел. |
Анализ первой пары цифр | Фактически представляет собой усовершенствованный второй тест, так как он исследует частоту появления цифр в начале числа не от 1 до 9, а от 10 до 99. Наиболее удобно использовать в графическом виде. |
Анализ первой тройки цифр | Метод, более точный в сравнении с первым, вторым и четвертым тестами. Программа анализирует частоту первой тройки цифр от 100 до 999 в изучаемой числовой последовательности. Данный метод используют при проверке большого объема информации |
Анализ округлений | Тест проводится для проверки частоты последних значащих цифр анализируемой числовой последовательности. Тест позволяет выявить несоответствующую эталону закона Бенфорда частоту постоянного округления в большую или меньшую сторону |