Benford Yasası

0
300

Ekonomi verileri, döviz kurları, istihdam rakamları derken 2019 sonu itibariyle hayatımıza giren pandemi istatistikleriyle, rakamlarla mücadelemiz hızla devam ediyordu. Ortalama bir vatandaş hem vaka/vefat istatistikleri hakkında yorum yapabiliyorken hem de Bitcoin hesaplamalarıyla alakalı analizlerini cesurca paylaşabiliyordu. Eskiden her konuda konuşabilen esnaflar olarak berber ve taksi şoförleri gösterilirken, bugün her meslek grubu istatistik biliminin üstadı konumunda. İstatistikçilerin en az konuşması ise bize özgü bir talihsizlik. Son 20 yıl, hayatımızın her alanında matematik öğretilerinin ne kadar önemli olduğunu suratımıza vura vura öğretiyor ve matematik her anımıza yön veriyor. Reportare’deki bu yazımızda özellikle denetçilerin tutarsız rakamları fark edebilmek için sıklıkla kullandığı bir yöntem olan “Benford Yasası”na göz atacağız.

Benford Yasası 1938’de Frank Benford tarafından ortaya koyulmuş bir yasadır. Esasında 1881 yılında Amerikalı astronom Simon Newcomb tarafından ortaya atılmış ancak üzerinde fazla durulmadığından olsa gerek teorem Frank Benford ile anılmaya başlamıştır. Simon Newcomb’un yasayı buluş hikâyesi de çok ilginç. Newcomb logaritma kitabına bakarken ilk sayfaların, 1 ile başlayan rakamların daha fazla olmasından dolayı son sayfalarından daha fazla yıprandığını fark ediyor. Bunun elindeki kitaba özel bir durum olduğunu düşünerek kütüphaneden başka bir kitap alıyor ve o kitapta da aynı durumu fark ediyor. Kısacası dağılımların homojen olmadığı fikri burada çıkıyor. Daha sonra Frank Benford bu durumu düzenli bir formata oturtuyor. Bu yasaya göre günlük hayatta kullandığımız bütün veri setlerinde rakamlar düzensiz olarak dağılmıştır. Başka bir deyişle kendiliğinden oluşan, yapay olarak oluşturulmamış kümelerdeki sayıların ilk basamağında 1 olma ihtimali 9 olma ihtimalinden çok daha yüksektir. Daha da basit bir anlatımla karıncalar fillerden sayıca fazladır. Benford yapmış olduğu sağlamalarda tüm veri grubu içinde yaklaşık olarak 1 ile başlayan sayıların oranını %30, 2 ile başlayanların %18, 3 ile başlayanların %12, 4’lerin %10, 5’lerin %8, 6’ların %7, 7’lerin %6, 8’lerin %5 ve 9 ile başlayanların %5’in altında gerçekleştiğini hesaplamıştır. Dünya üzerinde kendiliğinden yani doğal yolla oluşan tüm rakam grupları bu yasaya uymaktadır. Örneğin Benford’ın yaptığı 335 verilik nehirler ve yüzölçümü çalışmasında 1 ile başlayanlar %31 olarak hesaplanmıştır.

Elinizde bir data seti varsa bunu rahatlıkla deneyebilirsiniz. Bir ülkenin şehir nüfus sayılarını ya da son 10 yılın hisse senetleri rakamlarını alıp ilk rakamlarını süzdüğünüzde 1 ile başlayan sonuçların %30 civarında olduğunu rahatlıkla görebilirsiniz. 1 ile 999.999 rakamları arasında 1 ile başlayan rakamların oranı %30 bandındadır. Bu sabit değerler bizlere bazı ipuçları veriyor ve Benford yasasının denetçilerin dünyasındaki rolü de burada başlıyor. Eğer bir veri grubu Benford yasasına uymuyorsa yüksek ihtimalle oynanmıştır. Buradaki yüksek ihtimalle kısmı veri kümesinin alt veya üst limitinin olmaması ya da belirli bir rakam grubunun belirlenmemesi anlamındadır. Mesela cep telefonu listenizdeki rakamlarla Benford yasası uyuşmayacaktır. Doğal yollarla oluşan rakam grupları Benford Yasasına uyma eğilimindelerdir. Ancak konunun bu bölümlerinde hemen aklımıza şu soru geliyor. Şans oyunlarında Benford yasasından yararlanabilir miyiz? Cevap: Hayır. Benford yasası, sayıların belirli hanelerinde her bir rakam için rakamların rastlanma olasılıklarını öngören bir matematik kuralıdır. Mark Nigrini bu durumu şu şekilde açıklar; “Bir piyangoda, kavanoz veya benzeri bir şeyden toplar çekilir. Toplar gerçekte sayı değillerdir, sayı ile etiketlenmişlerdir. Fakat hayvan adları ile de etiketlenebilirlerdi. Temsil ettiği sayılar tekdüze dağılıma sahiptir, her sayının eşit şansı vardır ve Benford Kanunu tekdüze dağılımlara uygulanmaz.” Yani çok heyecanlanmayın.

Netflix’te “Connected” isimli belgeselin 4.bölümü tamamen Benford yasasını anlatıyor. Sosyal medya kullanıcılarının gerçek olup olmadığına, seçim sonuçlarında yapılabilecek afacanlıklardan, jeolojik değerlerin yasayı sağlayıp sağlamadığına kadar birçok noktada harika bilgiler veriyor. Bu bilgiler ışığında Dünya ve ülkemiz özelindeki pandemi verileri sizce Benford yasasına uyuyor mu?

Kaynak:

https://dergipark.org.tr/en/download/article-file/287530