กฎของเบนฟอร์ด

จาก testwiki
ไปยังการนำทาง ไปยังการค้นหา
ไฟล์:Rozklad benforda.svg
การกระจายของเลขโดดหลักแรกตามกฎของเบนฟอร์ด แต่ละแท่งแสดงเลขโดดหนึ่ง และความสูงของแท่งแสดงร้อยละของจำนวนซึ่งเริ่มต้นด้วยเลขโดดนั้น
ไฟล์:Benford-physical.svg
การลงจุดความถี่ของของเลขโดดนัยสำคัญหลักแรกของค่าคงตัวทางฟิสิกส์ (เขียว) เทียบกับกฎของเบนฟอร์ด (แดง)

กฎของเบนฟอร์ด (แม่แบบ:Langx) หรือ กฎเลขโดดตัวแรก หมายถึง ความถี่การกระจายเลขโดดในหลายแหล่งข้อมูลในชีวิตจริง (แต่ไม่ใช่ทั้งหมด) ในการกระจายนี้ ปรากฏว่าเลข 1 เป็นเลขหลักแรกมากถึงราว 30% ของทั้งหมด ขณะที่เลขมากกว่า 1 มีความถี่เป็นเลขหลักแรกน้อยกว่า โดยเลข 9 เป็นเลขหลักแรกน้อยกว่า 5% ของทั้งหมด กฎของเบนฟอร์ดยังว่าด้วยการกระจายคาดหมายของเลขโดดหลักอื่นด้วย ซึ่งมาใกล้การกระจายเป็นรูปแบบเดียวกัน

พบว่าผลลัพธ์นี้ใช้ได้กับชุดข้อมูลหลากหลาย รวมถึงใบแจ้งหนี้ไฟฟ้า ที่อยู่ถนน ราคาหลักทรัพย์ จำนวนประชากร อัตราตาย ความยาวแม่น้ำ ค่าคงตัวทางฟิสิกส์และคณิตศาสตร์ และกระบวนการซึ่งอธิบายด้วยกฎเลขยกกำลัง ซึ่งพบได้บ่อย กฎของเบนฟอร์ดมีแนวโน้มแม่นยำที่สุดเมื่อค่ามีการกระจายตัวที่หลากหลายอันดับของขนาด

กราฟที่แสดงขวามือแสดงกฎของเบนฟอร์ดสำหรับฐาน 10 มีนัยทั่วไปของกฎต่อจำนวนที่แสดงในฐานอื่น (เช่น ฐาน 16) และยังมีนัยทั่วไปตั้งแต่เลขโดดหลักแรกจนถึงเลขโดด n หลักแรก

กฎนี้ได้ชื่อตามนักฟิสิกส์ แฟรงก์ เบนฟอร์ด ซึ่งระบุใน ค.ศ. 1938[1] แม้ไซมอน นิวคอมบ์จะเคยระบุไว้ก่อนแล้วใน ค.ศ. 1881[2]

นิยาม

เซตของจำนวน เรียกว่าเป็นไปตามกฎของเบนฟอร์ด เมื่อหลักแรกสุด d มีการกระจายตามสูตรความน่าจะเป็น

P(d)=log10(d+1)log10(d)=log10(d+1d)=log10(1+1d)

ซึ่งคิดเป็นตัวเลขได้เป็น:

d P(d) ขนาดสัมพัทธ์ของ P(d)
1 แม่แบบ:Bartable
2 แม่แบบ:Bartable
3 แม่แบบ:Bartable
4 แม่แบบ:Bartable
5 แม่แบบ:Bartable
6 แม่แบบ:Bartable
7 แม่แบบ:Bartable
8 แม่แบบ:Bartable
9 แม่แบบ:Bartable

จากสูตรแสดงว่า โอกาส P(d) แปรผันตรงกับพื้นที่ระหว่าง d กับ d + 1 บนสเกลลอการิทึม ซึ่งตรงกับการที่ลอการิทึมของจำนวนมีการแจกแจงเอกรูป

ตัวอย่างเช่น จำนวน x ใด ๆ ที่ 1≤ x < 10 จะขี้นต้นด้วย 1 ถ้า 1 ≤ x < 2 และขึ้นต้นด้วย 9 ถ้า 9 ≤ x < 10 แต่จากการแจกแจงเอกรูปของลอการิทึม เราจึงคำนึงจากการที่ x ขี้นต้นด้วย 1 ถ้า log 1 ≤ log x < log 2 และขึ้นต้นด้วย 9 ถ้า log 9 ≤ log x < log 10 ซึ่งช่วง [log 1, log 2] มีขนาดกว้างกว่า [log 9, log 10] มาก (0.301 กับ 0.046 ตามลำดับ) จึงมีโอกาสสูงกว่าที่ x จะขึ้นต้นด้วย 1

กฎของเบนฟอร์ดในฐานอื่น ๆ

สูตรกฎของเบนฟอร์ดข้างต้น สามารถใช้ในฐาน b ≥ 2 ใด ๆ ได้โดยปรับลอการิทึมให้เป็นฐาน b เป็นสูตรทั่วไปว่า

P(d)=logb(d+1)logb(d)=logb(d+1d)=logb(1+1d)

ในกรณีฐานสอง กฎของเบนฟอร์ดกล่าวว่าทุกจำนวน (นอกจาก 0) ขึ้นต้นด้วย 1 ซึ่งเป็นจริงอย่างเห็นชัด

กฎของเบนฟอร์ดสำหรับหลักนอกเหนือจากหลักแรก

กฎของเบนฟอร์ดสามารถใช้กับหลักแรกมากกว่าหนึ่งหลัก[3] โดยโอกาสที่จำนวนจะขึ้นด้วยเลขหลายหลัก n คือ

P(d)=log10(n+1)log10(n)=log10(1+1n)

เช่น โอกาสที่จำนวนจะขึ้นต้นด้วย 314 คือ log10(1+1/314)0.00138

จากสูตรนี้ สามารถหาความน่าจะเป็นของเลขโดดในตำแหน่งที่ไม่ใช่หลักแรกได้ เช่น โอกาสที่จำนวนใด ๆ จะมี 3 อยู่ในตำแหน่งที่สอง เท่ากับโอกาสที่จำนวนนั้นจะขึ้นต้นด้วยจำนวนใด ๆ ใน {13, 23, ...93} เท่ากับ

log10(1+113)+log10(1+123)+...+log10(1+193)0.104

ในทำนองเดียวกัน โอกาสที่ d (d = 0, 1, 2, ...9) จะอยู้ในตำแหน่งที่ n เท่ากับ

k=10n210n11log10(1+110k+d)

ซึ่งเมื่อ n เพิ่มขึ้นการแจกแจงนี้จะขยับเข้าหาการแจกแจงเอกรูปอย่างรวดเร็วดังตาราง[4]

เลขโดด 0 1 2 3 4 5 6 7 8 9
ตำแหน่งที่ 1 N/A 30.1% 17.6% 12.5% 9.7% 7.9% 6.7% 5.8% 5.1% 4.6%
ตำแหน่งที่ 2 12% 11.4% 10.9% 10.4% 10% 9.7% 9.3% 9% 8.8% 8.5%
ตำแหน่งที่ 3 10.2% 10.1% 10.1% 10.1% 10% 10% 9.9% 9.9% 9.9% 9.8%

อ้างอิง

แม่แบบ:รายการอ้างอิง แม่แบบ:โครงคณิตศาสตร์

  1. แม่แบบ:Cite journal (subscription required)
  2. แม่แบบ:Cite journal (subscription required)
  3. Theodore P. Hill, "The Significant-Digit Phenomenon", The American Mathematical Monthly, Vol. 102, No. 4, (Apr., 1995), pp. 322–327. Official web link (subscription required). Alternate, free web link.
  4. Theodore P. Hill, "The Significant-Digit Phenomenon", The American Mathematical Monthly, Vol. 102, No. 4, (Apr., 1995), pp. 322–327. Official web link (subscription required). Alternate, free web link.