ขอบเขตเชอร์นอฟ

จาก testwiki
ไปยังการนำทาง ไปยังการค้นหา

แม่แบบ:ต้องการอ้างอิง ขอบเขตเชอร์นอฟ (แม่แบบ:Langx) ตั้งตามชื่อของ เฮอร์มาน เชอร์นอฟ (Herman Chernoff) ในทฤษฎีความน่าจะเป็น จะเป็นกลุ่มของข้อความทางคณิตศาสตร์ที่ให้ขอบเขตบนของส่วนปลายของการกระจายความน่าจะเป็น ชื่อของอสมการนั้นตั้งเพื่อเป็นเกียรติแก่ เฮอร์แมน เชอร์นอฟ นักคณิตศาสตร์ สถิติ และฟิสิกส์ ชาวอเมริกัน ขอบเขตเชอร์นอฟใช้ข้อมูลจากโมเมนต์ทั้งหมดของตัวแปรสุ่ม ดังนั้นโดยทั่วไปแล้วจึงให้ขอบเขตที่กระชับกว่าอสมการของมาร์คอฟ (ในรูปพื้นฐาน) และอสมการของเชบิเชฟมาก

รูปทั่วไป

ให้ X เป็นตัวแปรสุ่มใด ๆ แล้ว

Pr[Xa]  inft>0etaX(t)

โดยที่

X(t)=E[etX] คือ ฟังก์ชันก่อกำเนิดโมเมนต์ (moment generating function)

การพิสูจน์

สำหรับค่าคงที่บวก t ใด ๆ etx เป็นฟังก์ชันเพิ่มที่มีค่าบวกเสมอ ดังนั้น Xa ก็ต่อเมื่อ etXeta

เมื่อมอง etX เป็นตัวแปรสุ่มและใช้อสมการของมาร์คอฟ เราได้ว่า

Pr[Xa]=Pr[etXeta]E[etX]eta=etaX(t)

เนื่องจากข้อความข้างต้นเป็นจริงสำหรับทุก ๆ จำนวนจริงบวก t มันจึงเป็นจริงสำหรับ t ที่ทำให้ etaX(t) มีค่าต่ำสุดด้วย เพราะฉะนั้น

Pr[Xa]inft>0etaX(t)

ตามต้องการ

ขอบเขตเชอร์นอฟของการทดลองแบบปัวซง

ในส่วนนี้จะกล่าวถึงการหาขอบเขตเชอร์นอฟในกรณีที่ที่ตัวแปรสุ่มอันเป็นผลบวกของการทดลองแบบปัวซงซึ่งเป็นอิสระแก่กัน กรณีพิเศษของขอบเขตเชอร์นอฟแบบนี้ถูกใช้อย่างแพร่หลายในการวิเคราะห์ขั้นตอนวิธีแบบสุ่ม โดยเฉพาะในการพิสูจน์ว่าขั้นตอนวิธีแบบสุ่มหนึ่ง ๆ จะทำงานได้ดีด้วยความน่าจะเป็นสูง สาเหตุที่ขอบเขตเชอร์นอฟเป็นเทคนิคที่เหมาะสมต่อการวิเคราะห์ขั้นตอนวิธีแบบสุ่มนั้น อาจเพราะว่า โดยทั่วไปเราสามารถมองขั้นตอนวิธีแบบสุ่มว่า เป็นขั้นตอนวิธีที่ใช้การโยนเหรียญที่เป็นอิสระต่อกันหลาย ๆ ครั้งในการตัดสินใจ

ขอบเขตของเชอร์นอฟในกรณีนี้นั้นไม่สมมาตร ดังนั้นในการใช้งานจะมีขอบเขตทั้งของ ส่วนปลายด้านบน ซึ่งจะใช้สำหรับกรณีที่ต้องการหาขอบเขตบนในกรณีที่ตัวแปรสุ่มมีค่ามากกว่าค่าคาดหมาย และ ส่วนปลายด้านล่าง ในกรณีที่พิจารณาเหตุการณ์ที่ตัวแปรสุ่มมีค่าน้อยกว่าค่าคาดหมาย

ใจความ

ให้ n เป็นจำนวนเต็มบวก และ Xi สำหรับจำนวน 1in เป็นการทดลองแบบปัวซงที่เป็นอิสระแก่กันโดยที่ Pr[Xi=1]=pi และ 0<pi<1 กำหนด X=i=1nXi และให้ μ=E[X] และ δ เป็นจำนวนจริงใด ๆ ที่มีค่ามากกว่า 0 แล้ว:

1. (ส่วนปลายด้านบน)

Pr[X>(1+δ)μ]<(eδ(1+δ)1+δ)μ

2. (ส่วนปลายด้านล่าง) เมื่อ 0<δ1

Pr[X>(1δ)μ]<(eδ(1δ)1δ)μ

การพิสูจน์

เราเริ่มจากการพิสูจน์ส่วนปลายด้านบน จากรูปทั่วไป

Pr[X>(1+δ)μ]<inft>0et(1+δ)μX(t)

พิจารณา X(t)=E[etX] เราได้ว่า etX=etX1++tXn=i=1netXi เนื่องจากตัวแปรสุ่ม X1, X2, , Xn เป็นอิสระแก่กัน เราได้ว่า

X(t)=E[i=1netXi]=i=1nE[etXi]=i=1n(piet+(1pi))=i=1n(1+pi(et1))

เพราะว่า 1+x<ex สำหรับจำนวนจริงบวก x ทุกจำนวน เราได้ว่า

X(t)=i=1n(1+pi(et1))<i=1nepi(et1)=e(et1)(p1++pn)=e(et1)μ

เนื่องจาก p1++pn=E[X1]++E[Xn]=E[X1++Xn]=E[X]=μ ดังนั้น

et(1+δ)μX(t)<e(et1)μet(1+δ)μ=(eet1et(1+δ))μ=(eettδt1)μ

กำหนดฟังก์ชัน f(t)=eettδt1 เราได้ว่า f(t)=(etδ1)f(t) และ f(t)=((etδ1)2+et)f(t)

สมมติให้ f(t)=0 เราได้ว่า t=ln(1+δ) และ f(t)=((1+δ)2+1+δ)f(ln(1+δ))>0 เพราะฉะนั้น f(t) จึงมีค่าต่ำสุดสัมบูรณ์ที่ t=ln(1+δ) เราจึงได้ว่า

Pr[X>(1+δ)μ]<inft>0et(1+δ)μX(t)<inft>0f(t)μ=f(ln(1+δ))μ=(eδ(1+δ)1+δ)μ

ตามต้องการ

สำหรับส่วนปลายด้านล่างนั้น เราเริ่มจากสังเกตว่า X<(1δ)μ ก็ต่อเมื่อ X>(1δ)μ เมื่อใช้รูปทั่วไปของขอบเขตเชอร์นอฟ ได้ว่า

Pr[X<(1δ)μ]<inft>0e(1δ)μE[etX]

เมื่อใช้การให้เหตุผลแบบเดียวกับการพิสูจน์ส่วนปลายด้านบน เราได้ว่า

Pr[X<(1δ)μ]<inft>0(eet1et(1δ))μ

ค่าต่ำสุดของฟังก์ชันทางด้านขวามือของอสมการอยู่ที่ t=ln(1/(1δ)) ฉะนั้น

Pr[X<(1δ)μ]<(eδ(1δ)1δ)μ

ตามต้องการ

รูปแบบอื่น ๆ

รูปแบบทั้งสองข้างต้นเป็นรูปแบบที่ให้ขอบเขตที่แน่นที่สุดของขอบเขตเชอร์นอฟ อย่างไรก็ตาม รูปแบบทั้งสามแบบด้านล่างที่อาจมีเงื่อนไขเพิ่มเติม มักนำไปใช้ได้สะดวกกว่า

1. (ส่วนปลายด้านบน) ถ้า 0<t<2e1

Pr[X>(1+δ)μ]<eμδ2/4

และ สำหรับ δ>2e1

Pr[X>(1+δ)μ]<2(1+δ)μ

2. (ส่วนปลายด้านล่าง) ถ้า 0<δ1

Pr[X<(1δ)μ]<eμδ2/2

แม่แบบ:โครงคณิตศาสตร์