การถดถอยโลจิสติก

จาก testwiki
ไปยังการนำทาง ไปยังการค้นหา

การถดถอยโลจิสติก (logistic regression) เป็นรูปแบบหนึ่งของแบบจำลองการวิเคราะห์การถดถอยสำหรับตัวแปรที่เป็นไปตามการแจกแจงแบร์นุลลี นอกจากนี้ยังเป็นตัวแบบเชิงเส้นนัยทั่วไป ประเภทหนึ่งที่ใช้ลอจิตเป็นฟังก์ชันถ่ายโอน ตีพิมพ์โดยเดวิด ค็อกซ์ ในปี 1958[1] เป็นวิธีการวิเคราะห์การถดถอยแบบหนึ่งที่มักใช้การจำแนกประเภทข้อมูลในทางสถิติศาสตร์

แบบจำลองนี้เทียบเท่ากับเพอร์เซปตรอนแบบง่ายซึ่งได้ตีพิมพ์ในปี 1958 ด้วย อย่างไรก็ตาม ในไลบรารีการเรียนรู้ของเครื่อง เช่น scikit-learn ฯลฯ แบบจำลองที่ใช้การเคลื่อนลงตามความชันแบบเฟ้นสุ่มในการกำหนดพารามิเตอร์ในปัญหาการหาค่าเหมาะที่สุดจะถูกเรียกว่า "เพอร์เซปตรอน" ในขณะที่แบบจำลองที่ใช้ การสืบสายพิกัด หรือ วิธีการนิวตันเสมือน จึงจะถูกเรียกว่า "การถดถอยโลจิสติก"

ภาพรวม

ให้ x เป็นข้อมุลป้อนเข้า p เป็นความน่าจะเป็น (ค่าขาออก) และ α และ β เป็นพารามิเตอร์ แบบจำลองการถดถอยโลจิสติกจะแสดงได้ดังต่อไปนี้

logit(pi)=ln(pi1pi)=α+β1x1,i++βkxk,i,
i=1,,n,

ในที่นี้มี n หน่วยและความแปรปรวนร่วม X และความสัมพันธ์เป็นดังนี้

pi=E(Y|Xi)=Pr(Yi=1).

ลอการิทึมของอัตราส่วนออดส์ของผลลัพธ์ จำลองเป็นฟังก์ชันเชิงเส้นของตัวแปรอธิบาย X i สามารถแสดงได้ดังนี้

pi=Pr(Yi=1|X)=11+e(α+β1x1,i++βkxk,i)เมื่อใช้สัญลักษณ์เพอร์เซพตรอนอย่างง่าย สมการข้างต้นสามารถแสดงได้ดังต่อไปนี้

pi=ς1(α+β1x1,i++βkxk,i)

โดยในที่นี้ ς1 เป็นฟังก์ชันซิกมอยด์มาตรฐาน

การประมาณค่าพารามิเตอร์ส่งผลอย่างมากต่ออัตราส่วนออดส์ สำหรับตัวแปรอธิบายที่เป็นได้ 2 ค่า เช่น เพศ แล้ว eβ เช่น การประมาณอัตราส่วนออดส์ของผลลัพธ์สำหรับชายและหญิง ในการประมาณค่ามักใช้วิธีภาวะน่าจะเป็นสูงสุด

อ้างอิง

แม่แบบ:รายการอ้างอิง