แบบจำลองจำแนก

จาก testwiki
รุ่นแก้ไขเมื่อ 05:14, 5 ตุลาคม 2567 โดย imported>Phyblas
(ต่าง) ←รุ่นแก้ไขก่อนหน้า | รุ่นแก้ไขล่าสุด (ต่าง) | รุ่นแก้ไขถัดไป→ (ต่าง)
ไปยังการนำทาง ไปยังการค้นหา

แบบจำลองจำแนก (discriminative model) หรือ แบบจำลองมีเงื่อนไข (conditional model) เป็นแบบจำลองโลจิสติกประเภทหนึ่งที่ใช้สำหรับ การจำแนกประเภทข้อมูล และ การวิเคราะห์การถดถอย แบบจำลองเหล่านี้กำหนดขอบเขตการตัดสินตามข้อมูลที่สังเกตได้ เช่น "ผ่าน/ไม่ผ่าน" "ชนะ/แพ้" "มีชีวิต/ตาย" "สุขภาพดี/เจ็บป่วย" ฯลฯ

ตัวอย่างของแบบจำลองจำแนกทั่วไป ได้แก่ การถดถอยโลจิสติก, สนามสุ่มมีเงื่อนไข และ ต้นไม้ตัดสินใจ เป็นต้น

ในทางกลับกัน ตัวอย่างทั่วไปของแบบจำลองก่อกำเนิด ได้แก่ ตัวจำแนกเบส์อย่างง่าย, ตัวเข้ารหัสอัตโนมัติแบบแปรผัน และ โครงข่ายปฏิปักษ์ก่อกำเนิด เป็นต้น

นิยาม

แบบจำลองจำแนกนั้นจะทำการวิจัยโดยเน้นไปที่การแจกแจงความน่าจะเป็นมีเงื่อนไข P(y|x) ของฉลากจำแนกประเภท y ที่ได้จากตัวแปรที่สังเกตการณ์ได้ (ตัวอย่างที่ใช้ฝึกสอน) สำหรับตัวแปรเป้าหมาย x ที่ไม่ได้สังเกตการณ์

นี่เป็นข้อที่แตกต่างไปจากแบบจำลองก่อกำเนิดซึ่งเน้นไปที่การศึกษาการแจกแจงความน่าจะเป็นร่วม P(x,y)

ตัวอย่างเช่น ในการรู้จำวัตถุนั้น โดยทั่วไป x จะแสดงถึงพิกเซลดิบของรูปภาพหรือเวกเตอร์ของสมบัติที่สกัดเอาจากพิกเซลดิบของรูปภาพ การสร้างแบบจำลองของการแจกแจงความน่าจะเป็นมีเงื่อนไขภายในกรอบตามทฤษฎีความน่าจะเป็น P(y|x) จะช่วยให้สามารถทำนาย y จาก x ได้

เปรียบเทียบแบบจำลองจำแนกและแบบจำลองก่อกำเนิด

สมมุติว่าตัวอย่างสำหรับฝึกเป็นข้อมูลที่มีป้ายกำกับจำแนกประเภท m ตัว และตัวแปรค่าลักษณะ n ตัว Y:{y1,y2,,ym},X:{x1,x2,,xn}

ในแบบจำลองก่อกำเนิดจะใช้ความน่าจะเป็นร่วม P(x,y) ของค่าป้อนเข้า x และฉลาก y และใช้ ทฤษฎีบทของเบส์ ในการทำนายฉลาก y~Y ที่รู้แล้วที่เป็นไปได้ที่สุดสำหรับค่าป้อนเข้า x~ ที่ไม่รู้จัก[1]

ในทางกลับกัน แบบจำลองจำแนกไม่สามารถสร้างตัวอย่างจากการแจกแจงร่วมของตัวแปรที่สังเกตได้และตัวแปรเป้าหมาย แต่จะทำงานได้ดีกว่าแบบจำลองกำเนิดสำหรับงานต่าง ๆ เช่น การจำแนกประเภทข้อมูล และ การวิเคราะห์การถดถอย ซึ่งไม่ต้องการการแจกแจงร่วม โดยเหตุผลหนึ่งก็คือ มีตัวแปรสำหรับคำนวณน้อยกว่า[2][3][1] โดยทั่วไปแล้ว แบบจำลองก่อกำเนิดจะมีความยืดหยุ่นต่อปัญหาหารเรียนรู้ที่ซับซ้อนมากกว่า นอกจากนี้ แบบจำลองจำแนกส่วนใหญ่มักใช้การเรียนรู้แบบมีผู้สอน และไม่รับรองการเรียนรู้แบบไม่มีผู้สอน

การเลือกระหว่างแบบจำลองจำแนก และแบบจำลองก่อกำเนิดนั้น ขึ้นอยู่กับความจำเป็นของการใช้งานเฉพาะนั้น ๆ แบบจำลองจำแนกและแบบจำลองก่อกำเนิดมีความแตกต่างกันตรงที่วิธีการหาความน่าจะเป็นภายหลัง[4] ในแบบจำลองจำแนกทำนายความน่าจะเป็นภายหลัง P(y|x) จากแบบจำลองอิงตัวแปรเสริม และได้ค่าพารามิเตอร์จากข้อมูลการฝึกสอน การประมาณค่าพารามิเตอร์ได้มาจากการหาค่าภาวะน่าจะเป็นสูงสุดหรือการคำนวณการแจกแจงสำหรับพารามิเตอร์ ในทางกลับกัน แบบจำลองก่อกำเนิดมุ่งเน้นไปที่ความน่าจะเป็นร่วม และคำนวณความน่าจะเป็นภายหลัง P(k) โดยทฤษฎีบทของเบส์ ดังนั้น ความน่าจะเป็นภายหลังคือ

P(y|x)=p(x|y)p(y)ip(x|i)p(i)=p(x|y)p(y)p(x) [4]

อ้างอิง

แม่แบบ:รายการอ้างอิง

  1. 1.0 1.1 แม่แบบ:Cite book
  2. แม่แบบ:Cite journal
  3. J. Lafferty, A. McCallum, and F. Pereira. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data. In ICML, 2001.
  4. 4.0 4.1 แม่แบบ:Cite web