การจำแนกเชิงสถิติ

จาก testwiki
รุ่นแก้ไขเมื่อ 15:33, 8 พฤศจิกายน 2567 โดย imported>JasperBot (แทนที่ {lang-??} ด้วย {langx|??})
(ต่าง) ←รุ่นแก้ไขก่อนหน้า | รุ่นแก้ไขล่าสุด (ต่าง) | รุ่นแก้ไขถัดไป→ (ต่าง)
ไปยังการนำทาง ไปยังการค้นหา

แม่แบบ:Machine learning bar

ในวิทยาการคอมพิวเตอร์ การจำแนกเชิงสถิติ (แม่แบบ:Langx) เป็นปัญหาพื้นฐานของการเรียนรู้แบบมีผู้สอน โดยปัญหาคือการทำนายประเภทของวัตถุจากสมบัติต่าง ๆ ของวัตถุ ซึ่งการเรียนรู้แบบมีผู้สอนจะสร้างฟังก์ชันเชื่อมโยง ระหว่างสมบัติของวัตถุ กับประเภทของวัตถุจากตัวอย่างข้อมูลสำหรับฝึกสอน แล้วจึงใช้ฟังก์ชันนี้ทำนายประเภทของวัตถุที่ไม่เคยพบ เครื่องมือหรือขั้นตอนวิธีที่ใช้สำหรับการจำแนกประเภทของข้อมูลในเชิงสถิติ ได้แก่ โครงข่ายประสาทเทียม ต้นไม้ตัดสินใจ

นิยามของปัญหา

กำหนดตัวอย่างสอน E={(x1,y1),(x2,y2),,(xn,yn)} ให้ xi เป็นเวกเตอร์แสดงคุณสมบัติของวัตถุ ซึ่ง xiA1×A2××Am โดยที่ Ai เป็นเซตจำกัดระบุคุณสมบัติ และ yC เป็นประเภทของวัตถุ ซึ่งกำหนดไว้ในเซตจำกัด C ต้องการหาฟังก์ชัน f(x) ซึ่งให้ค่า y จากเวกเตอร์ x ที่กำหนด โดยที่ความผิดพลาดของการทำนายตัวอย่างสอนมีค่าน้อยที่สุด หรือมีค่า e น้อยที่สุด โดยกำหนด e=i=1nt(f(xi),yi) ซึ่ง t(a,b)={0,if a=b1,if ab แม่แบบ:โครงคอมพิวเตอร์