การจำแนกเชิงสถิติ

แม่แบบ:Machine learning bar

ในวิทยาการคอมพิวเตอร์ การจำแนกเชิงสถิติ (แม่แบบ:Langx) เป็นปัญหาพื้นฐานของการเรียนรู้แบบมีผู้สอน โดยปัญหาคือการทำนายประเภทของวัตถุจากสมบัติต่าง ๆ ของวัตถุ ซึ่งการเรียนรู้แบบมีผู้สอนจะสร้างฟังก์ชันเชื่อมโยง ระหว่างสมบัติของวัตถุ กับประเภทของวัตถุจากตัวอย่างข้อมูลสำหรับฝึกสอน แล้วจึงใช้ฟังก์ชันนี้ทำนายประเภทของวัตถุที่ไม่เคยพบ เครื่องมือหรือขั้นตอนวิธีที่ใช้สำหรับการจำแนกประเภทของข้อมูลในเชิงสถิติ ได้แก่ โครงข่ายประสาทเทียม ต้นไม้ตัดสินใจ

นิยามของปัญหา

กำหนดตัวอย่างสอน $E = {(x_{1}, y_{1}), (x_{2}, y_{2}), \dots, (x_{n}, y_{n})}$ ให้ $x_{i}$ เป็นเวกเตอร์แสดงคุณสมบัติของวัตถุ ซึ่ง $x_{i} \in A_{1} \times A_{2} \times \dots \times A_{m}$ โดยที่ $A_{i}$ เป็นเซตจำกัดระบุคุณสมบัติ และ $y \in C$ เป็นประเภทของวัตถุ ซึ่งกำหนดไว้ในเซตจำกัด $C$ ต้องการหาฟังก์ชัน $f (x)$ ซึ่งให้ค่า $y$ จากเวกเตอร์ $x$ ที่กำหนด โดยที่ความผิดพลาดของการทำนายตัวอย่างสอนมีค่าน้อยที่สุด หรือมีค่า $e$ น้อยที่สุด โดยกำหนด $e = \sum_{i = 1}^{n} t (f (x_{i}), y_{i})$ ซึ่ง $t (a, b) = {\begin{matrix} 0, if a = b \\ 1, if a \neq b \end{matrix}$ แม่แบบ:โครงคอมพิวเตอร์

การจำแนกเชิงสถิติ

นิยามของปัญหา

รายการนำทางไซต์

ค้นหา