1. Mô hình phân lớp là gì?
Một mô hình phân lớp là một quy mô Machine Learning dùng để phân nhiều loại các thứ chủng loại dựa trên các đặc tính đang xác định.
Bạn đang xem: Naive bayes là gì
2. Mô hình phân lớp Naive sầu Bayes
Naive Bayes là 1 trong thuật toán phân lớp được mô hình hoá dựa trên định lý Bayes trong Tỷ Lệ thống kê:

Ở trên đây, X là vector các đặc trưng, hoàn toàn có thể viết dưới dạng:

lúc đó, đẳng thức Bayes trở thành:

Trong mô hình Naive sầu Bayes, có nhì trả thiết được đặt ra:
Các đặc thù chuyển vào quy mô là chủ quyền với nhau. Tức là việc chuyển đổi cực hiếm của một đặc thù ko tác động đến những đặc thù sót lại.Các đặc thù chuyển vào mô hình bao gồm ảnh hưởng ngang bằng đối với cổng output mục tiêu.lúc đó, tác dụng phương châm y nhằm P(y|X) đạt cực to trsinh sống thành:

Chính vì nhì trả thiết gần như là không mãi mãi trong thực tế trên, mô hình này mới được hotline là naive (nkhiến thơ). Tuy nhiên, chính vì sự đơn giản và dễ dàng của nó cùng với việc dự đoán thù rất nkhô nóng tác dụng cổng đầu ra khiến nó được sử dụng rất nhiều vào thực tiễn bên trên đông đảo bộ tài liệu bự, đem đến hiệu quả khách quan. Một vài vận dụng của Naive Bayes rất có thể nói tới như: thanh lọc thư rác rưởi, phân nhiều loại văn uống phiên bản, dự đoán thù sắc đẹp thái văn bạn dạng, ...
3. Một số vẻ bên ngoài quy mô Naive sầu Bayes
3.1. Multinomial Naive Bayes
Mô hình này đa phần được áp dụng vào phân các loại vnạp năng lượng bạn dạng. không giống nhau nguồn vào tại chỗ này đó là gia tốc xuất hiện của tự vào vnạp năng lượng bản đó.
3.2. Bernoulli Naive Bayes
Mô hình này được áp dụng khi các đặc trưng nguồn vào chỉ dìm cực hiếm nhị phân 0 hoặc 1 (phân bố Bernoulli).
3.3. Gaussian Naive Bayes
lúc các đặc thù dấn quý giá liên tiếp, ta đưa sử các đặc thù đó gồm phân phối Gaussian. khi kia, likelihood sẽ có được dạng:

4. Ví dụ
Xét một bộ dữ liệu đơn giản về câu hỏi đi làm muộn của một chúng ta nhân viên cấp dưới. Sở dữ liệu được màn trình diễn dạng bảng bên dưới đây:
1 | Sớm | Tốt | Nắng | Không |
2 | Sớm | Xấu | Mưa | Không |
3 | Bình thường | Tốt | Nắng | Có |
4 | Muộn | Xấu | Nắng | Có |
5 | Sớm | Xấu | Nhiều mây | Không |
6 | Bình thường | Xấu | hầu hết mây | Không |
7 | Muộn | Tốt | Nắng | Có |
8 | Bình thường | Tốt | Nắng | Không |
9 | Sớm | Xấu | Nhiều mây | Có |
10 | Muộn | Tốt | Mưa | Có |
Bằng câu hỏi lập bảng tần suất (frequency table) mang lại từng đặc thù theo kim chỉ nam, có thể tính được likelihood P(X|y).
Giờ dậy (x1)
Sớm | 1 | 3 | 1/5 | 3/5 |
Bình thường | 1 | 2 | 1/5 | 2/5 |
Muộn | 3 | 0 | 3/5 | 0/5 |
Sức khoẻ (x2)
Tốt | 3 | 2 | 3/5 | 2/5 |
Xấu | 2 | 3 | 2/5 | 3/5 |
Thời huyết (x3)
Nắng | 3 | 2 | 3/5 | 2/5 |
phần lớn mây | 1 | 2 | 1/5 | 2/5 |
Mưa | 1 | 1 | 1/5 | 1/5 |
Giả sử, để dự đoán cho một ngày X=(Muộn, Xấu, Mưa), yêu cầu tính:
P(Muộn|X) ∝ P(Muộn|Muộn) * P(Xấu|Muộn) * P(Mưa|Muộn) * P(Muộn) = (3/5) * (2/5) * (1/5) * (5/10) = 0.024
P(Không muộn|X) ∝ P(Muộn|Không muộn) * P(Xấu|Không muộn) * P(Mưa|Không muộn) * P(Không muộn) = (0/5) * (3/5) * (1/5) * (5/10) = 0
=> y = argmax P(X = Muộn.
Vì vậy, giả dụ anh chàng nhân viên thấy báo thức reo rồi hơn nữa chũm ngủ thêm 15 phút, dịp dậy thân thể uể oải, chú ý ra ngoài trời thấy vẫn mưa, thì năng lực rất cao là lúc này có khả năng sẽ bị trừ lương.
4. Kết luận
Mô hình Naive Bayes là mô hình phân lớp dễ dàng dễ dàng setup, bao gồm vận tốc xử lý nkhô nóng. Tuy nhiên tất cả nhược điểm béo là hưởng thụ các đặc trưng nguồn vào nên hòa bình, nhưng mà điều này khó xảy ra vào thực tiễn làm cho sút quality của quy mô. Thuật tân oán này thường xuyên được áp dụng trong so sánh nhan sắc thái, lọc thỏng rác rưởi, recommendation systems, ...