Klasyfikatory liniowe

Czym są klasyfikatory liniowe?

Klasyfikatory liniowe to modele uczenia maszynowego, które dokonują klasyfikacji na podstawie liniowej kombinacji cech. Decyzja modelu opiera się na hiperpłaszczyźnie (prostej w 2D, płaszczyźnie w 3D), która dzieli przestrzeń cech na obszary odpowiadające różnym klasom.

Modele liniowe są proste i efektywne, a ich zastosowanie jest szczególnie korzystne w przypadku dużych zbiorów danych o wysokiej liczbie wymiarów.

Równanie klasyfikatora liniowego

Decyzja klasyfikatora liniowego jest opisana wzorem: \[ y = w_1 x_1 + w_2 x_2 + \dots + w_n x_n + b \] Gdzie:

Dla klasyfikacji binarnej:

Przykłady klasyfikatorów liniowych

1. Regresja logistyczna

Zastosowania:

2. Support Vector Machine (SVM) z liniowym jądrem

Zastosowania:

3. Perceptron

Zastosowania:

4. Liniowa analiza dyskryminacyjna (LDA)

Zastosowania:

Zalety klasyfikatorów liniowych

Wady klasyfikatorów liniowych

Przykład zastosowania klasyfikatora liniowego: Regresja logistyczna

Problem:

Chcemy przewidzieć, czy klient kupi produkt (\(y = 1\)) na podstawie jego dochodu (\(x_1\)) i wieku (\(x_2\)).

Dane:

Dochód (\(x_1\)) Wiek (\(x_2\)) Zakup (\(y\))
30 25 0
50 35 1
70 40 1
40 30 0

Model:

Funkcja decyzyjna: \[ P(y = 1 \mid x_1, x_2) = \frac{1}{1 + e^{-(w_1 x_1 + w_2 x_2 + b)}} \]

Zakładamy:

Predykcja:

Dla klienta o dochodzie \(x_1 = 60\) i wieku \(x_2 = 30\): \[ z = 0.05 \cdot 60 + 0.02 \cdot 30 - 3 = 0 \] \[ P(y = 1 \mid x_1, x_2) = \frac{1}{1 + e^{0}} = 0.5 \]

Interpretacja: Model przewiduje 50% prawdopodobieństwo zakupu.

Klasyfikatory liniowe są podstawą eksploracji danych i uczenia maszynowego, oferując szybkie i skuteczne narzędzia do klasyfikacji i analizy danych.