Curso oferecido por Kevin Markham na Data School
O KNN é um algoritmo de classificação supervisionado. O valor K define quantas observações próximas ao dado que queremos classificar serão levadas em conta na classificação.
StatQuest: K-nearest neighbors, Clearly Explained
Vamos utilizar neste exemplo o Iris Dataset
from sklearn.datasets import load_iris
# dataset
iris = load_iris()
# features
X = iris.data
# target data
y = iris.target
from sklearn.neighbors import KNeighborsClassifier
# instance of KNN
knn = KNeighborsClassifier(n_neighbors=1)
O argumento n_neighbors
define o valor K do modelo KNN
Tendo cumprido os 4 requisitos para trabalhar com os dados, podemos treinar o modelo KNN