O que é um algoritmo de k-vizinho mais próximo?

O algoritmo k-vizinho mais próximo (k-NN) é um tipo de algoritmo de aprendizado supervisionado usado para tarefas de classificação e regressão. É um algoritmo não paramétrico que não faz nenhuma suposição sobre a distribuição de dados subjacentes.

Em k-NN, o algoritmo seleciona os k pontos de dados mais próximos de um determinado ponto de teste com base em alguma medida de similaridade (tipicamente a distância euclidiana). Esses pontos de dados selecionados são usados ​​para prever a classe ou o valor do ponto de teste.

Por exemplo, em uma tarefa de classificação com duas classes (como classificação binária), a classe prevista de um ponto de teste é a classe majoritária entre os k vizinhos mais próximos. Em uma tarefa de regressão, o valor previsto é a média dos valores dos k vizinhos mais próximos.

A escolha de k (o número de vizinhos a serem considerados) é um hiperparâmetro que pode ser ajustado para otimizar o desempenho em determinada tarefa.

Data de publicação: