什么是 k 最近邻算法?

k 最近邻算法 (k-NN) 是一种用于分类和回归任务的监督学习算法。它是一种非参数算法,不对底层数据分布做出任何假设。

在 k-NN 中,该算法根据某种相似性度量(通常是欧氏距离)选择与给定测试点最近的 k 个数据点。然后使用这些选定的数据点来预测测试点的类别或值。

例如,在具有两个类的分类任务(例如二元分类)中,测试点的预测类是 k 个最近邻中的多数类。在回归任务中,预测值是 k 个最近邻值的平均值。

k 的选择(要考虑的邻居数量)是一个超参数,可以对其进行调整以优化给定任务的性能。

Publication date: