Tartalomjegyzék:
- Meghatározás - Mit jelent a legközelebbi szomszéd (K-NN)?
- A Techopedia magyarázza a K-legközelebbi szomszédot (K-NN)
Meghatározás - Mit jelent a legközelebbi szomszéd (K-NN)?
A k-legközelebbi szomszéd algoritmus, gyakran rövidítve k-nn, az adat besorolás megközelítése, amely megbecsüli, hogy az adatpont mennyire valószínű az egyik vagy másik csoport tagja, attól függően, hogy melyik csoportban vannak a hozzá legközelebbi adatpontok. .
A k-legközelebbi szomszéd egy "lusta tanuló" algoritmus példája, azaz nem épít fel modellt az edzéskészlet segítségével, amíg az adatkészlet lekérdezése nem kerül végrehajtásra.
A Techopedia magyarázza a K-legközelebbi szomszédot (K-NN)
A k-legközelebbi szomszéd egy olyan adat-osztályozási algoritmus, amely megkísérli meghatározni, hogy az adatpont melyik csoportba tartozik, a körülötte lévő adatpontok megnézésével.
Egy algoritmus, amikor egy rács egyik pontját megvizsgálja, hogy egy pont az A vagy B csoportba tartozik-e, megvizsgálja az ahhoz közeli pontok állapotát. A tartományt önkényesen határozzuk meg, de lényeg az, hogy mintát veszünk az adatokból. Ha a pontok többsége az A csoportban van, akkor valószínű, hogy a kérdéses adatpont A helyett B lesz, és fordítva.
A k-legközelebbi szomszéd egy példa a "lusta tanuló" algoritmusra, mivel nem állítja elő az adatkészlet modelljét. Az egyetlen számítás az, amikor felkéri az adatpont szomszédainak felmérésére. Ez a k-nn-t nagyon egyszerűvé teszi az adatbányászatban.
