K:
Miért hasznos a konfúziós mátrix az ML-ben?
A:Számos módon beszélhetünk arról, hogy miért értékes a zavart mátrix a gépi tanulásban (ML) - de az egyik legegyszerűbb módszer annak magyarázata, hogy a zavar mátrix adatmegjelenítő erőforrás.
A zavart mátrix lehetővé teszi a nézők számára, hogy egy pillanat alatt megtekintsék az osztályozó vagy más algoritmus használatának eredményeit. Az analitikai eredmények megjelenítésére szolgáló egyszerű táblázat felhasználásával a zavartartási mátrix lényegében lebontja az eredményeit emészthetőbb nézetbe.
A zavart mátrix speciális terminológiát használ az eredmények rendezéséhez. Vannak igazi pozitív és valódi negatívok, valamint hamis pozitív és hamis negatívok is. Egy összetettebb vagy összehasonlító osztályozáson alapuló összetévesztési mátrix esetén ezeket az értékeket valós és előrejelzett osztályokként lehet bemutatni két különálló objektumra.
A szemantikai terminológiától függetlenül az eredményeket négyzetes (vagy téglalap alakú) táblázatokba csoportosítják.
Ez a nézet megkönnyíti az elemzők számára az algoritmus pontosságát az eredmények osztályozásában. (Olvassa el az Új generátorok modern algoritmusokat az ASCII cikk kidolgozásához.)
A zűrzavar mátrixának az ML projektek összetettségével, valamint az információk formázásának és a felhasználóknak történő továbbításának módjával kell összefüggésben lennie. Képzeljünk el egy lineáris eredmény sorozatot, amely magában foglalja a hamis pozitív, a hamis negatív, a valódi pozitív és az igazi negatív eredményeket is. (Olvassa el a Machine Learning 101. számot.)
A felhasználónak mindezeket a lineáris eredményeket egy grafikonba kell tábláznia, hogy megértse az algoritmus működését és pontosságát. A zavart mátrix segítségével ezt az információt egyszerűen egy hatékony vizuális modellben mutatják be.
Tegyük fel például, hogy a gépet arra kérték, hogy osztályozzon 20 képet, amelyek közül öt gyümölcs és öt zöldség. Ha egy zavart mátrix a következő tartalommal rendelkezik (balról balra az óramutató járásával megegyező irányban): 7, 5, 3, 5, akkor a mátrix azt mutatja, hogy hétöt helyesen azonosítottak zöldségként, míg hármat helyesen osztályozták gyümölcsként.
A többi 10 ábrázolt eredmény olyan eredmények, amelyekben a program nem tudta helyesen azonosítani a képet.
A zavart mátrix mindenféle ML elemzésben hasznos lesz. Ennek az erőforrásnak a megfigyelésével a felhasználók kitalálhatják, hogyan kell kezelni a problémákat, mint például a dimenzió és a túlfűtés, valamint az algoritmus optimalizálásának más módjai.