Tartalomjegyzék:
Meghatározás - Mit jelent a kanonikálás?
A kanonizálás olyan adat, amely egynél több reprezentációt magában foglaló átalakítását egy standard jóváhagyott formátumba konvertálja. Egy ilyen átalakítás biztosítja, hogy az adatok megfeleljenek a kanonikus szabályoknak. Ez összehasonlítja a különböző reprezentációkat az egyenértékűség biztosítása, a különálló adatszerkezetek számának kiszámítása, az értelmi rendezési sorrend bevezetése és az algoritmus hatékonyságának javítása érdekében, ezáltal kiküszöbölve az ismételt számításokat.
A kanonizálást számos internetes és számítógépes alkalmazásban használják kanonikus adatok generálására nem kanonikus információkból. Az adatok kanonikus ábrázolása széles körben használatos
keresőmotor-optimalizálás (SEO), webszerverek, Unicode és XML.
Ezt a kifejezést más néven C14N néven ismertetik: szabványosítás vagy normalizálás.
A Techopedia magyarázza a kanonikálást
A SEO-ban az URL canonicalization egynél több URL-vel rendelkező webtartalommal foglalkozik. Ez eltéréseket hozhat létre a keresésekben, mivel a keresőmotor nem tudja, hogy melyik URL-t kell megjeleníteni. A Canonicalization több lehetőség közül választja ki a legjobb URL-t, általában a kezdőlapokra hivatkozva. Bár úgy tűnik, hogy bizonyos URL-ek azonosak, a webszerverek eltérő eredményeket adnak az URL-ekhez. A keresőmotorok csak egy URL-t vesznek figyelembe kanonikus formában.
A számítógépes biztonság a fájlnév kanonizálására épül. Előfordulhat, hogy egyes webszervereknek biztonsági szabálya van a fájlok csak egy adott könyvtár alatt történő végrehajtására. A fájl akkor csak akkor kerül végrehajtásra, ha az elérési út neve a megadott könyvtárat tartalmazza. Különös figyelmet kell fordítani annak ellenőrzésére, hogy a fájlnév egyedi-e. Az ilyen sebezhetőséget könyvtári átjárásnak nevezik.
Az Unicode szabvány legtöbb karakterének változó hosszúságú kódolása van. Ez megköveteli az egyes karakterláncok megfontolását, és bonyolultabbá teszi a karakterlánc-érvényesítést. Ha az összes karakterkódolást nem veszik figyelembe a szoftver megvalósításában, akkor fennáll a hibák lehetősége. Ez a probléma kiküszöbölhető minden karakter egyetlen kódolásával. A legjobb alternatíva, amelyet bármely szoftver igénybe vehet, annak ellenőrzése, hogy a karakterlánc kanonizálódott-e. Azokat a karakterláncokat, amelyeket nem kanonikáltak, el lehet utasítani.
A kanonikus XML dokumentum egy XML dokumentum kanonikus formában. A kanonikus XML specifikáció határozza meg. Az XML-ben a Canonicalization kiküszöböli a címkék belsejét, a névtér hivatkozásokat rendezi, és feleslegessé teszi a hivatkozásokat, és meghatározott karakterkódolásokat használ. Emellett eltávolítja az XML és DOCTYPE deklarációkat, amellett, hogy a relatív URL-eket abszolút URL-kké alakítja.