Normalizáciu je dobré použiť, keď viete, že distribúcia vašich údajov sa neriadi Gaussovým rozložením. … Štandardizácia, na druhej strane, môže byť užitočná v prípadoch, keď údaje sledujú Gaussovo rozdelenie.
Mám použiť normalizáciu alebo štandardizáciu?
Normalizácia je užitočná, keď majú vaše údaje rôzne mierky a algoritmus, ktorý používate, nevytvára predpoklady o distribúcii vašich údajov, ako sú k-najbližší susedia a umelé neurónové siete. Štandardizácia predpokladá, že vaše údaje majú gaussovské (zvonová krivka) rozdelenie.
Je štandardizácia to isté ako normalizácia?
V obchodnom svete „normalizácia“zvyčajne znamená, že rozsah hodnôt je „normalizovaný na hodnotu od 0.0 až 1,0 . „Štandardizácia“zvyčajne znamená, že rozsah hodnôt je „štandardizovaný“na meranie toho, koľko štandardných odchýlok má hodnota od svojho priemeru.
Je vždy dobré normalizovať údaje?
Normalizáciou v skutočnosti zahodíte niektoré informácie o údajoch, ako sú absolútne maximálne a minimálne hodnoty. Takže, neexistuje žiadne orientačné pravidlo. Ako povedali iní, normalizácia nie je vždy použiteľná; napr. z praktického hľadiska.
Kedy by ste nemali normalizovať údaje?
Niekoľko dobrých dôvodov, prečo sa nenormalizovať
- Pripojenia sú drahé. Normalizácia databázy často zahŕňa vytvorenie veľkého množstva tabuliek. …
- Normalizovaný dizajn je náročný. …
- Rýchle a špinavé by mali byť rýchle a špinavé. …
- Ak používate databázu NoSQL, tradičná normalizácia nie je žiaduca.