Ako fungujú mapovače a redukcie?

Obsah:

Ako fungujú mapovače a redukcie?
Ako fungujú mapovače a redukcie?

Video: Ako fungujú mapovače a redukcie?

Video: Ako fungujú mapovače a redukcie?
Video: Dobrovoľníctvo - ako pomáhať? 💪 | Zmudri 2024, November
Anonim

Výstup mapovača alebo mapovej úlohy (páry kľúč-hodnota) je vstup do Reducer Reduktor prijíma pár kľúč-hodnota z viacerých mapových úloh. Potom reduktor agreguje tieto stredné dátové n-tice (stredný pár kľúč-hodnota) do menšej množiny n-tic alebo párov kľúč-hodnota, čo je konečný výstup.

Čo robia mapovatelia a reduktori?

Hadoop Mapper je funkcia alebo úloha, ktorá sa používa na spracovanie všetkých vstupných záznamov zo súboru a generovanie výstupu, ktorý funguje ako vstup pre Reducer Vytvára výstup vrátením nového párov kľúč – hodnota. … Mapovač tiež generuje niekoľko malých blokov údajov, zatiaľ čo spracováva vstupné záznamy ako pár kľúč – hodnota.

Aký je rozdiel medzi mapovačom a reduktorom?

Aký je hlavný rozdiel medzi Mapper a Reducer? Úloha mapovača je prvá fáza spracovania, ktorá spracováva každý vstupný záznam (z RecordReader) a generuje prechodný pár kľúč – hodnota. Metóda redukcie sa volá samostatne pre každý pár zoznamov kľúč/hodnota.

Ako vypočítate počet mapovačov a reduktorov?

Závisí to od toho, koľko jadier a koľko pamäte máte na každom slave. Vo všeobecnosti by jeden mapovač mal získať 1 až 1,5 jadra procesora Takže ak máte 15 jadier, môžete spustiť 10 mapovačov na Node. Takže ak máte 100 dátových uzlov v klastri Hadoop, potom jeden môže spustiť 1 000 mapovačov v klastri.

Ako funguje funkcia Mapper?

Mapper je funkcia, ktorá spracúva vstupné dáta Mapovač spracováva dáta a vytvára niekoľko malých kúskov dát. Vstup do funkcie mapovača je vo forme párov (kľúč, hodnota), aj keď vstupom do programu MapReduce je súbor alebo adresár (ktorý je uložený v HDFS).

Odporúča: