హడూప్ YARN ట్యుటోరియల్ - YARN ఆర్కిటెక్చర్ యొక్క ప్రాథమికాలను తెలుసుకోండి



ఈ బ్లాగ్ అపాచీ హడూప్ YARN పై దృష్టి పెడుతుంది, ఇది వనరుల నిర్వహణ మరియు ఉద్యోగ షెడ్యూలింగ్ కోసం హడూప్ వెర్షన్ 2.0 లో ప్రవేశపెట్టబడింది. ఇది YARN నిర్మాణాన్ని దాని భాగాలతో మరియు వాటిలో ప్రతి ఒక్కటి నిర్వర్తించే విధులను వివరిస్తుంది. ఇది అపాచీ హడూప్ YARN లో అప్లికేషన్ సమర్పణ మరియు వర్క్ఫ్లో వివరిస్తుంది.

హడూప్ యార్న్ వివిధ ప్రాసెసింగ్ సాధనాలతో హడూప్ యొక్క నిల్వ యూనిట్‌ను అల్లింది, అనగా హెచ్‌డిఎఫ్ఎస్ (హడూప్ డిస్ట్రిబ్యూటెడ్ ఫైల్ సిస్టమ్). ఈ అంశానికి పూర్తిగా క్రొత్తగా ఉన్న మీ కోసం, YARN అంటే “ వై మరియు TO నోథర్ ఆర్ మూలం ఎన్ egotiator ”. మీరు మా గుండా వెళ్లాలని నేను సూచిస్తాను మరియు మీరు అపాచీ హడూప్ యార్న్ నేర్చుకోవటానికి ముందు. ఈ బ్లాగ్ చివరిలో హడూప్ యార్న్ గురించి మీ అవగాహన స్పష్టంగా ఉందని నిర్ధారించుకోవడానికి నేను ఈ క్రింది విషయాలను ఇక్కడ వివరిస్తాను.

ఎందుకు YARN?

MRV1 (మ్యాప్‌రెడ్యూస్ వెర్షన్ 1) అని కూడా పిలువబడే హడూప్ వెర్షన్ 1.0 లో, మ్యాప్‌రెడ్యూస్ ప్రాసెసింగ్ మరియు రిసోర్స్ మేనేజ్‌మెంట్ ఫంక్షన్లను ప్రదర్శించింది. ఇది సింగిల్ మాస్టర్ అయిన జాబ్ ట్రాకర్‌ను కలిగి ఉంది. జాబ్ ట్రాకర్ వనరులను కేటాయించింది, షెడ్యూలింగ్ నిర్వహించింది మరియు ప్రాసెసింగ్ ఉద్యోగాలను పర్యవేక్షించింది. ఇది టాస్క్ ట్రాకర్స్ అని పిలువబడే అనేక అధీన ప్రక్రియలపై మ్యాప్‌ను కేటాయించింది మరియు పనులను తగ్గిస్తుంది. టాస్క్ ట్రాకర్స్ క్రమానుగతంగా వారి పురోగతిని జాబ్ ట్రాకర్‌కు నివేదించారు.





మ్యాప్‌రెడ్యూస్ వెర్షన్ 1.0 - హడూప్ యార్న్ - ఎడురేకా

ఈ డిజైన్ ఒకే జాబ్ ట్రాకర్ కారణంగా స్కేలబిలిటీ అడ్డంకికి దారితీసింది.యాహూ! ప్రకారం, అటువంటి రూపకల్పన యొక్క ఆచరణాత్మక పరిమితులు 5000 నోడ్ల క్లస్టర్‌తో మరియు 40,000 పనులు ఏకకాలంలో నడుస్తున్నాయని ఐబిఎం తన వ్యాసంలో పేర్కొంది.ఈ పరిమితి కాకుండా, గణన వనరుల వినియోగం MRV1 లో అసమర్థంగా ఉంది. అలాగే, హడూప్ ఫ్రేమ్‌వర్క్ మ్యాప్‌రెడ్యూస్ ప్రాసెసింగ్ ఉదాహరణకి మాత్రమే పరిమితం అయింది.



ఈ సమస్యలన్నింటినీ అధిగమించడానికి, YARN ను హడూప్ వెర్షన్ 2.0 లో 2012 సంవత్సరంలో యాహూ మరియు హోర్టన్ వర్క్స్ ప్రవేశపెట్టాయి. రిసోర్స్ మేనేజ్‌మెంట్ మరియు జాబ్ షెడ్యూలింగ్ బాధ్యతను స్వీకరించడం ద్వారా మ్యాప్‌రెడ్యూస్ నుండి ఉపశమనం పొందడం YARN వెనుక ఉన్న ప్రాథమిక ఆలోచన. హడూప్ ఫ్రేమ్‌వర్క్‌లో మ్యాప్‌రెడ్ కాని ఉద్యోగాలను అమలు చేయగల సామర్థ్యాన్ని హడూప్‌కు YARN ఇవ్వడం ప్రారంభించింది.

మీరు క్రింద ఉన్న వీడియోను కూడా చూడవచ్చు నిపుణుడు YARN భావనలను చర్చిస్తున్నారు & ఇది నిర్మాణాన్ని వివరంగా తెలియజేస్తుంది.

హడూప్ నూలు ట్యుటోరియల్ | హడూప్ నూలు నిర్మాణం | ఎడురేకా

YARN పరిచయంతో, ది పూర్తిగా విప్లవాత్మకమైనది. ఇది మరింత సరళమైనది, సమర్థవంతమైనది మరియు కొలవదగినది. 2013 మొదటి త్రైమాసికంలో యాహూ YARN తో ప్రత్యక్ష ప్రసారం చేసినప్పుడు, సంస్థ తన హడూప్ క్లస్టర్ పరిమాణాన్ని 40,000 నోడ్ల నుండి 32,000 నోడ్లకు కుదించడానికి సహాయపడింది. కానీ ఉద్యోగాల సంఖ్య నెలకు 26 మిలియన్లకు పెరిగింది.



హడూప్ YARN పరిచయం

ఇప్పుడు నేను మీకు YARN అవసరాన్ని తెలిపాను, హడూప్ v2.0 యొక్క ప్రధాన భాగాన్ని మీకు పరిచయం చేద్దాం, YARN . గ్రాఫ్ ప్రాసెసింగ్, ఇంటరాక్టివ్ ప్రాసెసింగ్, స్ట్రీమ్ ప్రాసెసింగ్ అలాగే బ్యాచ్ ప్రాసెసింగ్ వంటి విభిన్న డేటా ప్రాసెసింగ్ పద్ధతులను HDFS లో నిల్వ చేసిన డేటాను అమలు చేయడానికి మరియు ప్రాసెస్ చేయడానికి YARN అనుమతిస్తుంది. అందువల్ల YARN మ్యాప్‌రెడ్యూస్‌కు మించిన ఇతర రకాల పంపిణీ అనువర్తనాలకు హడూప్‌ను తెరుస్తుంది.

వంటి వివిధ రకాల సాధనాలను ఉపయోగించడం ద్వారా అవసరానికి అనుగుణంగా ఆపరేషన్లు చేయడానికి వినియోగదారులను YARN ఎనేబుల్ చేసింది రియల్ టైమ్ ప్రాసెసింగ్ కోసం, అందులో నివశించే తేనెటీగలు SQL కోసం, HBase NoSQL మరియు ఇతరుల కోసం.

రిసోర్స్ మేనేజ్‌మెంట్ కాకుండా, YARN జాబ్ షెడ్యూలింగ్ కూడా చేస్తుంది. వనరులను కేటాయించడం మరియు పనులను షెడ్యూల్ చేయడం ద్వారా YARN మీ అన్ని ప్రాసెసింగ్ కార్యకలాపాలను నిర్వహిస్తుంది. అపాచీ హడూప్ YARN ఆర్కిటెక్చర్ కింది ప్రధాన భాగాలను కలిగి ఉంటుంది:

  1. రిసోర్స్ మేనేజర్ : మాస్టర్ డెమోన్‌పై నడుస్తుంది మరియు క్లస్టర్‌లో వనరుల కేటాయింపును నిర్వహిస్తుంది.
  2. నోడ్ మేనేజర్: అవి బానిస డెమోన్‌లపై నడుస్తాయి మరియు ప్రతి డేటా నోడ్‌లో ఒక పనిని అమలు చేయడానికి బాధ్యత వహిస్తాయి.
  3. అప్లికేషన్ మాస్టర్: వ్యక్తిగత అనువర్తనాల వినియోగదారు ఉద్యోగ జీవితచక్రం మరియు వనరుల అవసరాలను నిర్వహిస్తుంది. ఇది నోడ్ మేనేజర్‌తో కలిసి పనిచేస్తుంది మరియు పనుల అమలును పర్యవేక్షిస్తుంది.
  4. కంటైనర్: ఒకే నోడ్‌లో RAM, CPU, నెట్‌వర్క్, HDD మొదలైన వాటితో సహా వనరుల ప్యాకేజీ.

YARN యొక్క భాగాలు

మీరు YARN ను మీ హడూప్ పర్యావరణ వ్యవస్థ యొక్క మెదడుగా పరిగణించవచ్చు. క్రింద ఉన్న చిత్రం YARN నిర్మాణాన్ని సూచిస్తుంది.

ది మొదటి భాగం YARN ఆర్కిటెక్చర్,

రిసోర్స్ మేనేజర్

  • వనరుల కేటాయింపులో ఇది అంతిమ అధికారం .
  • ప్రాసెసింగ్ అభ్యర్థనలను స్వీకరించినప్పుడు, ఇది సంబంధిత ప్రాసెసింగ్ జరిగే చోట సంబంధిత నోడ్ నిర్వాహకులకు అభ్యర్థనల భాగాలను పంపుతుంది.
  • ఇది క్లస్టర్ వనరుల మధ్యవర్తి మరియు పోటీ అనువర్తనాల కోసం అందుబాటులో ఉన్న వనరుల కేటాయింపును నిర్ణయిస్తుంది.
  • సామర్థ్య హామీలు, సరసత మరియు SLA లు వంటి వివిధ పరిమితులకు వ్యతిరేకంగా అన్ని వనరులను ఎప్పటికప్పుడు ఉపయోగంలో ఉంచడం వంటి క్లస్టర్ వినియోగాన్ని ఆప్టిమైజ్ చేస్తుంది.
  • ఇది రెండు ప్రధాన భాగాలను కలిగి ఉంది:ఎ) షెడ్యూలర్బి)అప్లికేషన్ మేనేజర్

ఎ) షెడ్యూలర్

  • సామర్థ్యాలు, క్యూలు మొదలైన వాటి పరిమితులకు లోబడి వివిధ రన్నింగ్ అనువర్తనాలకు వనరులను కేటాయించే బాధ్యత షెడ్యూలర్.
  • దీనిని రిసోర్స్ మేనేజర్‌లో స్వచ్ఛమైన షెడ్యూలర్ అని పిలుస్తారు, అంటే ఇది అనువర్తనాల కోసం స్థితి యొక్క పర్యవేక్షణ లేదా ట్రాకింగ్‌ను నిర్వహించదు.
  • అనువర్తన వైఫల్యం లేదా హార్డ్‌వేర్ వైఫల్యం ఉంటే, విఫలమైన పనులను పున art ప్రారంభించడానికి షెడ్యూలర్ హామీ ఇవ్వదు.
  • అనువర్తనాల వనరుల అవసరాల ఆధారంగా షెడ్యూల్ చేస్తుంది.
  • ఇది ప్లగ్ చేయగల పాలసీ ప్లగ్-ఇన్‌ను కలిగి ఉంది, ఇది వివిధ అనువర్తనాల మధ్య క్లస్టర్ వనరులను విభజించడానికి బాధ్యత వహిస్తుంది. అలాంటి రెండు ప్లగిన్లు ఉన్నాయి: సామర్థ్య షెడ్యూలర్ మరియు సరసమైన షెడ్యూలర్ , ప్రస్తుతం రిసోర్స్ మేనేజర్‌లో షెడ్యూలర్లుగా ఉపయోగించబడుతున్నాయి.

బి) అప్లికేషన్ మేనేజర్

  • ఉద్యోగ సమర్పణలను అంగీకరించే బాధ్యత ఇది.
  • అప్లికేషన్ నిర్దిష్ట అప్లికేషన్ మాస్టర్‌ను అమలు చేయడానికి రిసోర్స్ మేనేజర్ నుండి మొదటి కంటైనర్‌తో చర్చలు జరుపుతుంది.
  • అప్లికేషన్ మాస్టర్‌లను క్లస్టర్‌లో అమలు చేయడాన్ని నిర్వహిస్తుంది మరియు వైఫల్యంపై అప్లికేషన్ మాస్టర్ కంటైనర్‌ను పున art ప్రారంభించడానికి సేవను అందిస్తుంది.

వస్తోంది రెండవ భాగం ఏది:

నోడ్ మేనేజర్

  • ఇది హడూప్ క్లస్టర్‌లోని వ్యక్తిగత నోడ్‌లను జాగ్రత్తగా చూసుకుంటుంది మరియుఇచ్చిన నోడ్‌లో వినియోగదారు ఉద్యోగాలు మరియు వర్క్‌ఫ్లో నిర్వహిస్తుంది.
  • ఇది రిసోర్స్ మేనేజర్‌తో నమోదు చేస్తుంది మరియు నోడ్ యొక్క ఆరోగ్య స్థితితో హృదయ స్పందనలను పంపుతుంది.
  • రిసోర్స్ మేనేజర్ కేటాయించిన అప్లికేషన్ కంటైనర్లను నిర్వహించడం దీని ప్రాథమిక లక్ష్యం.
  • ఇది రిసోర్స్ మేనేజర్‌తో తాజాగా ఉంటుంది.
  • అప్లికేషన్ మాస్టర్ కేటాయించిన కంటైనర్‌ను నోడ్ మేనేజర్ నుండి కంటైనర్ లాంచ్ కాంటెక్స్ట్ (సిఎల్‌సి) పంపడం ద్వారా అభ్యర్థిస్తుంది, ఇది అమలు చేయడానికి అనువర్తనానికి అవసరమైన ప్రతిదాన్ని కలిగి ఉంటుంది. నోడ్ మేనేజర్ అభ్యర్థించిన కంటైనర్ ప్రాసెస్‌ను సృష్టించి దాన్ని ప్రారంభిస్తుంది.
  • వ్యక్తిగత కంటైనర్ల వనరుల వినియోగాన్ని (మెమరీ, CPU) పర్యవేక్షిస్తుంది.
  • లాగ్ నిర్వహణను నిర్వహిస్తుంది.
  • రిసోర్స్ మేనేజర్ నిర్దేశించిన విధంగా ఇది కంటైనర్‌ను కూడా చంపుతుంది.

ది మూడవ భాగం అపాచీ హడూప్ యార్న్,

అప్లికేషన్ మాస్టర్
  • అప్లికేషన్ అనేది ఫ్రేమ్‌వర్క్‌కు సమర్పించిన ఒకే ఉద్యోగం. అటువంటి ప్రతి అనువర్తనం దానితో అనుబంధించబడిన ప్రత్యేకమైన అప్లికేషన్ మాస్టర్‌ను కలిగి ఉంటుంది, ఇది ఫ్రేమ్‌వర్క్ నిర్దిష్ట సంస్థ.
  • ఇది క్లస్టర్‌లో అనువర్తనం అమలును సమన్వయం చేసే ప్రక్రియ మరియు లోపాలను కూడా నిర్వహిస్తుంది.
  • రిసోర్స్ మేనేజర్ నుండి వనరులను చర్చించడం మరియు నోడ్ మేనేజర్‌తో కలిసి కాంపోనెంట్ టాస్క్‌లను అమలు చేయడం మరియు పర్యవేక్షించడం దీని పని.
  • రిసోర్స్ మేనేజర్ నుండి తగిన రిసోర్స్ కంటైనర్లను చర్చించడం, వాటి స్థితిని ట్రాక్ చేయడం మరియు పురోగతిని పర్యవేక్షించడం దీని బాధ్యత.
  • ప్రారంభించిన తర్వాత, దాని ఆరోగ్యాన్ని ధృవీకరించడానికి మరియు దాని వనరుల డిమాండ్ల రికార్డును నవీకరించడానికి ఇది క్రమానుగతంగా హృదయ స్పందనలను రిసోర్స్ మేనేజర్‌కు పంపుతుంది.

ది నాల్గవ భాగం ఇది:

కంటైనర్
  • ఇది ఒకే నోడ్‌లోని RAM, CPU కోర్లు మరియు డిస్క్‌ల వంటి భౌతిక వనరుల సమాహారం.
  • YARN కంటైనర్లు కంటైనర్ ప్రయోగ సందర్భం ద్వారా నిర్వహించబడతాయి, ఇది కంటైనర్ లైఫ్-సైకిల్ (CLC). ఈ రికార్డ్‌లో పర్యావరణ వేరియబుల్స్, రిమోట్‌గా ప్రాప్యత చేయగల నిల్వలో నిల్వ చేయబడిన డిపెండెన్సీలు, భద్రతా టోకెన్లు, నోడ్ మేనేజర్ సేవలకు పేలోడ్ మరియు ప్రక్రియను సృష్టించడానికి అవసరమైన ఆదేశం ఉన్నాయి.
  • ఇది ఒక నిర్దిష్ట హోస్ట్‌లో నిర్దిష్ట మొత్తంలో వనరులను (మెమరీ, సిపియు మొదలైనవి) ఉపయోగించడానికి అనువర్తనానికి హక్కులను ఇస్తుంది.

YARN లో అప్లికేషన్ సమర్పణ

చిత్రాన్ని చూడండి మరియు హడూప్ యార్న్ యొక్క అప్లికేషన్ సమర్పణలో ఉన్న దశలను చూడండి:

1) ఉద్యోగాన్ని సమర్పించండి

2)అప్లికేషన్ ఐడిని పొందండి

3) అప్లికేషన్ సమర్పణ సందర్భం

4 ఎ) కంటైనర్ ప్రారంభించండిప్రారంభించండి

బి) అప్లికేషన్ మాస్టర్ ప్రారంభించండి

5) వనరులను కేటాయించండి

6 ఎ) కంటైనర్

ప్రోగ్రామ్‌ను ముగించడానికి జావా కోడ్

బి) ప్రారంభించండి

7) అమలు చేయండి

హడూప్ YARN లో అప్లికేషన్ వర్క్ఫ్లో

ఇచ్చిన చిత్రాన్ని చూడండి మరియు అపాచీ హడూప్ YARN యొక్క అప్లికేషన్ వర్క్‌ఫ్లో పాల్గొన్న క్రింది దశలను చూడండి:

  1. క్లయింట్ ఒక దరఖాస్తును సమర్పించాడు
  2. అప్లికేషన్ మేనేజర్‌ను ప్రారంభించడానికి రిసోర్స్ మేనేజర్ ఒక కంటైనర్‌ను కేటాయిస్తుంది
  3. అప్లికేషన్ మేనేజర్ రిసోర్స్ మేనేజర్‌తో నమోదు చేస్తారు
  4. అప్లికేషన్ మేనేజర్ రిసోర్స్ మేనేజర్ నుండి కంటైనర్లను అడుగుతుంది
  5. కంటైనర్లను ప్రారంభించటానికి అప్లికేషన్ మేనేజర్ నోడ్ మేనేజర్‌కు తెలియజేస్తుంది
  6. అప్లికేషన్ కోడ్ కంటైనర్‌లో అమలు చేయబడుతుంది
  7. అప్లికేషన్ యొక్క స్థితిని పర్యవేక్షించడానికి క్లయింట్ పరిచయాలు రిసోర్స్ మేనేజర్ / అప్లికేషన్ మేనేజర్
  8. అప్లికేషన్ మేనేజర్ రిసోర్స్ మేనేజర్‌తో నమోదు చేయదు

ఇప్పుడు మీకు అపాచీ హడూప్ యార్న్ తెలుసు, చూడండి ప్రపంచవ్యాప్తంగా విస్తరించి ఉన్న 250,000 మందికి పైగా సంతృప్తికరమైన అభ్యాసకుల నెట్‌వర్క్‌తో విశ్వసనీయ ఆన్‌లైన్ లెర్నింగ్ సంస్థ ఎడురేకా చేత. రిటైల్, సోషల్ మీడియా, ఏవియేషన్, టూరిజం, ఫైనాన్స్ డొమైన్‌లో రియల్ టైమ్ యూజ్ కేసులను ఉపయోగించి హెచ్‌డిఎఫ్‌ఎస్, నూలు, మ్యాప్‌రెడ్యూస్, పిగ్, హైవ్, హెచ్‌బేస్, ఓజీ, ఫ్లూమ్ మరియు స్కూప్‌లో నిపుణులు కావడానికి ఎడురేకా బిగ్ డేటా హడూప్ సర్టిఫికేషన్ ట్రైనింగ్ కోర్సు సహాయపడుతుంది.

మాకు ప్రశ్న ఉందా? దయచేసి దీన్ని వ్యాఖ్యల విభాగంలో పేర్కొనండి మరియు మేము మిమ్మల్ని సంప్రదిస్తాము.