హడూప్ పైన నిర్మించిన డేటా వేర్హౌసింగ్ ప్యాకేజీ కావడంతో, అపాచీ హైవ్ డేటా విశ్లేషణ, డేటా మైనింగ్ మరియు ప్రిడిక్టివ్ మోడలింగ్ కోసం ఎక్కువగా ఉపయోగించబడుతోంది. సంస్థలు గట్టిగా పట్టుకున్న నిపుణుల కోసం చూస్తున్నాయి . ఈ పోస్ట్లో, హైవ్ స్క్రిప్ట్లను ఎలా అమలు చేయాలో చూద్దాం. సాధారణంగా, స్టేట్మెంట్ల సమితిని ఒకేసారి అమలు చేయడానికి మేము స్క్రిప్ట్లను ఉపయోగిస్తాము. అందులో నివశించే తేనెటీగలు స్క్రిప్ట్లను అదే విధంగా ఉపయోగిస్తారు. ఇది ప్రతి ఆదేశాన్ని మానవీయంగా వ్రాయడానికి మరియు అమలు చేయడానికి మేము ఉంచే సమయం మరియు కృషిని తగ్గిస్తుంది.
అందులో నివశించే తేనెటీగలు 0.10.0 మరియు అంతకంటే ఎక్కువ సంస్కరణల్లో హైవ్ స్క్రిప్ట్లకు మద్దతు ఉంది. హైవ్ 0.90 వెర్షన్ CDH3 లో వ్యవస్థాపించబడినందున, మేము CDH3 లో హైవ్ స్క్రిప్ట్లను అమలు చేయలేము. అందులో హైవ్ 0.10.0 వెర్షన్ ఇన్స్టాల్ చేయబడినందున మీరు సిడిహెచ్ 4 లో ఈ క్రింది దశలను ప్రయత్నించవచ్చు. హైవ్ స్క్రిప్ట్ను ఎలా సృష్టించాలో మీకు తెలుసా? లేకపోతే, క్లిక్ చేయండి మరింత స్పష్టత పొందడానికి.
ఇప్పుడు, హైవ్లో స్క్రిప్ట్లను ఎలా వ్రాయాలో మరియు వాటిని CDH4 లో ఎలా అమలు చేయాలో చూద్దాం:
దశ 1: అందులో నివశించే తేనెటీగ స్క్రిప్ట్ రాయడం.
హైవ్ స్క్రిప్ట్ రాయడానికి ఫైల్ .sql పొడిగింపుతో సేవ్ చేయాలి. మీ క్లౌడెరా సిడిహెచ్ 4 పంపిణీలో టెర్మినల్ తెరిచి, హైవ్ స్క్రిప్ట్ను సృష్టించడానికి కింది ఆదేశాన్ని ఇవ్వండి.
ఆదేశం: sudo gedit sample.sql
పై ఆదేశాన్ని అమలు చేస్తున్నప్పుడు, అది అమలు చేయవలసిన అన్ని హైవ్ ఆదేశాల జాబితాతో ఫైల్ను తెరుస్తుంది.
ఈ స్క్రిప్ట్లో, పట్టిక సృష్టించబడుతుంది, వివరించబడుతుంది మరియు డేటా లోడ్ చేయబడుతుంది మరియు పట్టిక నుండి తిరిగి పొందబడుతుంది.
1. అందులో నివశించే తేనెటీగలు పట్టికను సృష్టించడం:
ఆదేశం: పట్టిక ఉత్పత్తిని సృష్టించండి (ప్రొడక్టిడ్: పూర్ణాంకానికి, ఉత్పత్తి పేరు: స్ట్రింగ్, ధర: ఫ్లోట్, వర్గం: స్ట్రింగ్) అడ్డు వరుసల ఫార్మాట్ ‘,’
ఇక్కడ, ఉత్పత్తి పట్టిక పేరు మరియు {ప్రొడక్టిడ్, ప్రొడక్ట్ నేమ్, ధర, వర్గం these ఈ పట్టిక యొక్క నిలువు వరుసలు.
‘,’ ద్వారా ముగించబడిన ఫీల్డ్లు ఇన్పుట్ ఫైల్లోని నిలువు వరుసలను ‘,’ గుర్తుతో వేరు చేస్తాయని సూచిస్తున్నాయి.
అప్రమేయంగా ఇన్పుట్ ఫైల్ లోని రికార్డులు కొత్త లైన్ ద్వారా వేరు చేయబడతాయి.
2. పట్టికను వివరిస్తూ:
ఆదేశం: ఉత్పత్తిని వివరించండి
3. డేటాను పట్టికలోకి లోడ్ చేస్తోంది.
డేటాను పట్టికలోకి లోడ్ చేయడానికి మొదట మనం ఇన్పుట్ ఫైల్ను సృష్టించాలి, అది పట్టికలో చేర్చవలసిన రికార్డులను కలిగి ఉంటుంది.
ఇన్పుట్ ఫైల్ను క్రియేట్ చేద్దాం.
ఆదేశం: sudo gedit input.txt
చిత్రంలో చూపిన విధంగా ఫైల్లోని విషయాలను సవరించండి.
కోడ్లో జావా ప్రోగ్రామ్ను ఎలా ఆపాలి
4. డేటాను తిరిగి పొందడం:
డేటాను తిరిగి పొందడానికి, ఎంచుకున్న ఆదేశం ఉపయోగించబడుతుంది.
ఆదేశం: ఉత్పత్తి నుండి * ఎంచుకోండి
పట్టికలో ఉన్న అన్ని నిలువు వరుసల విలువను తిరిగి పొందడానికి పై ఆదేశం ఉపయోగించబడుతుంది. స్క్రిప్ట్ క్రింది చిత్రంలో చూపిన విధంగా ఉండాలి.
ఇప్పుడు, మేము హైవ్ స్క్రిప్ట్ రాయడం పూర్తి చేసాము. Sample.sql ఫైల్ ఇప్పుడు సేవ్ చేయవచ్చు.
దశ 2: అందులో నివశించే తేనెటీగ స్క్రిప్ట్ను నడుపుతోంది
అందులో నివశించే తేనెటీగ లిపిని అమలు చేయవలసిన ఆదేశం క్రిందిది:
ఆదేశం: అందులో నివశించే తేనెటీగలు –f /home/cloudera/sample.sql
స్క్రిప్ట్ను అమలు చేస్తున్నప్పుడు, స్క్రిప్ట్ ఫైల్ యొక్క స్థానం యొక్క మొత్తం మార్గం ఉందని నిర్ధారించుకోండి.
అన్ని ఆదేశాలు విజయవంతంగా అమలు చేయబడతాయని మనం చూడవచ్చు.
CDH4 లో హైవ్ స్క్రిప్ట్లను ఈ విధంగా అమలు చేస్తారు మరియు అమలు చేస్తారు.
అందులో నివశించే తేనెటీగలు హడూప్ యొక్క కీలకమైన భాగం మరియు అందులో నివశించే తేనెటీగలు మీ నైపుణ్యం మీకు అత్యధికంగా చెల్లించే హడూప్ ఉద్యోగాలను ఇవ్వగలదు! ఎడురేకాలో ప్రత్యేకంగా క్యూరేటెడ్ హడూప్ కోర్సు ఉంది, ఇది మ్యాప్రెడ్యూస్, నూలు, పిగ్, హైవ్, హెచ్బేస్, ఓజీ, ఫ్లూమ్ మరియు స్కూప్ వంటి భావనలను నేర్చుకోవడంలో మీకు సహాయపడుతుంది. ప్రారంభించడానికి క్రింది బటన్ పై క్లిక్ చేయండి.
మాకు ప్రశ్న ఉందా? దయచేసి వాటిని వ్యాఖ్యల విభాగంలో పేర్కొనండి మరియు మేము మిమ్మల్ని సంప్రదిస్తాము.
సంబంధిత పోస్ట్లు:
జావాలో ప్రతిష్ఠంభనను ఎలా నివారించాలి