హడూప్‌ను ఇన్‌స్టాల్ చేయండి: సింగిల్ నోడ్ హడూప్ క్లస్టర్‌ను ఏర్పాటు చేస్తోంది



ఈ ట్యుటోరియల్ హడూప్ క్లస్టర్‌ను ఇన్‌స్టాల్ చేసి ఒకే నోడ్‌లో కాన్ఫిగర్ చేయడానికి స్టెప్ బై స్టెప్. అన్ని హడూప్ ఇన్‌స్టాలేషన్ దశలు సెంటొస్ మెషీన్ కోసం.

హడూప్‌ను ఇన్‌స్టాల్ చేయండి: సింగిల్ నోడ్ హడూప్ క్లస్టర్‌ను ఏర్పాటు చేస్తోంది

మా మునుపటి బ్లాగుల నుండి , హడూప్, హెచ్‌డిఎఫ్‌ఎస్ మరియు దాని నిర్మాణం గురించి మీకు సైద్ధాంతిక ఆలోచన ఉండాలి.కానీ పొందడానికి మీకు మంచి జ్ఞానం అవసరం.మా మునుపటి బ్లాగును మీరు ఇష్టపడ్డారని నేను ఆశిస్తున్నాను , ఇప్పుడు నేను మిమ్మల్ని హడూప్ మరియు హెచ్‌డిఎఫ్‌ఎస్ గురించి ఆచరణాత్మక జ్ఞానం ద్వారా తీసుకువెళతాను. మొదటి దశ హడూప్‌ను ఇన్‌స్టాల్ చేయడం.

హడూప్‌ను ఇన్‌స్టాల్ చేయడానికి రెండు మార్గాలు ఉన్నాయి, అనగా. సింగిల్ నోడ్ మరియు బహుళ నోడ్ .





సింగిల్ నోడ్ క్లస్టర్ ఒకే మెషీన్‌లో ఒకే నేమ్‌నోడ్, డేటానోడ్, రిసోర్స్ మేనేజర్ మరియు నోడ్ మేనేజర్‌ను సెట్ చేయడం ఒక డేటానోడ్ మాత్రమే. ఇది అధ్యయనం మరియు పరీక్షా ప్రయోజనాల కోసం ఉపయోగించబడుతుంది. ఉదాహరణకు, ఆరోగ్య సంరక్షణ పరిశ్రమలో సెట్ చేయబడిన నమూనా డేటాను పరిశీలిద్దాం. కాబట్టి, డేటాను సరైన క్రమంలో సేకరించడం, సమగ్రపరచడం, నిల్వ చేయడం మరియు ప్రాసెస్ చేయడం వంటి అన్ని ప్రక్రియలను ఓజీ ఉద్యోగాలు షెడ్యూల్ చేశాయా అని పరీక్షించడానికి, మేము సింగిల్ నోడ్ క్లస్టర్‌ని ఉపయోగిస్తాము. వందలాది యంత్రాలలో పంపిణీ చేయబడిన టెరాబైట్ల డేటాను కలిగి ఉన్న పెద్ద వాతావరణాలతో పోలిస్తే ఇది చిన్న వాతావరణంలో సీక్వెన్షియల్ వర్క్‌ఫ్లోను సులభంగా మరియు సమర్థవంతంగా పరీక్షించగలదు.

ఒక బహుళ నోడ్ క్లస్టర్ , ఒకటి కంటే ఎక్కువ డేటానోడ్ రన్నింగ్ ఉన్నాయి మరియు ప్రతి డేటానోడ్ వేర్వేరు యంత్రాలలో నడుస్తున్నాయి. మల్టీ నోడ్ క్లస్టర్ బిగ్ డేటాను విశ్లేషించడానికి సంస్థలలో ఆచరణాత్మకంగా ఉపయోగించబడుతుంది. పై ఉదాహరణను పరిశీలిస్తే, నిజ సమయంలో మేము పెటాబైట్ల డేటాతో వ్యవహరించేటప్పుడు, ప్రాసెస్ చేయడానికి వందలాది యంత్రాలలో పంపిణీ చేయాలి. ఈ విధంగా, ఇక్కడ మనం మల్టీ నోడ్ క్లస్టర్‌ని ఉపయోగిస్తాము.



ఈ బ్లాగులో, ఒకే నోడ్ క్లస్టర్‌లో హడూప్‌ను ఎలా ఇన్‌స్టాల్ చేయాలో నేను మీకు చూపిస్తాను.

ముందస్తు అవసరాలు

  • VIRTUAL BOX : ఇది ఆపరేటింగ్ సిస్టమ్‌ను ఇన్‌స్టాల్ చేయడానికి ఉపయోగించబడుతుంది.
  • ఆపరేటింగ్ సిస్టమ్ : మీరు Linux ఆధారిత ఆపరేటింగ్ సిస్టమ్స్‌లో హడూప్‌ను ఇన్‌స్టాల్ చేయవచ్చు. ఉబుంటు మరియు సెంటొస్ చాలా సాధారణంగా ఉపయోగిస్తారు. ఈ ట్యుటోరియల్‌లో, మేము సెంటొస్‌ను ఉపయోగిస్తున్నాము.
  • జావా : మీరు మీ సిస్టమ్‌లో జావా 8 ప్యాకేజీని ఇన్‌స్టాల్ చేయాలి.
  • హడూప్ : మీకు హడూప్ 2.7.3 ప్యాకేజీ అవసరం.

హడూప్‌ను ఇన్‌స్టాల్ చేయండి

దశ 1: ఇక్కడ నొక్కండి జావా 8 ప్యాకేజీని డౌన్‌లోడ్ చేయడానికి. ఈ ఫైల్‌ను మీ హోమ్ డైరెక్టరీలో సేవ్ చేయండి.

దశ 2: జావా తారు ఫైల్ను సంగ్రహించండి.

ఆదేశం : tar -xvf jdk-8u101-linux-i586.tar.gz

స్మెర్ జావా - హడూప్‌ను ఇన్‌స్టాల్ చేయండి - ఎడురేకా



అంజీర్: హడూప్ ఇన్స్టాలేషన్ - జావా ఫైళ్ళను సంగ్రహిస్తుంది

దశ 3: హడూప్ 2.7.3 ప్యాకేజీని డౌన్‌లోడ్ చేయండి.

ఆదేశం : wget https://archive.apache.org/dist/hadoop/core/hadoop-2.7.3/hadoop-2.7.3.tar.gz

జావాలో ప్యాకేజీని ఎలా సృష్టించాలి

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - హడూప్‌ను డౌన్‌లోడ్ చేస్తోంది

దశ 4: హడూప్ తారు ఫైల్ను సంగ్రహించండి.

ఆదేశం : tar -xvf hadoop-2.7.3.tar.gz

అంజీర్: హడూప్ సంస్థాపన - హడూప్ ఫైళ్ళను సంగ్రహిస్తుంది

దశ 5: బాష్ ఫైల్ (.bashrc) లో హడూప్ మరియు జావా మార్గాలను జోడించండి.

తెరవండి . bashrc ఫైల్. ఇప్పుడు, క్రింద చూపిన విధంగా హడూప్ మరియు జావా మార్గాన్ని జోడించండి.

ఆదేశం : vi .bashrc

అంజీర్: హడూప్ ఇన్స్టాలేషన్ - ఎన్విరాన్మెంట్ వేరియబుల్ సెట్టింగ్

అప్పుడు, బాష్ ఫైల్ను సేవ్ చేసి దాన్ని మూసివేయండి.

ప్రస్తుత టెర్మినల్‌కు ఈ మార్పులన్నింటినీ వర్తింపజేయడానికి, సోర్స్ ఆదేశాన్ని అమలు చేయండి.

ఆదేశం : మూలం .bashrc

అంజీర్: హడూప్ ఇన్స్టాలేషన్ - రిఫ్రెష్ ఎన్విరాన్మెంట్ వేరియబుల్స్

మీ సిస్టమ్‌లో జావా మరియు హడూప్ సరిగ్గా ఇన్‌స్టాల్ చేయబడిందని మరియు టెర్మినల్ ద్వారా యాక్సెస్ చేయవచ్చని నిర్ధారించుకోండి, ఇజావా -వర్షన్ మరియు హడూప్ వెర్షన్ ఆదేశాలను xecute చేయండి.

ఆదేశం : జావా-సంస్కరణ: Telugu

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - జావా వెర్షన్‌ను తనిఖీ చేస్తోంది

ఆదేశం : హడూప్సంస్కరణ: Telugu

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - హడూప్ వెర్షన్‌ను తనిఖీ చేస్తోంది

దశ 6 : సవరించండి .

ఆదేశం: cd hadoop-2.7.3 / etc / hadoop /

ఆదేశం: ls

అన్ని హడూప్ కాన్ఫిగరేషన్ ఫైళ్లు ఉన్నాయి hadoop-2.7.3 / etc / hadoop దిగువ స్నాప్‌షాట్‌లో మీరు చూడగలిగే డైరెక్టరీ:

అంజీర్: హడూప్ ఇన్స్టాలేషన్ - హడూప్ కాన్ఫిగరేషన్ ఫైల్స్

దశ 7 : తెరవండి core-site.xml మరియు కాన్ఫిగరేషన్ ట్యాగ్ లోపల క్రింద పేర్కొన్న ఆస్తిని సవరించండి:

core-site.xml క్లస్టర్‌లో నేమ్‌నోడ్ నడుస్తున్న హడూప్ డెమోన్‌కు తెలియజేస్తుంది. ఇది HDFS & MapReduce కు సాధారణమైన I / O సెట్టింగులు వంటి హడూప్ కోర్ యొక్క కాన్ఫిగరేషన్ సెట్టింగులను కలిగి ఉంది.

ఆదేశం : vi core-site.xml

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - కోర్-సైట్.ఎక్స్.ఎమ్

ఓవర్లోడింగ్ vs ఓవర్రైడింగ్ సి ++
fs.default.name hdfs: // localhost: 9000

దశ 8: సవరించండి hdfs-site.xml మరియు కాన్ఫిగరేషన్ ట్యాగ్ లోపల క్రింద పేర్కొన్న ఆస్తిని సవరించండి:

hdfs-site.xml HDFS డెమోన్‌ల కాన్ఫిగరేషన్ సెట్టింగులను కలిగి ఉంటుంది (అనగా నేమ్‌నోడ్, డేటానోడ్, సెకండరీ నేమ్‌నోడ్). ఇది HDFS యొక్క ప్రతిరూపణ కారకం మరియు బ్లాక్ పరిమాణాన్ని కూడా కలిగి ఉంటుంది.

ఆదేశం : vi hdfs-site.xml

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - hdfs-site.xml ను కాన్ఫిగర్ చేస్తోంది

dfs.replication 1 dfs.permission false

దశ 9 : సవరించండి mapred-site.xml కాన్ఫిగరేషన్ ట్యాగ్ లోపల క్రింద పేర్కొన్న ఆస్తిని ఫైల్ చేయండి మరియు సవరించండి:

mapred-site.xml మ్యాప్‌రెడ్యూస్ అప్లికేషన్ యొక్క కాన్ఫిగరేషన్ సెట్టింగులను సమాంతరంగా అమలు చేయగల JVM సంఖ్య, మ్యాపర్ యొక్క పరిమాణం మరియు తగ్గించే ప్రక్రియ, ఒక ప్రక్రియకు అందుబాటులో ఉన్న CPU కోర్లు మొదలైనవి ఉన్నాయి.

కొన్ని సందర్భాల్లో, mapred-site.xml ఫైల్ అందుబాటులో లేదు. కాబట్టి, మేము మ్యాప్రెడ్-సైట్.ఎక్స్ఎమ్ ఫైల్ను సృష్టించాలిmapred-site.xml టెంప్లేట్ ఉపయోగించి.

ఆదేశం : cp mapred-site.xml.template mapred-site.xml

ఆదేశం : మేము mapred-సైట్.xml.

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - మ్యాప్రెడ్-సైట్.ఎక్స్.ఎమ్

mapreduce.framework.name నూలు

దశ 10: సవరించండి yarn-site.xml మరియు కాన్ఫిగరేషన్ ట్యాగ్ లోపల క్రింద పేర్కొన్న ఆస్తిని సవరించండి:

yarn-site.xml అప్లికేషన్ మెమరీ నిర్వహణ పరిమాణం, ప్రోగ్రామ్ & అల్గోరిథం వంటి ఆపరేషన్ వంటి రిసోర్స్ మేనేజర్ మరియు నోడ్ మేనేజర్ యొక్క కాన్ఫిగరేషన్ సెట్టింగులను కలిగి ఉంటుంది.

ఆదేశం : vi yarn-site.xml

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - నూలు-సైట్.ఎక్స్.ఎమ్

yarn.nodemanager.aux-services mapreduce_shuffle yarn.nodemanager.auxservices.mapreduce.shuffle.class org.apache.hadoop.mapred.ShuffleHandler

దశ 11: సవరించండి hadoop-env.sh మరియు క్రింద పేర్కొన్న విధంగా జావా మార్గాన్ని జోడించండి:

hadoop-env.sh జావా హోమ్ పాత్ వంటి హడూప్‌ను అమలు చేయడానికి స్క్రిప్ట్‌లో ఉపయోగించే ఎన్విరాన్మెంట్ వేరియబుల్స్ ఉన్నాయి.

ఆదేశం : మేము హడూప్-env.sh

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - hadoop-env.sh ను కాన్ఫిగర్ చేస్తోంది

దశ 12: హడూప్ హోమ్ డైరెక్టరీకి వెళ్లి నేమ్‌నోడ్‌ను ఫార్మాట్ చేయండి.

ఆదేశం : సిడి

ఆదేశం : cd hadoop-2.7.3

ఆదేశం : బిన్ / హడూప్ ప్రయోజనం-ఫార్మాట్

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - ఫార్మాటింగ్ నేమ్‌నోడ్

ఇది నేమ్‌నోడ్ ద్వారా HDFS ను ఫార్మాట్ చేస్తుంది. ఈ ఆదేశం మొదటిసారి మాత్రమే అమలు అవుతుంది. ఫైల్ సిస్టమ్‌ను ఫార్మాట్ చేయడం అంటే dfs.name.dir వేరియబుల్ పేర్కొన్న డైరెక్టరీని ప్రారంభించడం.

హడూప్ ఫైల్‌సిస్టమ్‌ను ఎప్పుడూ ఫార్మాట్ చేయవద్దు. మీరు HDFS లో నిల్వ చేసిన మీ మొత్తం డేటాను కోల్పోతారు.

దశ 13: నేమ్‌నోడ్ ఆకృతీకరించిన తర్వాత, హడూప్ -2.7.3 / ఎస్‌బిన్ డైరెక్టరీకి వెళ్లి అన్ని డెమోన్‌లను ప్రారంభించండి.

ఆదేశం: cd hadoop-2.7.3 / sbin

గాని మీరు అన్ని డెమోన్‌లను ఒకే ఆదేశంతో ప్రారంభించవచ్చు లేదా వ్యక్తిగతంగా చేయవచ్చు.

ఆదేశం: ./ start-all.sh

పై ఆదేశం కలయిక start-dfs.sh, start-yarn.sh & mr-jobhistory-daemon.sh

లేదా మీరు అన్ని సేవలను ఈ క్రింది విధంగా ఒక్కొక్కటిగా అమలు చేయవచ్చు:

నేమ్‌నోడ్‌ను ప్రారంభించండి:

నేమ్‌నోడ్ ఒక HDFS ఫైల్ సిస్టమ్ యొక్క కేంద్ర భాగం. ఇది HDFS లో నిల్వ చేయబడిన అన్ని ఫైళ్ళ యొక్క డైరెక్టరీ ట్రీని ఉంచుతుంది మరియు క్లస్టర్‌లో నిల్వ చేసిన అన్ని ఫైల్‌లను ట్రాక్ చేస్తుంది.

ఆదేశం: ./hadoop-daemon.sh ప్రారంభ ప్రయోజనం

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - నేమ్‌నోడ్ ప్రారంభిస్తోంది

డేటానోడ్ ప్రారంభించండి:

ప్రారంభంలో, డేటానోడ్ నేమ్నోడ్కు అనుసంధానిస్తుంది మరియు ఇది వేర్వేరు ఆపరేషన్ల కోసం నేమ్నోడ్ నుండి వచ్చిన అభ్యర్థనలకు ప్రతిస్పందిస్తుంది.

ఆదేశం: ./hadoop-daemon.sh ప్రారంభ డేటానోడ్

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - డేటానోడ్ ప్రారంభిస్తోంది

రిసోర్స్ మేనేజర్‌ను ప్రారంభించండి:

రిసోర్స్ మేనేజర్ అనేది అందుబాటులో ఉన్న అన్ని క్లస్టర్ వనరులను మధ్యవర్తిత్వం చేసే మాస్టర్ మరియు తద్వారా YARN సిస్టమ్‌లో నడుస్తున్న పంపిణీ అనువర్తనాలను నిర్వహించడానికి సహాయపడుతుంది. ప్రతి నోడ్ మేనేజర్లను మరియు ప్రతి అప్లికేషన్ యొక్క అప్లికేషన్ మాస్టర్‌ను నిర్వహించడం దీని పని.

ఆదేశం: ./ యార్న్-daemon.sh ప్రారంభ వనరుల నిర్వాహకుడు

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - రిసోర్స్ మేనేజర్‌ను ప్రారంభిస్తోంది

నోడ్ మేనేజర్ ప్రారంభించండి:

ప్రతి మెషీన్ ఫ్రేమ్‌వర్క్‌లోని నోడ్‌మేనేజర్ కంటైనర్‌లను నిర్వహించడం, వాటి వనరుల వినియోగాన్ని పర్యవేక్షించడం మరియు రిసోర్స్ మేనేజర్‌కు నివేదించడం వంటి బాధ్యత కలిగిన ఏజెంట్.

ఆదేశం: ./ యార్న్-daemon.sh నోడ్ మేనేజర్‌ని ప్రారంభించండి

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - నోడ్ మేనేజర్‌ను ప్రారంభిస్తోంది

జాబ్ హిస్టరీ సర్వర్ ప్రారంభించండి:

క్లయింట్ నుండి ఉద్యోగ చరిత్రకు సంబంధించిన అన్ని అభ్యర్థనలను అందించడానికి జాబ్ హిస్టరీ సర్వర్ బాధ్యత వహిస్తుంది.

ఆదేశం : ./mr-jobhistory-daemon.sh చరిత్ర చరిత్రను ప్రారంభించండి

దశ 14: అన్ని హడూప్ సేవలు నడుస్తున్నాయో లేదో తనిఖీ చేయడానికి, క్రింది ఆదేశాన్ని అమలు చేయండి.

ఆదేశం: jps

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - డెమోన్‌లను తనిఖీ చేస్తోంది

ఉదాహరణతో జావాలో బహుళ వారసత్వం

దశ 15: ఇప్పుడు మొజిల్లా బ్రౌజర్ తెరిచి వెళ్ళండి లోకల్ హోస్ట్ : 50070 / dfshealth.html నేమ్‌నోడ్ ఇంటర్‌ఫేస్‌ను తనిఖీ చేయడానికి.

అంజీర్: హడూప్ ఇన్‌స్టాలేషన్ - వెబ్‌యూఐ ప్రారంభిస్తోంది

అభినందనలు, మీరు ఒకే నోడ్ హడూప్ క్లస్టర్‌ను ఒకేసారి విజయవంతంగా ఇన్‌స్టాల్ చేసారు.యొక్క మా తదుపరి బ్లాగులో , మల్టీ నోడ్ క్లస్టర్‌లో హడూప్‌ను ఎలా ఇన్‌స్టాల్ చేయాలో కూడా మేము కవర్ చేస్తాము.

హడూప్‌ను ఎలా ఇన్‌స్టాల్ చేయాలో ఇప్పుడు మీరు అర్థం చేసుకున్నారు, చూడండి ప్రపంచవ్యాప్తంగా విస్తరించి ఉన్న 250,000 మందికి పైగా సంతృప్తికరమైన అభ్యాసకుల నెట్‌వర్క్‌తో విశ్వసనీయ ఆన్‌లైన్ లెర్నింగ్ సంస్థ ఎడురేకా చేత. రిటైల్, సోషల్ మీడియా, ఏవియేషన్, టూరిజం, ఫైనాన్స్ డొమైన్‌లో రియల్ టైమ్ యూజ్ కేసులను ఉపయోగించి హెచ్‌డిఎఫ్‌ఎస్, నూలు, మ్యాప్‌రెడ్యూస్, పిగ్, హైవ్, హెచ్‌బేస్, ఓజీ, ఫ్లూమ్ మరియు స్కూప్‌లో నిపుణులు కావడానికి ఎడురేకా బిగ్ డేటా హడూప్ సర్టిఫికేషన్ ట్రైనింగ్ కోర్సు సహాయపడుతుంది.

మాకు ప్రశ్న ఉందా? దయచేసి దీన్ని వ్యాఖ్యల విభాగంలో పేర్కొనండి మరియు మేము మిమ్మల్ని సంప్రదిస్తాము.