ఉబుంటులో అపాచీ హైవ్ ఇన్స్టాలేషన్



ఈ బ్లాగులో మేము ఉబుంటులో అపాచీ హైవ్ ఇన్స్టాలేషన్ & హడూప్ హైవ్, హైవ్ స్క్వెల్, హైవ్ డేటాబేస్, హైవ్ సర్వర్ & హైవ్ ఇన్స్టాలేషన్ చుట్టూ ఉన్న భావనల గురించి తెలుసుకుంటాము.

హడాప్ పర్యావరణ వ్యవస్థలో అపాచీ హైవ్ చాలా ముఖ్యమైన చట్రాలలో ఒకటి, ఇది చాలా కీలకమైనది . ఈ బ్లాగులో, ఉబుంటులో అపాచీ హైవ్ మరియు హైవ్ ఇన్స్టాలేషన్ గురించి నేర్చుకుంటాము.

అపాచీ అందులో నివశించే తేనెటీగలు అంటే ఏమిటి?

అపాచీ హైవ్ పంపిణీ చేయబడిన నిల్వ వ్యవస్థలో నివసించే పెద్ద డేటా సెట్‌లను ప్రశ్నించడానికి మరియు నిర్వహించడానికి వీలు కల్పించే డేటా గిడ్డంగి అవస్థాపన. ఇది హడూప్ పైన నిర్మించబడింది మరియు ఫేస్బుక్ అభివృద్ధి చేసింది. అందులో నివశించే తేనెటీగలు అని పిలువబడే SQL- లాంటి ప్రశ్న భాషను ఉపయోగించి డేటాను ప్రశ్నించడానికి ఒక మార్గాన్ని అందిస్తుంది HiveQL (అందులో నివశించే తేనెటీగ ప్రశ్న భాష).





అంతర్గతంగా, కంపైలర్ అనువదిస్తుంది HiveQL లోకి ప్రకటనలు మ్యాప్‌రెడ్యూస్ ఉద్యోగాలు, అప్పుడు సమర్పించబడతాయి హడూప్ ఫ్రేమ్‌వర్క్ అమలు కోసం.

అందులో నివశించే తేనెటీగలు మరియు SQL మధ్య వ్యత్యాసం:

అందులో నివశించే తేనెటీగలు సాంప్రదాయ డేటాబేస్ లాగా చాలా పోలి ఉంటుంది SQL యాక్సెస్. అయితే, ఎందుకంటే అందులో నివశించే తేనెటీగలు ఆధారంగా హడూప్ మరియు మ్యాప్‌రెడ్యూస్ కార్యకలాపాలు, అనేక ముఖ్యమైన తేడాలు ఉన్నాయి:



హడూప్ దీర్ఘ శ్రేణి స్కాన్ల కోసం ఉద్దేశించినది మరియు అందులో నివశించే తేనెటీగలు ఆధారంగా హడూప్ , ప్రశ్నలకు చాలా ఎక్కువ జాప్యం ఉంటుందని మీరు ఆశించారు. దాని అర్థం ఏమిటంటే అందులో నివశించే తేనెటీగలు సాంప్రదాయ RDBMS డేటాబేస్‌తో మీరు ఆశించే విధంగా, చాలా వేగంగా ప్రతిస్పందన సమయాలు అవసరమయ్యే అనువర్తనాలకు తగినది కాదు.

చివరగా, అందులో నివశించే తేనెటీగలు చదవడం-ఆధారితమైనది మరియు అందువల్ల లావాదేవీల ప్రాసెసింగ్‌కు తగినది కాదు, ఇది సాధారణంగా అధిక శాతం వ్రాత కార్యకలాపాలను కలిగి ఉంటుంది.

ఉదాహరణతో జావాలో పోజో క్లాస్ అంటే ఏమిటి

ఉబుంటులో అందులో నివశించే తేనెటీగలు సంస్థాపన:

దయచేసి ఇన్‌స్టాల్ చేయడానికి క్రింది దశలను అనుసరించండి అపాచీ హైవ్ ఉబుంటులో:



దశ 1: డౌన్‌లోడ్ అందులో నివశించే తేనెటీగలు.

ఆదేశం: wget http://archive.apache.org/dist/hive/hive-2.1.0/apache-hive-2.1.0-bin.tar.gz

దశ 2: సంగ్రహించండి తారు ఫైల్.

ఆదేశం: tar -xzf apache-hive-2.1.0-bin.tar.gz

ఆదేశం: ls

స్ప్రెడ్ హైవ్ ఫైల్ - అందులో నివశించే తేనెటీగలు సంస్థాపన - ఎడురేకా

దశ 3: సవరించండి “.బాష్ర్క్” వినియోగదారు కోసం పర్యావరణ చరరాశులను నవీకరించడానికి ఫైల్.

ఆదేశం: sudo gedit .bashrc

ఫైల్ చివరిలో కింది వాటిని జోడించండి:

# HIVE_HOME ని సెట్ చేయండి

ఎగుమతి HIVE_HOME = / home / edureka / apache-hive-2.1.0-bin
ఎగుమతి PATH = $ PATH: /home/edureka/apache-hive-2.1.0-bin/bin

అలాగే, హడూప్ మార్గం కూడా సెట్ చేయబడిందని నిర్ధారించుకోండి.

మార్పులు ఒకే టెర్మినల్‌లో పని చేయడానికి కమాండ్ క్రింద అమలు చేయండి.

ఆదేశం: మూలం .bashrc

దశ 4: అందులో నివశించే తేనెటీగ సంస్కరణను తనిఖీ చేయండి.

జావాలో పూర్ణాంకానికి డబుల్ ఎలా మార్చాలి

దశ 5: సృష్టించండి అందులో నివశించే తేనెటీగలు లోపల డైరెక్టరీలు HDFS . డైరెక్టరీ ‘గిడ్డంగి’ అందులో నివశించే తేనెటీగకు సంబంధించిన పట్టిక లేదా డేటాను నిల్వ చేసే ప్రదేశం.

ఆదేశం:

  • hdfs dfs -mkdir -p / user / hive / గిడ్డంగి
  • hdfs dfs -mkdir / tmp

దశ 6: పట్టిక కోసం చదవడానికి / వ్రాయడానికి అనుమతులను సెట్ చేయండి.

ఆదేశం:

ఈ ఆదేశంలో, మేము సమూహానికి వ్రాతపూర్వక అనుమతి ఇస్తున్నాము:

  • hdfs dfs -chmod g + w / user / hive / గిడ్డంగి
  • hdfs dfs -chmod g + w / tmp

దశ 7: సెట్ హడూప్ మార్గం h ive-env.sh

ఆదేశం: cd apache-hive-2.1.0-bin /

ఆదేశం: gedit conf / hive-env.sh

దిగువ స్నాప్‌షాట్‌లో చూపిన విధంగా పారామితులను సెట్ చేయండి.

దశ 8: సవరించండి అందులో నివశించే తేనెటీగలు- site.xml

ఆదేశం: gedit conf / hive-site.xml

javax.jdo.option.ConnectionURL jdbc: derby: databaseName = / home / edureka / apache-hive-2.1.0-bin / metastore_dbcreate = JDBC మెటాస్టోర్ కోసం నిజమైన JDBC కనెక్ట్ స్ట్రింగ్. కనెక్షన్‌ను గుప్తీకరించడానికి / ప్రామాణీకరించడానికి SSL ని ఉపయోగించడానికి, కనెక్షన్ URL లో డేటాబేస్-నిర్దిష్ట SSL ఫ్లాగ్‌ను అందించండి. ఉదాహరణకు, పోస్ట్‌గ్రెస్ డేటాబేస్ కోసం jdbc: postgresql: // myhost / db? Ssl = true. hive.metastore.warehouse.dir / యూజర్ / అందులో నివశించే తేనెటీగ / గిడ్డంగి గిడ్డంగి కోసం డిఫాల్ట్ డేటాబేస్ యొక్క స్థానం hive.metastore.uris రిమోట్ మెటాస్టోర్ కోసం పొదుపు URI. రిమోట్ మెటాస్టోర్‌కు కనెక్ట్ చేయడానికి మెటాస్టోర్ క్లయింట్ ఉపయోగిస్తుంది. javax.jdo.option.ConnectionDriverName org.apache.derby.jdbc.EmbeddedDriver JDBC మెటాస్టోర్ కోసం డ్రైవర్ తరగతి పేరు javax.jdo.PersistenceManagerFactoryClass org.datanucleus.api.jdo.JDOPersistenceManagerFactory

దశ 9: అప్రమేయంగా, అందులో నివశించే తేనెటీగలు ఉపయోగిస్తుంది డెర్బీ డేటాబేస్. డెర్బీ డేటాబేస్ ప్రారంభించండి.

ఆదేశం: bin / schematool -initSchema -dbType derby

దశ 10 :ప్రారంభించండి అందులో నివశించే తేనెటీగలు.

ఆదేశం: అందులో నివశించే తేనెటీగలు

దశ 11 :హైవ్ షెల్‌లో కొన్ని ప్రశ్నలను అమలు చేయండి.

ఆదేశం: డేటాబేస్లను చూపించు

ఆదేశం: టేబుల్ ఉద్యోగిని సృష్టించండి (ఐడి స్ట్రింగ్, నేమ్ స్ట్రింగ్, డిపార్ట్మెంట్ స్ట్రింగ్) అడ్డు వరుస ఫార్మాట్ టెక్స్ట్‌ఫైల్‌గా నిల్వ చేయబడిన ‘‘ ద్వారా ముగించబడిన ఫీల్డ్‌లు

ఆదేశం: పట్టికలను చూపించు

దశ 12: నుండి నిష్క్రమించడానికి అందులో నివశించే తేనెటీగలు:

ఆదేశం: బయటకి దారి

ఇప్పుడు మీరు హైవ్ ఇన్‌స్టాలేషన్‌తో పూర్తి చేసారు, తదుపరి దశ హైవ్ షెల్‌లో హైవ్ ఆదేశాలను ప్రయత్నించడం. అందువల్ల, మా తదుపరి బ్లాగ్ “ HQL లోని ఉదాహరణలతో టాప్ హైవ్ ఆదేశాలు హైవ్ ఆదేశాలను నేర్చుకోవటానికి ”మీకు సహాయం చేస్తుంది.

సంబంధిత పోస్ట్లు:

SQL లో ఫంక్షన్ ఏమిటి

హైవ్ స్క్రిప్ట్‌లను ఎలా అమలు చేయాలి?

అందులో నివశించే తేనెటీగలు

అపాచీ అందులో నివశించే తేనెటీగలు పరిచయం