హడాప్ పర్యావరణ వ్యవస్థలో అపాచీ హైవ్ చాలా ముఖ్యమైన చట్రాలలో ఒకటి, ఇది చాలా కీలకమైనది . ఈ బ్లాగులో, ఉబుంటులో అపాచీ హైవ్ మరియు హైవ్ ఇన్స్టాలేషన్ గురించి నేర్చుకుంటాము.
అపాచీ అందులో నివశించే తేనెటీగలు అంటే ఏమిటి?
అపాచీ హైవ్ పంపిణీ చేయబడిన నిల్వ వ్యవస్థలో నివసించే పెద్ద డేటా సెట్లను ప్రశ్నించడానికి మరియు నిర్వహించడానికి వీలు కల్పించే డేటా గిడ్డంగి అవస్థాపన. ఇది హడూప్ పైన నిర్మించబడింది మరియు ఫేస్బుక్ అభివృద్ధి చేసింది. అందులో నివశించే తేనెటీగలు అని పిలువబడే SQL- లాంటి ప్రశ్న భాషను ఉపయోగించి డేటాను ప్రశ్నించడానికి ఒక మార్గాన్ని అందిస్తుంది HiveQL (అందులో నివశించే తేనెటీగ ప్రశ్న భాష).
అంతర్గతంగా, కంపైలర్ అనువదిస్తుంది HiveQL లోకి ప్రకటనలు మ్యాప్రెడ్యూస్ ఉద్యోగాలు, అప్పుడు సమర్పించబడతాయి హడూప్ ఫ్రేమ్వర్క్ అమలు కోసం.
అందులో నివశించే తేనెటీగలు మరియు SQL మధ్య వ్యత్యాసం:
అందులో నివశించే తేనెటీగలు సాంప్రదాయ డేటాబేస్ లాగా చాలా పోలి ఉంటుంది SQL యాక్సెస్. అయితే, ఎందుకంటే అందులో నివశించే తేనెటీగలు ఆధారంగా హడూప్ మరియు మ్యాప్రెడ్యూస్ కార్యకలాపాలు, అనేక ముఖ్యమైన తేడాలు ఉన్నాయి:
హడూప్ దీర్ఘ శ్రేణి స్కాన్ల కోసం ఉద్దేశించినది మరియు అందులో నివశించే తేనెటీగలు ఆధారంగా హడూప్ , ప్రశ్నలకు చాలా ఎక్కువ జాప్యం ఉంటుందని మీరు ఆశించారు. దాని అర్థం ఏమిటంటే అందులో నివశించే తేనెటీగలు సాంప్రదాయ RDBMS డేటాబేస్తో మీరు ఆశించే విధంగా, చాలా వేగంగా ప్రతిస్పందన సమయాలు అవసరమయ్యే అనువర్తనాలకు తగినది కాదు.
చివరగా, అందులో నివశించే తేనెటీగలు చదవడం-ఆధారితమైనది మరియు అందువల్ల లావాదేవీల ప్రాసెసింగ్కు తగినది కాదు, ఇది సాధారణంగా అధిక శాతం వ్రాత కార్యకలాపాలను కలిగి ఉంటుంది.
ఉదాహరణతో జావాలో పోజో క్లాస్ అంటే ఏమిటి
ఉబుంటులో అందులో నివశించే తేనెటీగలు సంస్థాపన:
దయచేసి ఇన్స్టాల్ చేయడానికి క్రింది దశలను అనుసరించండి అపాచీ హైవ్ ఉబుంటులో:
దశ 1: డౌన్లోడ్ అందులో నివశించే తేనెటీగలు.
ఆదేశం: wget http://archive.apache.org/dist/hive/hive-2.1.0/apache-hive-2.1.0-bin.tar.gz
దశ 2: సంగ్రహించండి తారు ఫైల్.
ఆదేశం: tar -xzf apache-hive-2.1.0-bin.tar.gz
ఆదేశం: ls
దశ 3: సవరించండి “.బాష్ర్క్” వినియోగదారు కోసం పర్యావరణ చరరాశులను నవీకరించడానికి ఫైల్.
ఆదేశం: sudo gedit .bashrc
ఫైల్ చివరిలో కింది వాటిని జోడించండి:
# HIVE_HOME ని సెట్ చేయండి
ఎగుమతి HIVE_HOME = / home / edureka / apache-hive-2.1.0-bin
ఎగుమతి PATH = $ PATH: /home/edureka/apache-hive-2.1.0-bin/bin
అలాగే, హడూప్ మార్గం కూడా సెట్ చేయబడిందని నిర్ధారించుకోండి.
మార్పులు ఒకే టెర్మినల్లో పని చేయడానికి కమాండ్ క్రింద అమలు చేయండి.
ఆదేశం: మూలం .bashrc
దశ 4: అందులో నివశించే తేనెటీగ సంస్కరణను తనిఖీ చేయండి.
జావాలో పూర్ణాంకానికి డబుల్ ఎలా మార్చాలి
దశ 5: సృష్టించండి అందులో నివశించే తేనెటీగలు లోపల డైరెక్టరీలు HDFS . డైరెక్టరీ ‘గిడ్డంగి’ అందులో నివశించే తేనెటీగకు సంబంధించిన పట్టిక లేదా డేటాను నిల్వ చేసే ప్రదేశం.
ఆదేశం:
- hdfs dfs -mkdir -p / user / hive / గిడ్డంగి
- hdfs dfs -mkdir / tmp
దశ 6: పట్టిక కోసం చదవడానికి / వ్రాయడానికి అనుమతులను సెట్ చేయండి.
ఆదేశం:
ఈ ఆదేశంలో, మేము సమూహానికి వ్రాతపూర్వక అనుమతి ఇస్తున్నాము:
- hdfs dfs -chmod g + w / user / hive / గిడ్డంగి
- hdfs dfs -chmod g + w / tmp
దశ 7: సెట్ హడూప్ మార్గం h ive-env.sh
ఆదేశం: cd apache-hive-2.1.0-bin /
ఆదేశం: gedit conf / hive-env.sh
దిగువ స్నాప్షాట్లో చూపిన విధంగా పారామితులను సెట్ చేయండి.
దశ 8: సవరించండి అందులో నివశించే తేనెటీగలు- site.xml
ఆదేశం: gedit conf / hive-site.xml
javax.jdo.option.ConnectionURL jdbc: derby: databaseName = / home / edureka / apache-hive-2.1.0-bin / metastore_dbcreate = JDBC మెటాస్టోర్ కోసం నిజమైన JDBC కనెక్ట్ స్ట్రింగ్. కనెక్షన్ను గుప్తీకరించడానికి / ప్రామాణీకరించడానికి SSL ని ఉపయోగించడానికి, కనెక్షన్ URL లో డేటాబేస్-నిర్దిష్ట SSL ఫ్లాగ్ను అందించండి. ఉదాహరణకు, పోస్ట్గ్రెస్ డేటాబేస్ కోసం jdbc: postgresql: // myhost / db? Ssl = true. hive.metastore.warehouse.dir / యూజర్ / అందులో నివశించే తేనెటీగ / గిడ్డంగి గిడ్డంగి కోసం డిఫాల్ట్ డేటాబేస్ యొక్క స్థానం hive.metastore.uris రిమోట్ మెటాస్టోర్ కోసం పొదుపు URI. రిమోట్ మెటాస్టోర్కు కనెక్ట్ చేయడానికి మెటాస్టోర్ క్లయింట్ ఉపయోగిస్తుంది. javax.jdo.option.ConnectionDriverName org.apache.derby.jdbc.EmbeddedDriver JDBC మెటాస్టోర్ కోసం డ్రైవర్ తరగతి పేరు javax.jdo.PersistenceManagerFactoryClass org.datanucleus.api.jdo.JDOPersistenceManagerFactory
దశ 9: అప్రమేయంగా, అందులో నివశించే తేనెటీగలు ఉపయోగిస్తుంది డెర్బీ డేటాబేస్. డెర్బీ డేటాబేస్ ప్రారంభించండి.
ఆదేశం: bin / schematool -initSchema -dbType derby
దశ 10 :ప్రారంభించండి అందులో నివశించే తేనెటీగలు.
ఆదేశం: అందులో నివశించే తేనెటీగలు
దశ 11 :హైవ్ షెల్లో కొన్ని ప్రశ్నలను అమలు చేయండి.
ఆదేశం: డేటాబేస్లను చూపించు
ఆదేశం: టేబుల్ ఉద్యోగిని సృష్టించండి (ఐడి స్ట్రింగ్, నేమ్ స్ట్రింగ్, డిపార్ట్మెంట్ స్ట్రింగ్) అడ్డు వరుస ఫార్మాట్ టెక్స్ట్ఫైల్గా నిల్వ చేయబడిన ‘‘ ద్వారా ముగించబడిన ఫీల్డ్లు
ఆదేశం: పట్టికలను చూపించు
దశ 12: నుండి నిష్క్రమించడానికి అందులో నివశించే తేనెటీగలు:
ఆదేశం: బయటకి దారి
ఇప్పుడు మీరు హైవ్ ఇన్స్టాలేషన్తో పూర్తి చేసారు, తదుపరి దశ హైవ్ షెల్లో హైవ్ ఆదేశాలను ప్రయత్నించడం. అందువల్ల, మా తదుపరి బ్లాగ్ “ HQL లోని ఉదాహరణలతో టాప్ హైవ్ ఆదేశాలు హైవ్ ఆదేశాలను నేర్చుకోవటానికి ”మీకు సహాయం చేస్తుంది.
సంబంధిత పోస్ట్లు:
SQL లో ఫంక్షన్ ఏమిటి