అపాచీ హైవ్ అనేది హడూప్ పైన నిర్మించిన డేటా వేర్హౌసింగ్ ప్యాకేజీ మరియు ఇది డేటా విశ్లేషణ కోసం ఉపయోగించబడుతుంది. అందులో నివశించే తేనెటీగలు SQL తో సౌకర్యంగా ఉన్న వినియోగదారులను లక్ష్యంగా చేసుకుంటాయి. ఇది SQL ను పోలి ఉంటుంది మరియు నిర్మాణాత్మక డేటాను నిర్వహించడానికి మరియు ప్రశ్నించడానికి ఉపయోగించే HiveQL అని పిలుస్తారు. హడాప్ యొక్క సంక్లిష్ట సంక్లిష్టతకు అపాచీ హైవ్ ఉపయోగించబడుతుంది. ఈ భాష సాంప్రదాయ మ్యాప్ను / ప్రోగ్రామర్లను వారి అనుకూల మ్యాపర్లను మరియు తగ్గించేవారిని ప్లగ్ చేయడానికి అనుమతిస్తుంది. హైవ్ యొక్క ప్రసిద్ధ లక్షణం ఏమిటంటే జావా నేర్చుకోవలసిన అవసరం లేదు.
హడూప్ ఆధారంగా ఓపెన్ సోర్స్ పెటా-బైట్ స్కేల్ డేట్ వేర్హౌసింగ్ ఫ్రేమ్వర్క్ అయిన హైవ్ను ఫేస్బుక్లోని డేటా ఇన్ఫ్రాస్ట్రక్చర్ బృందం అభివృద్ధి చేసింది. ఫేస్బుక్లో అవసరాలను తీర్చడానికి ఉపయోగిస్తున్న సాంకేతిక పరిజ్ఞానాలలో అందులో నివశించే తేనెటీగలు కూడా ఒకటి. ఫేస్బుక్లో అంతర్గతంగా వినియోగదారులందరికీ హైవ్ బాగా ప్రాచుర్యం పొందింది మరియు అనేక రకాలైన అనువర్తనాల కోసం వందలాది మంది వినియోగదారులతో క్లస్టర్లో వేలాది ఉద్యోగాలను అమలు చేయడానికి ఉపయోగించబడుతోంది. ఫేస్బుక్లోని హైవ్-హడూప్ క్లస్టర్ 2 పిబి కంటే ఎక్కువ ముడి డేటాను నిల్వ చేస్తుంది మరియు రోజూ 15 టిబి డేటాను క్రమం తప్పకుండా లోడ్ చేస్తుంది.
జావాలో రిఫరెన్స్ ద్వారా ఎలా పాస్ చేయాలి
జనాదరణ పొందిన మరియు యూజర్ ఫ్రెండ్లీగా ఉండే దాని యొక్క కొన్ని లక్షణాలను చూద్దాం:
- అనుకూల మ్యాపర్లు మరియు తగ్గించేవారిని ప్లగిన్ చేయడానికి ప్రోగ్రామర్లను అనుమతిస్తుంది.
- డేటా వేర్హౌస్ మౌలిక సదుపాయాలు ఉన్నాయి.
- సులభమైన డేటా ETL ని ప్రారంభించడానికి సాధనాలను అందిస్తుంది.
- QL అని పిలువబడే SQL లాంటి ప్రశ్న భాషను నిర్వచిస్తుంది.
అపాచీ హైవ్ యూజ్ కేసు - ఫేస్బుక్:
హైవ్ను అమలు చేయడానికి ముందు, ఉత్పత్తి చేయబడిన డేటా పరిమాణం పెరగడం లేదా పేలడం వల్ల ఫేస్బుక్ చాలా సవాళ్లను ఎదుర్కొంది, వాటిని నిర్వహించడం చాలా కష్టమైంది. సాంప్రదాయ RDBMS ఒత్తిడిని నిర్వహించలేకపోయింది మరియు ఫలితంగా ఫేస్బుక్ మంచి ఎంపికల కోసం చూస్తోంది. ఈ రాబోయే సమస్యను పరిష్కరించడానికి, ఫేస్బుక్ మొదట్లో హడూప్ మ్యాప్రెడ్యూస్ను ఉపయోగించటానికి ప్రయత్నించింది, కాని ప్రోగ్రామింగ్లో ఇబ్బంది మరియు SQL లో తప్పనిసరి పరిజ్ఞానం, ఇది అసాధ్యమైన పరిష్కారంగా మారింది. అందులో నివశించే తేనెటీగలు వారు ఎదుర్కొంటున్న సవాళ్లను అధిగమించడానికి అనుమతించాయి.
అందులో నివశించే తేనెటీగలు, వారు ఇప్పుడు ఈ క్రింది వాటిని చేయగలరు:
- పట్టికలను విభజించి బకెట్ చేయవచ్చు
- స్కీమా వశ్యత మరియు పరిణామం
- జెడిబిసి / ఓడిబిసి డ్రైవర్లు అందుబాటులో ఉన్నారు
- అందులో నివశించే తేనెటీగ పట్టికలను నేరుగా HDFS లో నిర్వచించవచ్చు
- విస్తరించదగినది - రకాలు, ఆకృతులు, విధులు మరియు స్క్రిప్ట్లు
ఆరోగ్య సంరక్షణలో అందులో నివశించే తేనెటీగలు వాడకం కేసు:
అందులో నివశించే తేనెటీగలు ఎక్కడ ఉపయోగించాలి?
అపాచీ హైవ్ కింది ప్రదేశాలలో ఉపయోగించవచ్చు:
- డేటా మైనింగ్
- లాగ్ ప్రాసెసింగ్
- పత్ర సూచిక
- కస్టమర్ ఫేసింగ్ బిజినెస్ ఇంటెలిజెన్స్
- ప్రిడిక్టివ్ మోడలింగ్
- పరికల్పన పరీక్ష
అందులో నివశించే తేనెటీగలు:
అందులో నివశించే తేనెటీగలు కింది ప్రధాన భాగాలను కలిగి ఉంటాయి:
- మెటాస్టోర్ - మెటాడేటాను నిల్వ చేయడానికి.
- JDBC / ODBC - SQL ప్రశ్నలను మ్యాప్రెడ్యూస్ యొక్క శ్రేణికి మార్చడానికి ప్రశ్న కంపైలర్ మరియు ఎగ్జిక్యూషన్ ఇంజిన్.
- SerDe మరియు ObjectInspectors - డేటా ఆకృతులు మరియు రకాలు కోసం.
- UDF / UDAF - వినియోగదారు నిర్వచించిన విధుల కోసం.
- క్లయింట్లు - MySQL కమాండ్ లైన్ మరియు వెబ్ UI మాదిరిగానే.
అందులో నివశించే తేనెటీగలు యొక్క భాగాలు:
మెటాస్టోర్:
c ++ లో క్రమబద్ధీకరించు
మెటాస్టోర్ పట్టికలు, విభజనలు, పట్టికలలోని నిలువు వరుసల గురించి సమాచారాన్ని నిల్వ చేస్తుంది. మెటాస్టోర్లో నిల్వ చేయడానికి 3 మార్గాలు ఉన్నాయి: ఎంబెడెడ్ మెటాస్టోర్, లోకల్ మెటాస్టోర్ మరియు రిమోట్ మెటాస్టోర్. ఎక్కువగా, రిమోట్ మెటాస్టోర్ ఉత్పత్తి మోడ్లో ఉపయోగించబడుతుంది.
అందులో నివశించే తేనెటీగలు యొక్క పరిమితులు:
అందులో నివశించే తేనెటీగలు కింది పరిమితులను కలిగి ఉన్నాయి మరియు అటువంటి పరిస్థితులలో ఉపయోగించబడవు:
- ఆన్లైన్ లావాదేవీ ప్రాసెసింగ్ కోసం రూపొందించబడలేదు.
- ఇంటరాక్టివ్ డేటా బ్రౌజింగ్ కోసం ఆమోదయోగ్యమైన జాప్యాన్ని అందిస్తుంది.
- నిజ-సమయ ప్రశ్నలు మరియు వరుస స్థాయి నవీకరణలను అందించదు.
- అందులో నివశించే తేనెటీగ ప్రశ్నలకు ఆలస్యం సాధారణంగా చాలా ఎక్కువ.
మాకు ప్రశ్న ఉందా? వ్యాఖ్యల విభాగంలో వాటిని ప్రస్తావించండి మరియు మేము మిమ్మల్ని సంప్రదిస్తాము.
సంబంధిత పోస్ట్లు:
mysql వర్క్బెంచ్తో ప్రారంభించడం