అపాచీ అందులో నివశించే తేనెటీగలు పరిచయం



అపాచీ హైవ్ అనేది హడూప్ పైన నిర్మించిన డేటా వేర్‌హౌసింగ్ ప్యాకేజీ మరియు ఇది డేటా విశ్లేషణ కోసం ఉపయోగించబడుతుంది. అందులో నివశించే తేనెటీగలు SQL తో సౌకర్యంగా ఉన్న వినియోగదారులను లక్ష్యంగా చేసుకుంటాయి.

అపాచీ హైవ్ అనేది హడూప్ పైన నిర్మించిన డేటా వేర్‌హౌసింగ్ ప్యాకేజీ మరియు ఇది డేటా విశ్లేషణ కోసం ఉపయోగించబడుతుంది. అందులో నివశించే తేనెటీగలు SQL తో సౌకర్యంగా ఉన్న వినియోగదారులను లక్ష్యంగా చేసుకుంటాయి. ఇది SQL ను పోలి ఉంటుంది మరియు నిర్మాణాత్మక డేటాను నిర్వహించడానికి మరియు ప్రశ్నించడానికి ఉపయోగించే HiveQL అని పిలుస్తారు. హడాప్ యొక్క సంక్లిష్ట సంక్లిష్టతకు అపాచీ హైవ్ ఉపయోగించబడుతుంది. ఈ భాష సాంప్రదాయ మ్యాప్‌ను / ప్రోగ్రామర్‌లను వారి అనుకూల మ్యాపర్‌లను మరియు తగ్గించేవారిని ప్లగ్ చేయడానికి అనుమతిస్తుంది. హైవ్ యొక్క ప్రసిద్ధ లక్షణం ఏమిటంటే జావా నేర్చుకోవలసిన అవసరం లేదు.





హడూప్ ఆధారంగా ఓపెన్ సోర్స్ పెటా-బైట్ స్కేల్ డేట్ వేర్‌హౌసింగ్ ఫ్రేమ్‌వర్క్ అయిన హైవ్‌ను ఫేస్‌బుక్‌లోని డేటా ఇన్‌ఫ్రాస్ట్రక్చర్ బృందం అభివృద్ధి చేసింది. ఫేస్‌బుక్‌లో అవసరాలను తీర్చడానికి ఉపయోగిస్తున్న సాంకేతిక పరిజ్ఞానాలలో అందులో నివశించే తేనెటీగలు కూడా ఒకటి. ఫేస్‌బుక్‌లో అంతర్గతంగా వినియోగదారులందరికీ హైవ్ బాగా ప్రాచుర్యం పొందింది మరియు అనేక రకాలైన అనువర్తనాల కోసం వందలాది మంది వినియోగదారులతో క్లస్టర్‌లో వేలాది ఉద్యోగాలను అమలు చేయడానికి ఉపయోగించబడుతోంది. ఫేస్‌బుక్‌లోని హైవ్-హడూప్ క్లస్టర్ 2 పిబి కంటే ఎక్కువ ముడి డేటాను నిల్వ చేస్తుంది మరియు రోజూ 15 టిబి డేటాను క్రమం తప్పకుండా లోడ్ చేస్తుంది.

జావాలో రిఫరెన్స్ ద్వారా ఎలా పాస్ చేయాలి

జనాదరణ పొందిన మరియు యూజర్ ఫ్రెండ్లీగా ఉండే దాని యొక్క కొన్ని లక్షణాలను చూద్దాం:



  • అనుకూల మ్యాపర్లు మరియు తగ్గించేవారిని ప్లగిన్ చేయడానికి ప్రోగ్రామర్‌లను అనుమతిస్తుంది.
  • డేటా వేర్‌హౌస్ మౌలిక సదుపాయాలు ఉన్నాయి.
  • సులభమైన డేటా ETL ని ప్రారంభించడానికి సాధనాలను అందిస్తుంది.
  • QL అని పిలువబడే SQL లాంటి ప్రశ్న భాషను నిర్వచిస్తుంది.

అపాచీ హైవ్ యూజ్ కేసు - ఫేస్బుక్:

అందులో నివశించే తేనెటీగలు వాడకం కేసు - ఫేస్బుక్

హైవ్‌ను అమలు చేయడానికి ముందు, ఉత్పత్తి చేయబడిన డేటా పరిమాణం పెరగడం లేదా పేలడం వల్ల ఫేస్‌బుక్ చాలా సవాళ్లను ఎదుర్కొంది, వాటిని నిర్వహించడం చాలా కష్టమైంది. సాంప్రదాయ RDBMS ఒత్తిడిని నిర్వహించలేకపోయింది మరియు ఫలితంగా ఫేస్బుక్ మంచి ఎంపికల కోసం చూస్తోంది. ఈ రాబోయే సమస్యను పరిష్కరించడానికి, ఫేస్బుక్ మొదట్లో హడూప్ మ్యాప్‌రెడ్యూస్‌ను ఉపయోగించటానికి ప్రయత్నించింది, కాని ప్రోగ్రామింగ్‌లో ఇబ్బంది మరియు SQL లో తప్పనిసరి పరిజ్ఞానం, ఇది అసాధ్యమైన పరిష్కారంగా మారింది. అందులో నివశించే తేనెటీగలు వారు ఎదుర్కొంటున్న సవాళ్లను అధిగమించడానికి అనుమతించాయి.

అందులో నివశించే తేనెటీగలు, వారు ఇప్పుడు ఈ క్రింది వాటిని చేయగలరు:



  • పట్టికలను విభజించి బకెట్ చేయవచ్చు
  • స్కీమా వశ్యత మరియు పరిణామం
  • జెడిబిసి / ఓడిబిసి డ్రైవర్లు అందుబాటులో ఉన్నారు
  • అందులో నివశించే తేనెటీగ పట్టికలను నేరుగా HDFS లో నిర్వచించవచ్చు
  • విస్తరించదగినది - రకాలు, ఆకృతులు, విధులు మరియు స్క్రిప్ట్‌లు

ఆరోగ్య సంరక్షణలో అందులో నివశించే తేనెటీగలు వాడకం కేసు:

అందులో నివశించే తేనెటీగలు ఎక్కడ ఉపయోగించాలి?

అపాచీ హైవ్ కింది ప్రదేశాలలో ఉపయోగించవచ్చు:

  • డేటా మైనింగ్
  • లాగ్ ప్రాసెసింగ్
  • పత్ర సూచిక
  • కస్టమర్ ఫేసింగ్ బిజినెస్ ఇంటెలిజెన్స్
  • ప్రిడిక్టివ్ మోడలింగ్
  • పరికల్పన పరీక్ష

అందులో నివశించే తేనెటీగలు:

అందులో నివశించే తేనెటీగలు కింది ప్రధాన భాగాలను కలిగి ఉంటాయి:

  • మెటాస్టోర్ - మెటాడేటాను నిల్వ చేయడానికి.
  • JDBC / ODBC - SQL ప్రశ్నలను మ్యాప్‌రెడ్యూస్ యొక్క శ్రేణికి మార్చడానికి ప్రశ్న కంపైలర్ మరియు ఎగ్జిక్యూషన్ ఇంజిన్.
  • SerDe మరియు ObjectInspectors - డేటా ఆకృతులు మరియు రకాలు కోసం.
  • UDF / UDAF - వినియోగదారు నిర్వచించిన విధుల కోసం.
  • క్లయింట్లు - MySQL కమాండ్ లైన్ మరియు వెబ్ UI మాదిరిగానే.

అందులో నివశించే తేనెటీగలు యొక్క భాగాలు:

మెటాస్టోర్:

c ++ లో క్రమబద్ధీకరించు

మెటాస్టోర్ పట్టికలు, విభజనలు, పట్టికలలోని నిలువు వరుసల గురించి సమాచారాన్ని నిల్వ చేస్తుంది. మెటాస్టోర్లో నిల్వ చేయడానికి 3 మార్గాలు ఉన్నాయి: ఎంబెడెడ్ మెటాస్టోర్, లోకల్ మెటాస్టోర్ మరియు రిమోట్ మెటాస్టోర్. ఎక్కువగా, రిమోట్ మెటాస్టోర్ ఉత్పత్తి మోడ్‌లో ఉపయోగించబడుతుంది.

అందులో నివశించే తేనెటీగలు యొక్క పరిమితులు:

అందులో నివశించే తేనెటీగలు కింది పరిమితులను కలిగి ఉన్నాయి మరియు అటువంటి పరిస్థితులలో ఉపయోగించబడవు:

  • ఆన్‌లైన్ లావాదేవీ ప్రాసెసింగ్ కోసం రూపొందించబడలేదు.
  • ఇంటరాక్టివ్ డేటా బ్రౌజింగ్ కోసం ఆమోదయోగ్యమైన జాప్యాన్ని అందిస్తుంది.
  • నిజ-సమయ ప్రశ్నలు మరియు వరుస స్థాయి నవీకరణలను అందించదు.
  • అందులో నివశించే తేనెటీగ ప్రశ్నలకు ఆలస్యం సాధారణంగా చాలా ఎక్కువ.

మాకు ప్రశ్న ఉందా? వ్యాఖ్యల విభాగంలో వాటిని ప్రస్తావించండి మరియు మేము మిమ్మల్ని సంప్రదిస్తాము.

సంబంధిత పోస్ట్లు:

mysql వర్క్‌బెంచ్‌తో ప్రారంభించడం

అందులో నివశించే తేనెటీగలు