హైవ్ అనేది హడూప్ కోసం ఒక డేటా గిడ్డంగి వ్యవస్థ, ఇది సులభమైన డేటా సారాంశం, తాత్కాలిక ప్రశ్నలు మరియు హడూప్ అనుకూల ఫైల్ సిస్టమ్స్లో నిల్వ చేయబడిన పెద్ద డేటాసెట్ల విశ్లేషణను సులభతరం చేస్తుంది. పట్టికలు, అడ్డు వరుసలు, నిలువు వరుసలు మరియు విభజనలు వంటి బాగా అర్థం చేసుకున్న డేటాబేస్ భావనలలోకి అందులో నివశించే తేనెటీగలు. ఇది పూర్ణాంకాలు, ఫ్లోట్లు, డబుల్స్ మరియు స్ట్రింగ్స్ వంటి ఆదిమ రకాలను మద్దతిస్తుంది. హైవ్ అసోసియేటివ్ అర్రేస్, లిస్ట్స్, స్ట్రక్ట్స్, మరియు సీరియలైజ్ మరియు డెస్రియలైజ్డ్ API లకు మద్దతు ఇస్తుంది.
హైవ్ డేటా మోడళ్లను వివరంగా చూద్దాం
హైవ్ డేటా మోడల్స్:
అందులో నివశించే తేనెటీగ డేటా నమూనాలు క్రింది భాగాలను కలిగి ఉంటాయి:
పైథాన్లో ఉన్న స్థితి ఏమిటి
- డేటాబేస్లు
- పట్టికలు
- విభజనలు
- బకెట్లు లేదా సమూహాలు
విభజనలు:
విభజన అంటే ‘డేటా’ వంటి విభజన కాలమ్ విలువ ఆధారంగా పట్టికను ముతక కణిత భాగాలుగా విభజించడం. ఇది డేటా ముక్కలపై ప్రశ్నలు చేయడం వేగవంతం చేస్తుంది
కాబట్టి, విభజన యొక్క పని ఏమిటి? విభజన కీలు డేటా ఎలా నిల్వ చేయబడుతుందో నిర్ణయిస్తాయి. ఇక్కడ, విభజన కీ యొక్క ప్రతి ప్రత్యేక విలువ పట్టిక యొక్క విభజనను నిర్వచిస్తుంది. విభజనలకు సౌలభ్యం కోసం తేదీల పేరు పెట్టారు. ఇది హెచ్డిఎఫ్ఎస్లోని ‘బ్లాక్ స్ప్లిటింగ్’ మాదిరిగానే ఉంటుంది.
def __init__ పైథాన్
బకెట్లు:
సమర్థవంతమైన ప్రశ్నలకు ఉపయోగపడే డేటాకు బకెట్లు అదనపు నిర్మాణాన్ని ఇస్తాయి. జాయిన్ కాలమ్తో సహా ఒకే నిలువు వరుసలలో బకెట్ చేయబడిన రెండు పట్టికలలో చేరడం మ్యాప్-సైడ్ జాయిన్గా అమలు చేయవచ్చు. ఉపయోగించిన ID ద్వారా బకెట్ చేయడం అంటే మొత్తం వినియోగదారుల సమితి యొక్క యాదృచ్ఛిక నమూనాలో అమలు చేయడం ద్వారా వినియోగదారు-ఆధారిత ప్రశ్నను త్వరగా అంచనా వేయవచ్చు.
జావా ప్రోగ్రామ్ను ఎలా ముగించాలి
మాకు ప్రశ్న ఉందా? దయచేసి వాటిని వ్యాఖ్యల విభాగంలో పేర్కొనండి మరియు మేము మిమ్మల్ని సంప్రదిస్తాము.
సంబంధిత పోస్ట్లు:
సహాయక అందులో నివశించే తేనెటీగలు ఆదేశాలు