అపాచీ డ్రిల్ అనేది పరిశ్రమ యొక్క మొట్టమొదటి స్కీమా లేని SQL ఇంజిన్. డ్రిల్ ప్రపంచంలో మొట్టమొదటి ప్రశ్న ఇంజిన్ కాదు, అయితే ఇది వశ్యత మరియు వేగం మధ్య చక్కని సమతుల్యతను కొట్టే మొదటిది. BI / Analytics వాతావరణాలకు అవసరమయ్యే ఇంటరాక్టివ్ వేగంతో అనేక వేల నోడ్లకు మరియు పెటాబైట్ల డేటాను ప్రశ్నించడానికి డ్రిల్ రూపొందించబడింది.
ఇది హైవ్, హెచ్బేస్, మొంగోడిబి, ఫైల్ సిస్టమ్, ఆర్డిబిఎంఎస్ వంటి అనేక డేటా వనరులతో కలిసిపోతుంది. అలాగే, అవ్రో, సిఎస్వి, టిఎస్వి, పిఎస్వి, పార్క్వెట్, హడూప్ సీక్వెన్స్ ఫైల్స్ వంటి ఇన్పుట్ ఫార్మాట్లను డ్రిల్లో సులభంగా ఉపయోగించవచ్చు.
అపాచీ డ్రిల్ ఎందుకు?
అపాచీ డ్రిల్ యొక్క అతిపెద్ద ప్రయోజనం ఏమిటంటే, మీరు ఏదైనా డేటాను ప్రశ్నించినప్పుడు అది ఎగిరి స్కీమాను కనుగొనగలదు. అంతేకాక, ఇది మంచి విశ్లేషణల కోసం మీ BI సాధనాలతో టేబుల్, క్లిక్వ్యూ, మైక్రోస్ట్రాటజీ మొదలైన వాటితో పని చేస్తుంది.
అపాచీ డ్రిల్ యొక్క విలువను సంగ్రహించే పరిశ్రమ విశ్లేషకుడి కోట్ ఇక్కడ ఉంది:
“డ్రిల్ కేవలం SQL-on-Hadoop గురించి కాదు. ఇది SQL- ఆన్-అందంగా-ఏదైనా, వెంటనే మరియు ఫార్మాలిటీ లేకుండా ఉంటుంది. ”
- ఆండ్రూ బర్స్ట్, గిగామ్ రీసెర్చ్, జనవరి 2015
డ్రిల్బిట్ అనేది అపాచీ డ్రిల్ యొక్క డెమోన్, ఇది క్లస్టర్లోని ప్రతి నోడ్లో నడుస్తుంది. ఇది క్లస్టర్ మరియు మెయింటైస్న్ క్లస్టర్ సభ్యత్వంలోని అన్ని కమ్యూనికేషన్ల కోసం జూకీపర్ను ఉపయోగిస్తుంది. క్లయింట్ నుండి అభ్యర్థనలను అంగీకరించడం, ప్రశ్నలను ప్రాసెస్ చేయడం మరియు ఫలితాలను క్లయింట్కు తిరిగి ఇవ్వడం దీని బాధ్యత. క్లయింట్ నుండి అభ్యర్థనను స్వీకరించే డ్రిల్బిట్ను ‘ఫోర్మాన్’ అంటారు. ఇది అమలు ప్రణాళికను ఉత్పత్తి చేస్తుంది, అమలు శకలాలు క్లస్టర్లో నడుస్తున్న ఇతర డ్రిల్బిట్లకు పంపబడతాయి.
ఇంకొక ప్రయోజనం ఏమిటంటే, డ్రిల్ యొక్క సంస్థాపన మరియు సెటప్ చాలా సులభం. అపాచీ డ్రిల్ను ఎలా ఇన్స్టాల్ చేయాలో నేర్చుకుందాం.
మొదటి దశ డ్రిల్ ప్యాకేజీని డౌన్లోడ్ చేయడం.
జావాస్క్రిప్ట్లో శ్రేణి పొడవును ఎలా పొందాలి
ఆదేశం: wget https://archive.apache.org/dist/drill/drill-1.5.0/apache-drill-1.5.0.tar.gz
ఆదేశం: tar -xvf apache-drill-1.5.0.tar.gz
ఆదేశం: ls
తరువాత, .bashrc ఫైల్లో ఎన్విరాన్మెంట్ వేరియబుల్స్ సెట్ చేయండి.
ఆదేశం: sudo gedit .bashrc
ఎగుమతి DRILL_HOME = / home / edureka / apache-drill-1.5.0
ఎగుమతి PATH = $ PATH: /home/edureka/apache-drill-1.5.0/bin
ఈ ఆదేశం మార్పులను నవీకరిస్తుంది:
ఆదేశం: మూలం .bashrc
ఇప్పుడు డ్రిల్ కాన్ డైరెక్టరీకి వెళ్లి, క్లస్టర్ ఐడి మరియు జూకీపర్ హోస్ట్ & పోర్ట్తో డ్రిల్-ఓవర్రైడ్.కాన్ఫ్ ఫైల్ను సవరించండి, మేము దానిని స్థానిక క్లస్టర్లో రన్ చేస్తాము.
ఆదేశం: cd apache-drill-1.5.0
ఆదేశం: sudo gedit conf / drill-override.conf
అప్రమేయంగా, DRILL_MAX_DIRECT_MEMORY డ్రిల్- env.sh లో 8 GB గా ఉంటుంది మరియు మన వద్ద ఉన్న మెమరీ ప్రకారం దాన్ని ఉంచాలి.
ఆదేశం: sudo gedit conf / drill-env.sh
ఒకే నోడ్లో మాత్రమే డ్రిల్ను ఇన్స్టాల్ చేయడానికి, మీరు ఎంబెడెడ్ మోడ్ను ఉపయోగించవచ్చు, ఇక్కడ ఇది స్థానికంగా నడుస్తుంది. మీరు ఈ ఆదేశాన్ని అమలు చేస్తున్నప్పుడు ఇది స్వయంచాలకంగా డ్రిల్బిట్ సేవను ప్రారంభిస్తుంది.
ఆదేశం: ./bin/drill-embedded
Int జావాగా డబుల్ ఎలా మార్చాలి
సంస్థాపనను తనిఖీ చేయడానికి మీరు సరళమైన ప్రశ్నను అమలు చేయవచ్చు.
ఆదేశం: sys.options నుండి * ఎంచుకోండి WHERE type = ‘SYSTEM’ మరియు ‘security%’ వంటి పేరు
అపాచీ డ్రిల్ యొక్క వెబ్ కన్సోల్ను తనిఖీ చేయడానికి, మేము వెబ్ బ్రౌజర్లోని లోకల్ హోస్ట్: 8047 కి వెళ్లాలి.
మీరు ప్రశ్న టాబ్ నుండి మీ ప్రశ్నను కూడా అమలు చేయవచ్చు.
డిస్ట్రిబ్యూటెడ్ మోడ్లో డ్రిల్ను అమలు చేయడానికి, మీరు క్లస్టర్ ఐడిని సవరించాలి మరియు జూకీపర్ సమాచారాన్ని డ్రిల్-ఓవర్రైడ్.కాన్ఫ్లో క్రింద చేర్చాలి.
అప్పుడు మేము ప్రతి నోడ్లో జూకీపర్ సేవను ప్రారంభించాలి. ఆ తరువాత మీరు ఈ ఆదేశంతో ప్రతి నోడ్లో డ్రిల్బిట్ సేవను ప్రారంభించాలి.
ఆదేశం: ./bin/drillbit.sh ప్రారంభం
ఆదేశం: jps
ఇప్పుడు, డ్రిల్ షెల్ ప్రారంభించడానికి మేము క్రింద ఆదేశాన్ని ఉపయోగిస్తాము.
ఇప్పుడు, మేము మా ప్రశ్నలను క్లస్టర్లో పంపిణీ మోడ్లో అమలు చేయవచ్చు.
రెండు భాగాల అపాచీ డ్రిల్ బ్లాగ్ సిరీస్లో ఇది మొదటి బ్లాగ్ పోస్ట్. ఈ సిరీస్లోని రెండవ బ్లాగ్ త్వరలో రాబోతోంది.
మాకు ప్రశ్న ఉందా? వ్యాఖ్య విభాగంలో వాటిని పేర్కొనండి మరియు మేము మీ వద్దకు తిరిగి వస్తాము.
సంబంధిత పోస్ట్లు: