రోజుకు 2.5 క్విన్టిలియన్ బైట్ల డేటాను ఉత్పత్తి చేసే మరియు వినియోగించే ప్రపంచంలో, వాంఛనీయ సామర్థ్యాన్ని సాధించడానికి డేటాను మార్చడానికి మరియు కలపడానికి కొత్త పద్ధతుల కోసం సంస్థలు కట్టుబడి ఉంటాయి. డేటాను కలపడం అటువంటి పద్ధతి పట్టికలో డేటా బ్లెండింగ్ .
ఇప్పుడు, ఏదైనా సంస్థ యొక్క డేటా చక్రంలో ఇది చాలా ముఖ్యమైన ప్రయోజనాన్ని అందిస్తుంది కాబట్టి, ఇది చాలా ముఖ్యమైన మాడ్యూల్ కోసం చేస్తుంది . ఈ బ్లాగులో, మేము ఈ క్రింది అంశాలను చర్చిస్తాము:
- పట్టికలో మీకు డేటా బ్లెండింగ్ ఎందుకు అవసరం?
- పట్టికలో డేటా బ్లెండింగ్ అంటే ఏమిటి?
- డేటా చేరడం నుండి ఇది ఎలా భిన్నంగా ఉంటుంది?
- బ్లెండింగ్ కోసం చేరడం ప్రత్యామ్నాయం ఎప్పుడు?
- మీ డేటాను పట్టికలో కలపడం
- పట్టికలో డేటా బ్లెండింగ్ యొక్క పరిమితులు
పట్టికలో మీకు డేటా బ్లెండింగ్ ఎందుకు అవసరం?
మీరు ఒక డెవలపర్ పట్టిక సేల్స్ఫోర్స్లో నిల్వ చేసిన లావాదేవీల డేటా మరియు యాక్సెస్లో నిల్వ చేసిన కోటా డేటా. మీరు కలపాలనుకుంటున్న డేటా వేర్వేరు డేటాబేస్లలో నిల్వ చేయబడుతుంది మరియు ప్రతి పట్టికలో సంగ్రహించిన డేటా యొక్క గ్రాన్యులారిటీ రెండు డేటా వనరులలో భిన్నంగా ఉంటుంది, కాబట్టి ఈ డేటాను కలపడానికి డేటా బ్లెండింగ్ ఉత్తమ మార్గం.
కింది పరిస్థితులలో డేటా బ్లెండింగ్ ఉపయోగపడుతుంది:
క్రాస్-డేటాబేస్ చేరడానికి మద్దతు లేని వివిధ డేటాబేస్ల నుండి డేటాను మిళితం చేయాలనుకుంటున్నారు.
క్రాస్-డేటాబేస్ చేరడం ఘనాల (ఉదాహరణకు, ఒరాకిల్ ఎస్బేస్) లేదా కొన్ని సారం-మాత్రమే కనెక్షన్లకు (ఉదాహరణకు, గూగుల్ అనలిటిక్స్) కనెక్షన్లకు మద్దతు ఇవ్వదు. ఈ సందర్భంలో, మీరు విశ్లేషించదలిచిన డేటా కోసం వ్యక్తిగత డేటా వనరులను సెటప్ చేయండి, ఆపై డేటా సోర్స్లను ఒకే షీట్లో కలపడానికి డేటా బ్లెండింగ్ను ఉపయోగించండి.
డేటా వివిధ స్థాయిలలో వివరంగా ఉంది.
కొన్నిసార్లు ఒక డేటా సెట్ వివిధ ఉపయోగించి డేటాను సంగ్రహిస్తుంది వివరాల స్థాయిలు అనగా, ఇతర డేటా సమితి కంటే ఎక్కువ లేదా తక్కువ గ్రాన్యులారిటీ.
ఉదాహరణకు, మీరు లావాదేవీల డేటా మరియు కోటా డేటాను విశ్లేషిస్తున్నారని అనుకుందాం. లావాదేవీల డేటా అన్ని లావాదేవీలను సంగ్రహించవచ్చు. ఏదేమైనా, కోటా డేటా త్రైమాసిక స్థాయిలో లావాదేవీలను సమగ్రపరచవచ్చు. లావాదేవీ విలువలు ప్రతి డేటా సమితిలో వివిధ స్థాయిల వివరాలతో సంగ్రహించబడినందున, మీరు డేటాను కలపడానికి డేటా బ్లెండింగ్ ఉపయోగించాలి.
పట్టికలో డేటా బ్లెండింగ్ అంటే ఏమిటి?
డేటా బ్లెండింగ్ అనేది చాలా శక్తివంతమైన లక్షణం బోర్డు . బహుళ డేటా వనరులలో సంబంధిత డేటా ఉన్నప్పుడు ఇది ఉపయోగించబడుతుంది, మీరు ఒకే వీక్షణలో కలిసి విశ్లేషించాలనుకుంటున్నారు. ఇది ఒక డేటా మూలం నుండి డేటా పట్టికను మరొక డేటా మూలం నుండి డేటా నిలువు వరుసలతో భర్తీ చేసే డేటాను కలపడానికి ఒక పద్ధతి.
సాధారణంగా, మీరు ఈ రకమైన డేటాను కలపడానికి జాయిన్లను ఉపయోగిస్తారు, అయితే డేటా బ్లెండింగ్ను ఉపయోగించడం మంచిది అయినప్పుడు డేటా రకం మరియు దాని గ్రాన్యులారిటీ వంటి కారకాలపై ఆధారపడి సమయాలు ఉన్నాయి.
డేటా చేరడానికి ఇది ఎలా భిన్నంగా ఉంటుంది?
డేటా బ్లెండింగ్ సాంప్రదాయ ఎడమ చేరికను అనుకరిస్తుంది. రెండింటి మధ్య ప్రధాన వ్యత్యాసం ఎప్పుడు చేరడం అగ్రిగేషన్కు సంబంధించి నిర్వహిస్తారు.
ఎడమ చేరండి
డేటాను కలపడానికి మీరు ఎడమ జాయిన్ని ఉపయోగించినప్పుడు, చేరడం జరిగే డేటాబేస్కు ఒక ప్రశ్న పంపబడుతుంది. ఎడమ చేరడం ఉపయోగించి ఎడమ పట్టిక నుండి అన్ని అడ్డు వరుసలను మరియు కుడి పట్టిక నుండి ఏదైనా అడ్డు వరుసలను ఎడమ పట్టికలో సంబంధిత వరుస సరిపోలిక కలిగి ఉంటుంది. చేరడం యొక్క ఫలితాలను టేబులో తిరిగి పంపబడుతుంది మరియు సమగ్రపరచబడుతుంది.
ఉదాహరణకు, మీకు ఈ క్రింది పట్టికలు ఉన్నాయని అనుకుందాం. సాధారణ నిలువు వరుసలు ఉంటే వినియోగదారుని గుర్తింపు , ఎడమ జాయిన్ ఎడమ పట్టిక నుండి మొత్తం డేటాను, అలాగే కుడి పట్టిక నుండి మొత్తం డేటాను తీసుకుంటుంది ఎందుకంటే ప్రతి అడ్డు వరుస ఎడమ పట్టికలో సంబంధిత వరుస సరిపోలికను కలిగి ఉంటుంది.
డేటా బ్లెండింగ్
డేటాను కలపడానికి మీరు డేటా బ్లెండింగ్ను ఉపయోగించినప్పుడు, షీట్లో ఉపయోగించే ప్రతి డేటా సోర్స్ కోసం ఒక ప్రశ్న డేటాబేస్కు పంపబడుతుంది. సమగ్ర డేటాతో సహా ప్రశ్నల ఫలితాలు తిరిగి పంపబడతాయి మరియు టేబుల్ చేత కలపబడతాయి. వీక్షణ ప్రాధమిక డేటా మూలం, ఎడమ పట్టిక మరియు ద్వితీయ డేటా మూలం నుండి కుడి వరుసలోని మొత్తం వరుసలను అనుసంధాన క్షేత్రాల పరిమాణం ఆధారంగా ఉపయోగిస్తుంది.
మిశ్రమంలో ద్వితీయ డేటా మూలం నుండి విభిన్న లేదా అదనపు వరుసల డేటాను చేర్చడానికి మీరు లింకింగ్ ఫీల్డ్ను మార్చవచ్చు లేదా ఎక్కువ లింకింగ్ ఫీల్డ్లను జోడించవచ్చు, సమగ్ర విలువలను మార్చవచ్చు.
ఉదాహరణకు, మీకు ఈ క్రింది పట్టికలు ఉన్నాయని అనుకుందాం. లింకింగ్ ఫీల్డ్లు ఉంటే వినియోగదారుని గుర్తింపు రెండు పట్టికలలో మీ డేటాను మిళితం చేయడం ఎడమ పట్టిక నుండి మొత్తం డేటాను తీసుకుంటుంది మరియు కుడి పట్టిక నుండి డేటాతో ఎడమ పట్టికను భర్తీ చేస్తుంది. ఈ సందర్భంలో, కింది వాటి కారణంగా అన్ని విలువలు ఫలిత పట్టికలో భాగం కావు:
- ఎడమ పట్టికలోని అడ్డు వరుసకు శూన్య విలువ సూచించినట్లుగా కుడి పట్టికలో సంబంధిత వరుస సరిపోలిక లేదు.
- నక్షత్రం (*) సూచించినట్లుగా, కుడి పట్టికలోని వరుసలలో బహుళ సంబంధిత విలువలు ఉన్నాయి.
మీరు పైన చెప్పిన పట్టికలను కలిగి ఉన్నారని అనుకుందాం, కాని ద్వితీయ డేటా మూలం అనే కొత్త ఫీల్డ్ ఉంది ప్రయోజనాలు . మళ్ళీ, లింకింగ్ ఫీల్డ్ ఉంటే వినియోగదారుని గుర్తింపు , మీ డేటాను కలపడం ఎడమ పట్టిక నుండి మొత్తం డేటాను తీసుకుంటుంది మరియు కుడి పట్టిక నుండి డేటాతో భర్తీ చేస్తుంది. ఈ సందర్భంలో, మీరు కింది వాటికి అదనంగా మునుపటి ఉదాహరణలో అదే శూన్య విలువ మరియు ఆస్టరిస్క్లను చూస్తారు:
- ఎందుకంటే ప్రయోజనాలు ఫీల్డ్ ఒక కొలత, మీరు వరుస విలువలను చూస్తారుప్రయోజనాలుకుడి పట్టికలోని డేటా ఎడమ పట్టికలోని డేటాతో కలిపే ముందు ఫీల్డ్ మొత్తం.
- మునుపటి ఉదాహరణ మాదిరిగా, ఎడమ పట్టికలోని అడ్డు వరుసకు సంబంధిత వరుస లేదు ప్రయోజనాలు ఫీల్డ్, రెండవ శూన్య విలువ ద్వారా సూచించబడుతుంది.
ఎప్పుడు ప్రత్యామ్నాయంగా చేరాలి బ్లెండింగ్
1. డేటా శుభ్రపరచడం అవసరం.
చేరిన తర్వాత మీ పట్టికలు ఒకదానితో ఒకటి సరిగ్గా సరిపోలకపోతే, ప్రతి పట్టికకు డేటా వనరులను సెటప్ చేయండి, అవసరమైన ఏవైనా అనుకూలీకరణలు చేయండి (అనగా, నిలువు వరుసల పేరు మార్చండి, కాలమ్ డేటా రకాలను మార్చండి, సమూహాలను సృష్టించండి, గణనలను వాడండి మొదలైనవి), మరియు డేటాను కలపడానికి డేటా బ్లెండింగ్ ఉపయోగించండి.
2. చేరడం నకిలీ డేటాకు కారణమవుతుంది.
చేరిన తరువాత నకిలీ డేటా వివిధ స్థాయిల వివరాల డేటా యొక్క లక్షణం. మీరు నకిలీ డేటాను గమనించినట్లయితే, చేరడానికి బదులుగా, ఒక సాధారణ కోణంలో కలపడానికి డేటా బ్లెండింగ్ ఉపయోగించండి.
3. మీకు చాలా డేటా ఉంది.
ఒకే డేటాబేస్ నుండి డేటాను కలపడానికి సాధారణంగా చేరడం సిఫార్సు చేయబడింది. చేరడం డేటాబేస్ చేత నిర్వహించబడుతుంది, ఇది డేటాబేస్ యొక్క కొన్ని స్థానిక సామర్థ్యాలను ప్రభావితం చేయడానికి చేరడానికి అనుమతిస్తుంది. ఏదేమైనా, మీరు పెద్ద సంఖ్యలో డేటాతో పనిచేస్తుంటే, చేరడం డేటాబేస్ మీద ఒత్తిడి తెస్తుంది మరియు పనితీరును గణనీయంగా ప్రభావితం చేస్తుంది. ఈ సందర్భంలో, డేటా బ్లెండింగ్ సహాయపడుతుంది. డేటా సమగ్రమైన తర్వాత డేటాను కలపడం టేబులో నిర్వహిస్తుంది కాబట్టి, కలపడానికి తక్కువ డేటా ఉన్నాయి. కలపడానికి తక్కువ డేటా ఉన్నప్పుడు, సాధారణంగా, పనితీరు మెరుగుపడుతుంది.
మీ డేటాను పట్టికలో కలపడం
మీరు ఒకే షీట్లో కలిసి విశ్లేషించదలిచిన ప్రత్యేక డేటా వనరులలో డేటా ఉన్నప్పుడు మీరు డేటా బ్లెండింగ్ను ఉపయోగించవచ్చు. టేబులో రెండు అంతర్నిర్మిత డేటా వనరులు ఉన్నాయి నమూనా-సూపర్ స్టోర్ మరియు నమూనా కాఫీ గొలుసు. Mdb డేటా మిశ్రమాన్ని వివరించడానికి ఇది ఉపయోగించబడుతుంది.
దశ 1: మీ డేటాకు కనెక్ట్ చేయండి మరియు డేటా మూలాలను సెటప్ చేయండి
- డేటా సమితికి కనెక్ట్ అవ్వండి మరియు డేటా సోర్స్ పేజీలో డేటా మూలాన్ని సెటప్ చేయండి. ఒక in బిల్ట్ డేటా సోర్స్ నమూనా కాఫీ గొలుసు. Mdb ,ఇది MS యాక్సెస్ డేటాబేస్ ఫైల్, డేటా బ్లెండింగ్ను వివరించడానికి ఉపయోగించబడుతుంది.
- వెళ్ళండి సమాచారం > క్రొత్త డేటా మూలం, డేటా యొక్క రెండవ సెట్కు కనెక్ట్ చేయండి.ఈ ఉదాహరణ ఉపయోగిస్తుంది నమూనా - సూపర్ స్టోర్ సమాచార మూలం. టికోడి డేటా మూలాన్ని ఏర్పాటు చేస్తుంది.
- మీ వీక్షణను నిర్మించడం ప్రారంభించడానికి షీట్ ట్యాబ్పై క్లిక్ చేయండి.
దశ 2: ప్రాధమిక డేటా మూలాన్ని నియమించండి
- మీ ప్రాధమిక డేటా మూలం నుండి కనీసం ఒక ఫీల్డ్ను ప్రాధమిక డేటా మూలంగా పేర్కొనడానికి దాన్ని లాగండి. లో సమాచారం పేన్, మీరు ప్రాధమిక డేటా మూలంగా నియమించదలిచిన డేటా మూలాన్ని క్లిక్ చేయండి. ఈ ఉదాహరణలో, నమూనా కాఫీ గొలుసు ఎంచుకోబడింది.
- కింది స్క్రీన్ షాట్ వేర్వేరు పట్టికలను చూపిస్తుంది మరియు ఫైల్లో అందుబాటులో ఉంటుంది.
దశ 3: ద్వితీయ డేటా మూలాన్ని నియమించండి
- ప్రాధమిక డేటా మూలం లేదా క్రియాశీల లింకులు కాని డేటా మూలాల నుండి వీక్షణలో ఉపయోగించే ఫీల్డ్లు తదుపరి డేటా వనరులను ద్వితీయ డేటా వనరుగా స్వయంచాలకంగా నిర్దేశిస్తాయి. ఈ సందర్భంలో, నమూనా సూపర్ స్టోర్.
దశ 4: బ్లెండ్ డేటా
పైథాన్ క్లాస్ __init__
- ఇప్పుడు మీరు రెండు మూలాల నుండి డేటాను సాధారణ పరిమాణం ఆధారంగా సమగ్రపరచవచ్చు ( రాష్ట్రం , ఈ విషయంలో). పరిమాణం - స్టేట్ పక్కన ఒక చిన్న లింక్ చిత్రం కనిపిస్తుంది. ఇది రెండు డేటా వనరుల మధ్య సాధారణ కోణాన్ని సూచిస్తుంది.
- మీరు బార్ చార్ట్ను సృష్టించారని అనుకుందాం లాభ నిష్పత్తి కాలమ్ షెల్ఫ్లో మరియు రాష్ట్రం రో షెల్ఫ్లో, సూపర్స్టోర్ మరియు కాఫీ చైన్ షాపులలో ప్రతి రాష్ట్రానికి లాభాల నిష్పత్తి ఎలా మారుతుందో చార్ట్ చూపిస్తుంది.
పట్టికలో డేటా బ్లెండింగ్ యొక్క పరిమితులు
- సంకలితం కాని కంకరల చుట్టూ కొన్ని డేటా బ్లెండింగ్ పరిమితులు ఉన్నాయి మీడియా , మరియు RAWSQLAGG .
- డేటా బ్లెండింగ్ అధిక గ్రాన్యులారిటీలో ప్రశ్న యొక్క వేగాన్ని రాజీ చేస్తుంది.
- మిళితమైన డేటాను ఉపయోగించే లెక్కించిన ఫీల్డ్ ద్వారా మీరు క్రమబద్ధీకరించడానికి ప్రయత్నించినప్పుడు, లెక్కించిన ఫీల్డ్ క్రమబద్ధీకరించు డైలాగ్ బాక్స్ యొక్క ఫీల్డ్ డ్రాప్-డౌన్ జాబితాలో జాబితా చేయబడదు.
- పట్టికలో డేటాను కలపడానికి క్యూబ్ డేటా వనరులను ప్రాథమిక డేటా వనరుగా మాత్రమే ఉపయోగించవచ్చు. వాటిని ద్వితీయ డేటా వనరులుగా ఉపయోగించలేరు.
మీ అందరికీ ఇప్పుడు మంచి ఆలోచన ఉందని నేను ఆశిస్తున్నాను పట్టికలో డేటా బ్లెండింగ్ ఈ బ్లాగ్ నుండి. మరింత జ్ఞానం కోసం ఆకలితో ఉందా? చింతించకండి, ఈ వీడియో మీకు భావనపై మంచి అవగాహన ఇస్తుంది.