డేటాను అర్థం చేసుకోవడం మరియు దాని నుండి విలువను సృష్టించగలగడం దశాబ్దం యొక్క నైపుణ్యం. మెషిన్ లెర్నింగ్ అనేది సంస్థలను నెరవేర్చడంలో సహాయపడే అటువంటి ప్రధాన నైపుణ్యం. అయితే, ప్రారంభించడానికి, మీరు మీ పునాదులను సరిగ్గా నిర్మించాలి. కాబట్టి, ఈ వ్యాసంలో, నేను కొన్ని ప్రాథమిక అంశాలను కవర్ చేస్తాను మరియు యంత్ర అభ్యాసంలో మీ ప్రయాణాన్ని ప్రారంభించడానికి మీకు మార్గదర్శకాలను అందిస్తాను. కాబట్టి, యంత్ర అభ్యాసం కోసం గణాంకాలపై ఈ వ్యాసంలో, ఈ క్రింది విషయాలు చర్చించబడతాయి:
యంత్ర అభ్యాసానికి సంభావ్యత మరియు గణాంకాలు:
సంభావ్యత అంటే ఏమిటి?
సంభావ్యత ఒక సంఘటన సంభవించే సంభావ్యతను అంచనా వేస్తుంది. ఉదాహరణకు, మీరు సరసమైన, నిష్పాక్షికమైన మరణాన్ని రోల్ చేస్తే, అప్పుడు సంభావ్యత ఒకటి 1/6 . ఇప్పుడు, మీరు ఆశ్చర్యపోతుంటే why? అప్పుడు సమాధానం చాలా సులభం!
ఎందుకంటే ఆరు అవకాశాలు ఉన్నాయి మరియు అన్నీ సమానంగా ఉంటాయి (ఫెయిర్ డై). అందువల్ల మనం జోడించవచ్చు 1 + 1 + 1 + 1 + 1 + 1 = 6. కానీ, మాకు ఆసక్తి ఉన్నందున 1 పైకి తిరిగే సంఘటన . ఉంది సంఘటన జరగడానికి ఒకే ఒక మార్గం. అందువలన,
1 తిరగడం యొక్క సంభావ్యత = 1/6
అన్ని సంఘటనలు సమానంగా ఉన్నందున అన్ని ఇతర సంఖ్యల విషయంలో కూడా ఇదే విధంగా ఉంటుంది. సింపుల్, సరియైనదా?
సరే, ఈ ఉదాహరణకి సంభావ్యత యొక్క తరచూ నిర్వచనం ఇలా ఉంటుంది - 1 టర్నింగ్ అప్ యొక్క సంభావ్యత 1 డై యొక్క సంఖ్య యొక్క నిష్పత్తి 1 డై మొత్తం ఎన్నిసార్లు రోల్ చేయబడితే డై రోల్ చేయబడితే అనంతమైన సంఖ్య సార్లు.ఇది ఎలా అర్ధమవుతుంది?
దీన్ని మరింత ఆసక్తికరంగా చేద్దాం. రెండు కేసులను పరిగణించండి - మీరు 5 సార్లు ఫెయిర్ డైని చుట్టారు. ఒక సందర్భంలో సంఖ్యల క్రమం - [1,4,2,6,4,3]. మరొక సందర్భంలో, మనకు లభిస్తుంది - [2,2,2,2,2,2]. ఏది ఎక్కువ అని మీరు అనుకుంటున్నారు?
రెండూ సమానంగా ఉంటాయి. బేసిగా అనిపిస్తుందా?
ఇప్పుడు, ప్రతి కేసులో మొత్తం 5 రోల్స్ ఉన్న మరొక కేసును పరిశీలించండి స్వతంత్ర . అర్థం, ఒక రోల్ మరొకదాన్ని ప్రభావితం చేయదు. మొదటి సందర్భంలో, 6 మలుపులు తిరిగినప్పుడు, దాని ముందు 2 పైకి లేచినట్లు తెలియదు. అందువల్ల, మొత్తం 5 రోల్స్ సమానంగా ఉంటాయి.
అదేవిధంగా, రెండవ సందర్భంలో సరళ 2 లను స్వతంత్ర సంఘటనల క్రమం అని అర్థం చేసుకోవచ్చు. మరియు ఈ సంఘటనలన్నీ సమానంగా ఉంటాయి. మొత్తంమీద, మనకు ఒకే పాచికలు ఉన్నందున, ఒకవేళ ఒకవేళ ఒక నిర్దిష్ట సంఖ్య పెరిగే అవకాశం ఒకటి రెండు కేసులకు సమానం. తరువాత, యంత్ర అభ్యాసం కోసం గణాంకాలపై ఈ వ్యాసంలో, ఈ పదాన్ని అర్థం చేసుకుందాం స్వాతంత్ర్యం.
స్వాతంత్ర్యం
రెండు సంఘటనలు A సంభవించడం ఈవెంట్ B ని ప్రభావితం చేయకపోతే A మరియు B స్వతంత్రంగా చెబుతారు . ఉదాహరణకు, మీరు ఒక నాణెం టాసు చేసి, డైని రోల్ చేస్తే, డై యొక్క ఫలితం నాణెం తలలు లేదా తోకలను చూపుతుందా అనే దానిపై ఎటువంటి ప్రభావం చూపదు. కూడా, కోసం రెండు స్వతంత్ర సంఘటనలు A మరియు B. , ది A మరియు B కలిసి సంభవించే సంభావ్యత . కాబట్టి ఉదాహరణకు, నాణెం తలలు మరియు మరణాలను చూపించే సంభావ్యతను మీరు కోరుకుంటే 3 చూపిస్తుంది.
పి (ఎ మరియు బి) = పి (ఎ) * పి (బి)
అందువల్ల P = & frac12 (తలలు తిరిగే సంభావ్యత) * ⅙ (3 తిరగడానికి సంభావ్యత) = 1/12
మునుపటి ఉదాహరణలో, రెండు సందర్భాలలో, P = ⅙ * * * * *.
ఇప్పుడు స్వతంత్రంగా లేని సంఘటనల గురించి మాట్లాడుదాం. కింది పట్టికను పరిశీలించండి:
Ob బకాయం | Ob బకాయం కాదు | |
గుండె సమస్యలు | నాలుగు ఐదు | పదిహేను |
గుండె సమస్యలు లేవు | 10 | 30 |
100 మందిపై సర్వే జరిగింది. 60 మందికి గుండె సమస్యలు ఉన్నాయి మరియు 40 మందికి లేదు. గుండె సమస్య ఉన్న 60 మందిలో 45 మంది .బకాయం కలిగి ఉన్నారు. 40 మందికి గుండె సమస్య లేని వారిలో 10 మంది .బకాయం కలిగి ఉన్నారు. ఎవరైనా మిమ్మల్ని అడిగితే -
- గుండె సమస్య వచ్చే అవకాశం ఏమిటి?
- గుండె సమస్య మరియు ob బకాయం లేకుండా ఉండటానికి సంభావ్యత ఏమిటి?
మొదటి ప్రశ్నలకు సమాధానం సులభం - 60/100. రెండవదానికి, ఇది 15/100 అవుతుంది. ఇప్పుడు మూడవ ప్రశ్నను పరిశీలించండి - ఒక వ్యక్తిని యాదృచ్ఛికంగా ఎంపిక చేశారు. అతనికి గుండె జబ్బులు ఉన్నట్లు గుర్తించారు. అతను ese బకాయం ఉన్న సంభావ్యత ఏమిటి?
శ్రేణి జావాలో గరిష్ట సంఖ్యను కనుగొనండి
ఇప్పుడు మీకు ఇచ్చిన సమాచారం గురించి ఆలోచించండి - అతనికి గుండె జబ్బులు ఉన్నాయని తెలిసింది. అందువల్ల అతను గుండె జబ్బులు లేని 40 మంది నుండి ఉండకూడదు. 60 సాధ్యం ఎంపికలు మాత్రమే ఉన్నాయి (పట్టికలోని పై వరుస). ఇప్పుడు, ఈ తగ్గిన అవకాశాలలో, అతను ese బకాయం ఉన్న సంభావ్యత 45/60. ఇప్పుడు, మీకు తెలిసిన, స్వతంత్ర సంఘటనలు ఏమిటి, యంత్ర అభ్యాసం కోసం గణాంకాలపై ఈ వ్యాసంలో, షరతులతో కూడిన సంభావ్యతలను అర్థం చేసుకుందాం.
షరతులతో కూడిన సంభావ్యత
షరతులతో కూడిన సంభావ్యతలను అర్థం చేసుకోవడానికి, పై ఉదాహరణతో మా చర్చను కొనసాగిద్దాం. Ob బకాయం ఉన్న స్థితి మరియు గుండె సమస్యతో బాధపడుతున్న స్థితి స్వతంత్రమైనది కాదు. Ese బకాయం ఉండటం గుండె సమస్యలను ప్రభావితం చేయకపోతే, గుండె సమస్యలు ఉన్నవారికి ese బకాయం మరియు ese బకాయం లేని కేసుల సంఖ్య ఒకే విధంగా ఉండేది.
అలాగే, వ్యక్తికి గుండె సమస్యలు ఉన్నాయని మరియు అతను .బకాయం ఉన్న సంభావ్యతను మేము కనుగొనవలసి వచ్చింది. కాబట్టి, సంభావ్యత, ఈ సందర్భంలో, అతనికి గుండె సమస్య ఉన్నందున షరతు పెట్టబడుతుంది. ఈవెంట్ A యొక్క సంభావ్యత ఈవెంట్ B పై షరతు పెడితే, మేము దానిని ఇలా సూచిస్తాము
పి (ఎ | బి)
ఇప్పుడు, ఈ షరతులతో కూడిన సంభావ్యతను లెక్కించడానికి మాకు సహాయపడే ఒక సిద్ధాంతం ఉంది. దీనిని అంటారు బేయస్ రూల్ .
పి (ఎ | బి) = పి (ఎ మరియు బి) / పి (బి)
మేము ఇప్పుడే చర్చించిన ఉదాహరణను ప్లగ్ చేయడం ద్వారా మీరు ఈ సిద్ధాంతాన్ని తనిఖీ చేయవచ్చు. మీరు ఇప్పటివరకు అర్థం చేసుకుంటే, మీరు ఈ క్రింది వాటితో ప్రారంభించవచ్చు - నైవ్ బేయెస్ . ఇమెయిల్ స్పామ్ కాదా అని వర్గీకరించడానికి ఇది షరతులతో కూడిన సంభావ్యతలను ఉపయోగిస్తుంది. ఇది అనేక ఇతర వర్గీకరణ పనులను చేయగలదు. కానీ తప్పనిసరిగా, షరతులతో కూడిన సంభావ్యత గుండె వద్ద ఉంది .
గణాంకాలు:
గణాంకాలు పెద్ద సంఖ్యలో డేటా పాయింట్ల గురించి సంగ్రహించడానికి మరియు అనుమానాలు చేయడానికి ఉపయోగిస్తారు. డేటా సైన్స్ మరియు మెషిన్ లెర్నింగ్లో, మీరు తరచూ ఈ క్రింది పరిభాషలో వస్తారు
- కేంద్రీకృత చర్యలు
- పంపిణీలు (ముఖ్యంగా సాధారణం)
కేంద్రీకృత చర్యలు మరియు స్ప్రెడ్ యొక్క చర్యలు
అర్థం:
మీన్ కేవలం ఒక సంఖ్యల సగటు . సగటును తెలుసుకోవడానికి, మీరు సంఖ్యలను సంకలనం చేసి, సంఖ్యల సంఖ్యతో విభజించాలి. ఉదాహరణకు, [1,2,3,4,5] యొక్క సగటు 15/5 = 3.
మధ్యస్థం:
మధ్యస్థం సంఖ్యల సమితి యొక్క మధ్య మూలకం అవి ఆరోహణ క్రమంలో అమర్చబడినప్పుడు. ఉదాహరణకు, సంఖ్యలు [1,2,4,3,5] ఆరోహణ క్రమంలో అమర్చబడి ఉంటాయి [1,2,3,4,5]. వీటిలో మధ్య ఒకటి 3. అందువల్ల మధ్యస్థం 3. అయితే సంఖ్యల సంఖ్య సమానంగా ఉంటే మరియు మధ్య సంఖ్య లేకపోతే? అలాంటప్పుడు, మీరు రెండు మధ్య-ఎక్కువ సంఖ్యల సగటును తీసుకుంటారు. ఆరోహణ క్రమంలో 2n సంఖ్యల క్రమం కోసం, సగటు n వ మరియు (n + 1)వమధ్యస్థం పొందడానికి సంఖ్య. ఉదాహరణ - [1,2,3,4,5,6] మధ్యస్థం (3 + 4) / 2 = 3.5 ఉంది
మోడ్:
మోడ్ కేవలం సంఖ్యల సమితిలో చాలా తరచుగా సంఖ్య . ఉదాహరణకు, [1,2,3,3,4,5,5,5] యొక్క మోడ్ 5.
వైవిధ్యం:
వైవిధ్యం కేంద్రీకృత కొలత కాదు. ఇది కొలుస్తుంది మీ డేటా సగటు చుట్టూ ఎలా వ్యాపించింది . ఇది లెక్కించబడుతుంది
xN సంఖ్యల సగటు. మీరు ఒక పాయింట్ తీసుకోండి, సగటును తీసివేయండి, ఈ వ్యత్యాసం యొక్క చతురస్రాన్ని తీసుకోండి. అన్ని N సంఖ్యల కోసం దీన్ని చేయండి మరియు వాటిని సగటు చేయండి. వైవిధ్యం యొక్క వర్గమూలాన్ని ప్రామాణిక విచలనం అంటారు. తరువాత, యంత్ర అభ్యాసం కోసం గణాంకాలపై ఈ వ్యాసంలో, సాధారణ పంపిణీని అర్థం చేసుకుందాం.
సాధారణ పంపిణీ
పంపిణీ మాకు సహాయపడుతుంది మా డేటా ఎలా వ్యాపించిందో అర్థం చేసుకోండి . ఉదాహరణకు, యుగాల నమూనాలో, మనకు పెద్దవారి కంటే యువకులు ఎక్కువగా ఉండవచ్చు మరియు అందువల్ల వయస్సు కంటే చిన్న విలువలు ఎక్కువ విలువల కంటే ఎక్కువ. కానీ పంపిణీని ఎలా నిర్వచించాలి? దిగువ ఉదాహరణను పరిశీలించండి
Y- అక్షం సాంద్రతను సూచిస్తుంది. ఈ పంపిణీ యొక్క మోడ్ 30 ఎందుకంటే ఇది శిఖరం మరియు అందువల్ల చాలా తరచుగా ఉంటుంది. మేము మధ్యస్థాన్ని కూడా గుర్తించవచ్చు. X- అక్షం మీద బిందువు వద్ద మధ్యస్థం ఉంది, ఇక్కడ వక్రరేఖ కింద సగం ప్రాంతం కప్పబడి ఉంటుంది. ఏదైనా సాధారణ పంపిణీలో ఉన్న ప్రాంతం 1 ఎందుకంటే అన్ని సంఘటనల సంభావ్యత మొత్తం 1. ఉదాహరణకు,
పై కేసులో మధ్యస్థం 4 చుట్టూ ఉంది. దీని అర్థం 4 కి ముందు వక్రరేఖ క్రింద ఉన్న ప్రాంతం 4 తరువాత ఉన్నట్లుగా ఉంటుంది. మరొక ఉదాహరణను పరిశీలించండి
రేఖాచిత్రంతో జావాలో mvc నిర్మాణం
మేము మూడు సాధారణ పంపిణీలను చూస్తాము. నీలం మరియు ఎరుపు రంగులకు ఒకే సగటు ఉంటుంది. ఎరుపు రంగులో ఎక్కువ వ్యత్యాసం ఉంది. అందువల్ల, ఇది నీలం కంటే ఎక్కువ విస్తరించి ఉంది. ప్రాంతం 1 గా ఉండాలి కాబట్టి, ఆ ప్రాంతాన్ని స్థిరంగా ఉంచడానికి ఎరుపు వక్రరేఖ యొక్క శిఖరం నీలిరంగు వక్రరేఖ కంటే తక్కువగా ఉంటుంది.
మీరు ప్రాథమిక గణాంకాలు మరియు సాధారణ పంపిణీలను అర్థం చేసుకున్నారని ఆశిస్తున్నాము. ఇప్పుడు, యంత్ర అభ్యాసం కోసం గణాంకాలపై ఈ వ్యాసంలో, లీనియర్ ఆల్జీబ్రా గురించి తెలుసుకుందాం.
లీనియర్ ఆల్జీబ్రా
లీనియర్ ఆల్జీబ్రా లేకుండా ఆధునిక AI సాధ్యం కాదు. ఇది యొక్క ప్రధాన భాగాన్ని ఏర్పరుస్తుంది లోతైన అభ్యాసం మరియు వంటి సాధారణ అల్గోరిథంలలో కూడా ఉపయోగించబడింది . ఇంకేమీ ఆలస్యం చేయకుండా, ప్రారంభిద్దాం.
మీకు వెక్టర్స్ గురించి తెలిసి ఉండాలి. అవి అంతరిక్షంలో ఒక రకమైన రేఖాగణిత ప్రాతినిధ్యాలు. ఉదాహరణకు, ఒక వెక్టర్ [3,4] లో x- అక్షం వెంట 3 యూనిట్లు మరియు y- అక్షం వెంట 4 యూనిట్లు ఉన్నాయి. కింది చిత్రాన్ని పరిగణించండి -
వెక్టర్ డి 1 లో x- అక్షం వెంట 0.707 యూనిట్లు మరియు y- అక్షం వెంట 0.707 యూనిట్లు ఉన్నాయి. వెక్టర్ 1 కోణాన్ని కలిగి ఉంటుంది. ఇది తప్పనిసరిగా పరిమాణం మరియు దిశను కలిగి ఉంటుంది. ఉదాహరణకి,
పై చిత్రంలో వెక్టర్ (4,3) ఉంది. దీని పరిమాణం 5 మరియు ఇది x- అక్షంతో 36.9 డిగ్రీలు చేస్తుంది.
ఇప్పుడు, మాతృక అంటే ఏమిటి? మ్యాట్రిక్స్ అనేది సంఖ్యల యొక్క బహుళ-డైమెన్షనల్ శ్రేణి. ఇది దేనికి ఉపయోగించబడింది? మేము ముందుకు చూస్తాము. మొదట, ఇది ఎలా ఉపయోగించబడుతుందో చూద్దాం.
మ్యాట్రిక్స్
మాతృక చాలా కొలతలు కలిగి ఉంటుంది. 2 డైమెన్షనల్ మాతృకను పరిశీలిద్దాం. దీనికి వరుసలు (m) మరియు నిలువు వరుసలు (n) ఉన్నాయి. అందువల్ల దీనికి m * n మూలకాలు ఉంటాయి.
ఉదాహరణకి,
ఈ మాతృకలో 5 వరుసలు మరియు 5 నిలువు వరుసలు ఉన్నాయి. దీనిని A అని పిలుద్దాం. అందువల్ల A (2,3) రెండవ వరుస మరియు మూడవ కాలమ్ 8 లోని ఎంట్రీ.
ఇప్పుడు, మాతృక అంటే ఏమిటో మీకు తెలుసు, మాతృక యొక్క విభిన్న కార్యకలాపాలను పరిశీలించడానికి అనుమతిస్తుంది.
మ్యాట్రిక్స్ ఆపరేషన్స్
మాత్రికల చేరిక
యొక్క రెండు మాత్రికలు అదే కొలతలు జోడించవచ్చు. అదనంగా మూలకం వారీగా జరుగుతుంది.
స్కేలార్ గుణకారం
మాతృకను స్కేలార్ పరిమాణంతో గుణించవచ్చు. ఇటువంటి గుణకారం మాతృకలోని ప్రతి ప్రవేశానికి స్కేలార్ ద్వారా గుణించటానికి దారితీస్తుంది. స్కేలార్ కేవలం సంఖ్య
జావాలో ప్రింట్ రైటర్ అంటే ఏమిటి
మ్యాట్రిక్స్ ట్రాన్స్పోస్
మ్యాట్రిక్స్ ట్రాన్స్పోస్ సులభం. మాతృక A (m, n) కోసం, A ’దాని పారదర్శకంగా ఉండనివ్వండి. అప్పుడు
A '(i, j) = A (j, i)
ఉదాహరణకి,
మ్యాట్రిక్స్ గుణకారం
ఇతర ఆపరేషన్ల కంటే ఇది కొంచెం గమ్మత్తైనది. మేము దానిలోకి ప్రవేశించే ముందు, రెండు వెక్టర్ల మధ్య డాట్ ఉత్పత్తిని నిర్వచించండి.
వెక్టర్ X = [1,4,6,0] మరియు వెక్టర్ Y = [2,3,4,5] పరిగణించండి. అప్పుడు X మరియు Y మధ్య డాట్ ఉత్పత్తిగా నిర్వచించబడింది
X.Y = 1 * 2 + 4 * 3 + 6 * 4 + 0 * 5 = 38
కాబట్టి, ఇది మూలకం వారీ గుణకారం మరియు అదనంగా ఉంటుంది. ఇప్పుడు,A (m, n) మరియు B (n, k) అనే రెండు మాత్రికలను పరిశీలిద్దాం, ఇక్కడ m, n, k కొలతలు మరియు అందువల్ల పూర్ణాంకాలు. మేము మాతృక గుణకారం అని నిర్వచించాము
పై ఉదాహరణలో, ఉత్పత్తి యొక్క మొదటి మూలకం (44) కుడి మాతృక యొక్క మొదటి కాలమ్తో ఎడమ మాతృక యొక్క మొదటి వరుస యొక్క డాట్ ఉత్పత్తి ద్వారా పొందబడుతుంది. అదేవిధంగా, కుడి మాతృక యొక్క రెండవ కాలమ్తో ఎడమ మాతృక యొక్క మొదటి వరుస యొక్క డాట్ ఉత్పత్తి ద్వారా 72 పొందబడుతుంది.
ఎడమ మాతృక కోసం, నిలువు వరుసల సంఖ్య కుడి కాలమ్లోని వరుసల సంఖ్యకు సమానంగా ఉండాలి. మా విషయంలో, AB ఉత్పత్తి ఉనికిలో ఉంది కాని BA కి కాదు ఎందుకంటే m k కి సమానం కాదు. A (m, n) మరియు B (n, k) అనే రెండు మాత్రికలకు, ఉత్పత్తి AB నిర్వచించబడింది మరియు ఉత్పత్తి యొక్క పరిమాణం (m, k) (బయటి చాలా కొలతలు (m, n), (n, k )). M = k తప్ప BA నిర్వచించబడదు.
దీనితో, మెషిన్ లెర్నింగ్ కోసం స్టాటిస్టిక్స్ పై ఈ కథనాన్ని మేము ముగించాము. మెషిన్ లెర్నింగ్ జార్గాన్లో కొన్నింటిని మీరు అర్థం చేసుకున్నారని నేను నమ్ముతున్నాను. ఇది ఇక్కడ ముగియదు. మీరు పరిశ్రమకు సిద్ధంగా ఉన్నారని నిర్ధారించుకోవడానికి, మీరు డేటా సైన్స్ మరియు AI పై ఎడురేకా యొక్క కోర్సులను చూడవచ్చు. వాటిని కనుగొనవచ్చు