లో , మాకు సాధారణంగా 2 రకాల ఉపయోగ కేసులు ఉన్నాయి, , మరియు సమస్య. వర్గీకరణ నమూనా యొక్క ఖచ్చితత్వాన్ని లెక్కించడంలో గందరగోళం మ్యాట్రిక్స్ సహాయపడుతుంది, ఇది వర్గీకరణ నమూనా పనితీరును వివరించడానికి పరోక్షంగా సహాయపడుతుంది. మోడల్ను అంచనా వేసేటప్పుడు ఇది చాలా ముఖ్యమైన దశ. నేను ఈ వ్యాసంలో ఈ క్రింది అంశాలను కవర్ చేస్తాను:
js శ్రేణి యొక్క పొడవును పొందుతారు
2. గందరగోళం మాతృక యొక్క ఖచ్చితత్వం మరియు భాగాలు
3. ప్రెసిషన్, రీకాల్ మరియు ఎఫ్-మెజర్
4. పైథాన్ మరియు స్క్లెర్న్ ఉపయోగించి గందరగోళ మాతృకను సృష్టించడం
గందరగోళం మాతృక అంటే ఏమిటి?
కన్ఫ్యూజన్ మ్యాట్రిక్స్ అంటే results హించిన ఫలితాల పోలిక సారాంశం మరియు ఏదైనా వర్గీకరణ సమస్య వినియోగ కేసులో వాస్తవ ఫలితాలు. కొన్ని శిక్షణ డేటాతో శిక్షణ పొందిన తర్వాత మోడల్ పనితీరును నిర్ణయించడానికి పోలిక సారాంశం చాలా అవసరం.
క్లాస్ 1 విలువను icted హించారు EG: 1 | క్లాస్ 2 విలువను icted హించారు EG: 0 | |
వాస్తవ తరగతి 1 విలువ EG: 1 | TP (ట్రూ పాజిటివ్) | FN (తప్పుడు ప్రతికూల) |
అసలు తరగతి 2 విలువ EG: 0 | FP (తప్పుడు పాజిటివ్) | TN (ట్రూ నెగటివ్) |
పై సంఖ్య నుండి:
మాకు ఉంది,
- వాస్తవ తరగతి 1 విలువ = 1 ఇది బైనరీ ఫలితంలో సానుకూల విలువకు సమానంగా ఉంటుంది.
- వాస్తవ తరగతి 2 విలువ = 0 ఇది బైనరీ ఫలితంలో ప్రతికూల విలువకు సమానంగా ఉంటుంది.
గందరగోళ మాతృక యొక్క ఎడమ వైపు సూచిక ప్రాథమికంగా వాస్తవ విలువలను సూచిస్తుంది మరియు ఎగువ కాలమ్ icted హించిన విలువలను సూచిస్తుంది.
మేము గందరగోళ మాతృకను సృష్టించినప్పుడు వివిధ భాగాలు ఉన్నాయి. భాగాలు క్రింద పేర్కొనబడ్డాయి
పాజిటివ్ (పి): Result హించిన ఫలితం సానుకూలంగా ఉంటుంది (ఉదాహరణ: చిత్రం పిల్లి)
ప్రతికూల (ఎన్): result హించిన ఫలితం ప్రతికూలంగా ఉంటుంది (ఉదాహరణ: చిత్రాలు పిల్లి కాదు)
ట్రూ పాజిటివ్ (టిపి): ఇక్కడ TP ప్రాథమికంగా icted హించినట్లు సూచిస్తుంది మరియు వాస్తవ విలువలు 1 (ట్రూ)
ట్రూ నెగటివ్ (టిఎన్): ఇక్కడ TN అంచనా వేసింది మరియు అసలు విలువ 0 (తప్పు)
తప్పుడు ప్రతికూల (FN): ఇక్కడ FN అంచనా వేసిన విలువ 0 (ప్రతికూల) మరియు వాస్తవ విలువ 1 అని సూచిస్తుంది. ఇక్కడ రెండు విలువలు సరిపోలడం లేదు. అందువల్ల ఇది తప్పుడు ప్రతికూలమైనది.
తప్పుడు పాజిటివ్ (FP): ఇక్కడ FP అంచనా విలువ 1 (పాజిటివ్) మరియు వాస్తవ విలువ 0 అని సూచిస్తుంది. ఇక్కడ మళ్ళీ రెండు విలువలు సరిపోలడం లేదు. అందువల్ల ఇది తప్పుడు పాజిటివ్.
గందరగోళం మాతృక యొక్క ఖచ్చితత్వం మరియు భాగాలు
గందరగోళ మాతృక సృష్టించబడిన తరువాత మరియు మేము అన్ని భాగాల విలువలను నిర్ణయిస్తాము, ఖచ్చితత్వాన్ని లెక్కించడం మాకు చాలా సులభం అవుతుంది. కాబట్టి, దీన్ని బాగా అర్థం చేసుకోవడానికి భాగాలను పరిశీలిద్దాం.- వర్గీకరణ ఖచ్చితత్వం
పై సూత్రం నుండి, TP (ట్రూ పాజిటివ్) మరియు TN (ట్రూ నెగెటివ్) మొత్తం సరైన అంచనా ఫలితాలు. అందువల్ల శాతంలో ఖచ్చితత్వాన్ని లెక్కించడానికి, మేము అన్ని ఇతర భాగాలతో విభజిస్తాము. అయితే, ఖచ్చితత్వంలో కొన్ని సమస్యలు ఉన్నాయి మరియు మేము దానిపై పూర్తిగా ఆధారపడలేము.
మన డేటాసెట్ పూర్తిగా అసమతుల్యమని పరిశీలిద్దాం. ఈ దృష్టాంతంలో, సమస్య ప్రకటన ఆధారంగా 98% ఖచ్చితత్వం మంచిది లేదా చెడు కావచ్చు. అందువల్ల మనకు మరికొన్ని కీలక పదాలు ఉన్నాయి, ఇవి మనం లెక్కించే ఖచ్చితత్వం గురించి ఖచ్చితంగా తెలుసుకోవడానికి సహాయపడతాయి. నిబంధనలు క్రింద ఇవ్వబడ్డాయి:
- TPR (ట్రూ పాజిటివ్ రేట్) లేదా సున్నితత్వం:
ట్రూ పాజిటివ్ రేటును సున్నితత్వం అని కూడా పిలుస్తారు (TP + FN) ద్వారా సూచించబడిన మొత్తం వాస్తవ పాజిటివ్లకు సంబంధించి ట్రూ పాజిటివ్ శాతాన్ని కొలుస్తుంది.
క్లాస్ 1 విలువను icted హించారు EG: 1 | క్లాస్ 2 విలువను icted హించారు EG: 0 | మొత్తం | |
వాస్తవ తరగతి 1 విలువ EG: 1 | TP (ట్రూ పాజిటివ్) | FN (తప్పుడు ప్రతికూల) | మొత్తం వాస్తవ పాజిటివ్లు |
అసలు తరగతి 2 విలువ EG: 0 | FP (తప్పుడు పాజిటివ్) | TN (ట్రూ నెగటివ్) | మొత్తం వాస్తవ ప్రతికూలతలు |
- TNR (నిజమైన ప్రతికూల రేటు) లేదా విశిష్టత:
నిజమైన ప్రతికూల రేటు లేదా విశిష్టత మొత్తం ప్రతికూలతలకు సంబంధించి వాస్తవ ప్రతికూలతల నిష్పత్తిని కొలుస్తుంది
క్లాస్ 1 విలువను icted హించారు EG: 1 | క్లాస్ 2 విలువను icted హించారు EG: 0 | మొత్తం | |
వాస్తవ తరగతి 1 విలువ EG: 1 | TP (ట్రూ పాజిటివ్) | FN (తప్పుడు ప్రతికూల) | మొత్తం వాస్తవ పాజిటివ్లు |
అసలు తరగతి 2 విలువ EG: 0 | FP (తప్పుడు పాజిటివ్) | TN (ట్రూ నెగటివ్) | మొత్తం వాస్తవ ప్రతికూలతలు |
TNR = ట్రూ నెగటివ్ / (ట్రూ నెగటివ్ + ఫాల్స్ పాజిటివ్)
- తప్పుడు పాజిటివ్ రేట్ (FPR):
తప్పుడు పాజిటివ్ రేట్ అంటే ప్రిడిక్టెడ్ ఫాల్స్ పాజిటివ్ (ఎఫ్పి) యొక్క మొత్తం అంచనా సంఖ్య యొక్క సానుకూల సంఖ్య (టిపి + ఎఫ్పి).
క్లాస్ 1 విలువను icted హించారు EG: 1 | క్లాస్ 2 విలువను icted హించారు EG: 0 | |
అసలు తరగతి 1 విలువ EG: 1 | TP (ట్రూ పాజిటివ్) | FN (తప్పుడు ప్రతికూల) |
వాస్తవ తరగతి 2 విలువ EG: 0 | FP (తప్పుడు పాజిటివ్) | TN (ట్రూ నెగటివ్) |
మొత్తం Positive హించిన పాజిటివ్ మొత్తం | మొత్తం అంచనా వేసిన ప్రతికూల మొత్తం |
- తప్పుడు ప్రతికూల రేటు (FNR):
తప్పుడు ప్రతికూల రేటు అంచనా వేయబడిన ప్రతికూల ఫలితాల మొత్తం సంఖ్య (TN + FN) కు అంచనా వేయబడిన తప్పుడు ప్రతికూల (FP) శాతం.
పైథాన్లో __init__
ప్రెసిషన్, రీకాల్ మరియు ఎఫ్-మెజర్
- గుర్తుచేసుకోండి:
రీకాల్ ట్రూ పాజిటివ్ రేట్తో సమానంగా ఉంటుంది మరియు ఇది అన్ని పాజిటివ్ విలువలకు సరిగ్గా అంచనా వేసిన పాజిటివ్ విలువల (టిపి) మొత్తం సంఖ్య యొక్క నిష్పత్తి.
- ఖచ్చితత్వం:
ప్రెసిషన్ ప్రాథమికంగా మోడల్ సానుకూలంగా ఉంటుందని అంచనా వేసిన అన్ని పాయింట్లను సూచిస్తుంది మరియు వాటిలో ఏ శాతం వాస్తవానికి సానుకూలంగా ఉంటుంది.
ప్రెసిషన్ మరియు రీకాల్ మెట్రిక్స్ ఫలితాలు, ఇవి పై సూత్రాల నుండి చూపిన విధంగా సానుకూల తరగతిపై దృష్టి పెడతాయి.
- ఎఫ్-కొలత
కాబట్టి ఎఫ్-మెజర్ అనేది ప్రెసిషన్ మరియు రీకాల్ టెక్నిక్ రెండింటినీ మిళితం చేసే టెక్నిక్ మరియు ఇది సాధారణ అంకగణిత మీన్ స్థానంలో హార్మోనిక్ మీన్ను ఉపయోగిస్తుంది, దీని కారణంగా తీవ్ర విలువలు శిక్షించబడతాయి. F- కొలతను F1- స్కోరు అని కూడా పిలుస్తారు మరియు ఈ క్రింది ఫార్ములా ద్వారా ఇవ్వబడుతుంది.
ఒక ఉదాహరణను పరిశీలిద్దాం మరియు ఖచ్చితత్వం, ప్రెసిషన్, రీకాల్ మరియు ఎఫ్ 1-స్కోర్ను ఎలా లెక్కించవచ్చో చూద్దాం.
ఎన్ = 165 | అవును అని icted హించారు | NO .హించబడింది |
అసలు అవును | టిపి = 150 | FN = 10 |
ప్రస్తుత NO | FP = 20 | TN = 100 |
- ఖచ్చితత్వం = (TP + TN) / (TP + TN + FP + FN) = (150 + 100) / (150 + 100 + 20 + 10) = 0.89
- రీకాల్ = TP / (TP + FN) = 150 / (150 + 10) = 0.93
- ప్రెసిషన్: TP / (TP + FP) = 150 / (150 + 20) = 0.88
- F- కొలత = (2 * రీకాల్ * ప్రెసిషన్) / (రీకాల్ + ప్రిజిషన్) = (2 * 0.93 * 0.88) / (0.93 + 0.88) = 0.90
పైథాన్ మరియు స్క్లెర్న్ ఉపయోగించి గందరగోళ మాతృకను సృష్టించడం
స్క్లీర్న్ లైబ్రరీతో పాటు పైథాన్ ఉపయోగించి గందరగోళ మాతృకను ఎలా సృష్టించవచ్చో ఇప్పుడు మనం చూస్తాము.
ఉదాహరణ వేరియబుల్ అంటే ఏమిటి
ఒకటి. ప్రారంభంలో, మేము వాస్తవ డేటా యొక్క కొంత జాబితాను సృష్టిస్తాము మరియు క్రింద చూపిన విధంగా ఖచ్చితత్వాన్ని తనిఖీ చేస్తామని icted హించాము
గందరగోళ మాతృక సృష్టి కోసం పైథాన్ స్క్రిప్ట్. వాస్తవ_డేటా = [1, 1, 0, 1, 0, 0, 1, 0, 0, 0,1,0,1] icted హించిన_డేటా = [0, 1, 1, 1, 0, 0, 1, 0, 1, 0,1,0,1]
2. దిగువ చూపిన విధంగా మేము గందరగోళ మాతృకను sklearn లైబ్రరీ నుండి దిగుమతి చేసుకోవాలి:
sklearn.metrics నుండి దిగుమతి గందరగోళం_మాట్రిక్స్
3. తరువాత, క్రింద చూపిన విధంగా మేము గందరగోళ మాతృకను సృష్టిస్తాము:
తుది_ ఫలితాలు = గందరగోళం_మాట్రిక్స్ (వాస్తవ_డేటా ,_హించిన_డేటా)
నాలుగు. ఇప్పుడు మనం క్రింద చూపిన విధంగా లైబ్రరీని దిగుమతి చేయడం ద్వారా ముందుకు వెళ్లి ఖచ్చితత్వాన్ని లెక్కించవచ్చు:
sklearn.metrics నుండి దిగుమతి ఖచ్చితత్వం_ స్కోర్ ఖచ్చితత్వం = ఖచ్చితత్వం_ స్కోర్ (వాస్తవ_డేటా ,_హించిన_డేటా)
5. చివరగా, మేము క్రింద చూపిన విధంగా F1- స్కోరు లేదా F- కొలతను లెక్కిస్తాము:
sklearn.metrics నుండి దిగుమతి classification_report report = classification_report (వాస్తవ_డేటా ,_హించిన_డేటా)
పూర్తి కోడ్ క్రింద ఉంది:
వాస్తవ_డేటా = [1, 1, 0, 1, 0, 0, 1, 0, 0, 0,1,0,1] icted హించిన_డేటా = [0, 1, 1, 1, 0, 0, 1, 0, 1, 0,1,0,1] sklearn.metrics నుండి దిగుమతి confusion_matrix final_results = confusion_matrix (వాస్తవ_డేటా, icted హించిన_డేటా) sklearn నుండి ప్రింట్ (తుది_ ఫలితాలు). వాస్తవ_డేటా ,_హించిన_డేటా) ముద్రణ (ఖచ్చితత్వం) ముద్రణ (నివేదిక)
కాబట్టి, దీనితో, మేము ఈ వ్యాసం ముగింపుకు వస్తాము. కన్ఫ్యూజన్ మ్యాట్రిక్స్ గురించి మీ గందరగోళం ఇప్పుడు పరిష్కరించబడిందని నేను ఆశిస్తున్నాను.
ఎడురేకా రిగ్రెషన్, క్లస్టరింగ్, డెసిషన్ ట్రీస్, రాండమ్ ఫారెస్ట్, నావ్ బేయెస్ మరియు క్యూ-లెర్నింగ్ వంటి వివిధ యంత్ర అభ్యాస అల్గోరిథంలలో నైపుణ్యాన్ని పొందడానికి మీకు సహాయపడుతుంది. పైథాన్ శిక్షణను ఉపయోగించి ఈ యంత్ర అభ్యాసం మిమ్మల్ని గణాంకాలు, సమయ శ్రేణి మరియు పర్యవేక్షించబడిన, పర్యవేక్షించబడని మరియు ఉపబల అల్గోరిథంల వంటి వివిధ రకాల యంత్ర అభ్యాస అల్గోరిథంల యొక్క భావనలకు బహిర్గతం చేస్తుంది. డేటా సైన్స్ సర్టిఫికేషన్ కోర్సులో, మీరు మీడియా, హెల్త్కేర్, సోషల్ మీడియా, ఏవియేషన్, హెచ్ఆర్పై నిజ జీవిత కేసు అధ్యయనాలను పరిష్కరిస్తారు.