మెషిన్ లెర్నింగ్‌లో కన్‌ఫ్యూజన్ మ్యాట్రిక్స్: యువర్ వన్ స్టాప్ సొల్యూషన్



ఈ వ్యాసం కన్ఫ్యూజన్ మ్యాట్రిక్స్ పై దృష్టి పెడుతుంది, ఇది దాని మెషిన్ లెర్నింగ్ అల్గోరిథం యొక్క ఖచ్చితత్వాన్ని అంచనా వేయడానికి ఉపయోగించే ముఖ్యమైన అంశాలలో ఒకటి.

లో , మాకు సాధారణంగా 2 రకాల ఉపయోగ కేసులు ఉన్నాయి, , మరియు సమస్య. వర్గీకరణ నమూనా యొక్క ఖచ్చితత్వాన్ని లెక్కించడంలో గందరగోళం మ్యాట్రిక్స్ సహాయపడుతుంది, ఇది వర్గీకరణ నమూనా పనితీరును వివరించడానికి పరోక్షంగా సహాయపడుతుంది. మోడల్‌ను అంచనా వేసేటప్పుడు ఇది చాలా ముఖ్యమైన దశ. నేను ఈ వ్యాసంలో ఈ క్రింది అంశాలను కవర్ చేస్తాను:

1. గందరగోళం మాతృక అంటే ఏమిటి?





js శ్రేణి యొక్క పొడవును పొందుతారు

2. గందరగోళం మాతృక యొక్క ఖచ్చితత్వం మరియు భాగాలు

3. ప్రెసిషన్, రీకాల్ మరియు ఎఫ్-మెజర్



4. పైథాన్ మరియు స్క్లెర్న్ ఉపయోగించి గందరగోళ మాతృకను సృష్టించడం

గందరగోళం మాతృక అంటే ఏమిటి?

కన్ఫ్యూజన్ మ్యాట్రిక్స్ అంటే results హించిన ఫలితాల పోలిక సారాంశం మరియు ఏదైనా వర్గీకరణ సమస్య వినియోగ కేసులో వాస్తవ ఫలితాలు. కొన్ని శిక్షణ డేటాతో శిక్షణ పొందిన తర్వాత మోడల్ పనితీరును నిర్ణయించడానికి పోలిక సారాంశం చాలా అవసరం. Accuracy-Confusion-Matrixబైనరీ వర్గీకరణ వినియోగ కేసు కోసం, కన్ఫ్యూజన్ మ్యాట్రిక్స్ 2 × 2 మాతృక, ఇది క్రింద చూపిన విధంగా ఉంటుంది
క్లాస్ 1 విలువను icted హించారు EG: 1 క్లాస్ 2 విలువను icted హించారు EG: 0
వాస్తవ తరగతి 1 విలువ

EG: 1

TP (ట్రూ పాజిటివ్) FN (తప్పుడు ప్రతికూల)
అసలు తరగతి 2 విలువ



EG: 0

FP (తప్పుడు పాజిటివ్) TN (ట్రూ నెగటివ్)

పై సంఖ్య నుండి:
మాకు ఉంది,

  • వాస్తవ తరగతి 1 విలువ = 1 ఇది బైనరీ ఫలితంలో సానుకూల విలువకు సమానంగా ఉంటుంది.
  • వాస్తవ తరగతి 2 విలువ = 0 ఇది బైనరీ ఫలితంలో ప్రతికూల విలువకు సమానంగా ఉంటుంది.

గందరగోళ మాతృక యొక్క ఎడమ వైపు సూచిక ప్రాథమికంగా వాస్తవ విలువలను సూచిస్తుంది మరియు ఎగువ కాలమ్ icted హించిన విలువలను సూచిస్తుంది.

మేము గందరగోళ మాతృకను సృష్టించినప్పుడు వివిధ భాగాలు ఉన్నాయి. భాగాలు క్రింద పేర్కొనబడ్డాయి

పాజిటివ్ (పి): Result హించిన ఫలితం సానుకూలంగా ఉంటుంది (ఉదాహరణ: చిత్రం పిల్లి)

ప్రతికూల (ఎన్): result హించిన ఫలితం ప్రతికూలంగా ఉంటుంది (ఉదాహరణ: చిత్రాలు పిల్లి కాదు)

ట్రూ పాజిటివ్ (టిపి): ఇక్కడ TP ప్రాథమికంగా icted హించినట్లు సూచిస్తుంది మరియు వాస్తవ విలువలు 1 (ట్రూ)

ట్రూ నెగటివ్ (టిఎన్): ఇక్కడ TN అంచనా వేసింది మరియు అసలు విలువ 0 (తప్పు)

తప్పుడు ప్రతికూల (FN): ఇక్కడ FN అంచనా వేసిన విలువ 0 (ప్రతికూల) మరియు వాస్తవ విలువ 1 అని సూచిస్తుంది. ఇక్కడ రెండు విలువలు సరిపోలడం లేదు. అందువల్ల ఇది తప్పుడు ప్రతికూలమైనది.

తప్పుడు పాజిటివ్ (FP): ఇక్కడ FP అంచనా విలువ 1 (పాజిటివ్) మరియు వాస్తవ విలువ 0 అని సూచిస్తుంది. ఇక్కడ మళ్ళీ రెండు విలువలు సరిపోలడం లేదు. అందువల్ల ఇది తప్పుడు పాజిటివ్.

గందరగోళం మాతృక యొక్క ఖచ్చితత్వం మరియు భాగాలు

గందరగోళ మాతృక సృష్టించబడిన తరువాత మరియు మేము అన్ని భాగాల విలువలను నిర్ణయిస్తాము, ఖచ్చితత్వాన్ని లెక్కించడం మాకు చాలా సులభం అవుతుంది. కాబట్టి, దీన్ని బాగా అర్థం చేసుకోవడానికి భాగాలను పరిశీలిద్దాం.
  • వర్గీకరణ ఖచ్చితత్వం

పై సూత్రం నుండి, TP (ట్రూ పాజిటివ్) మరియు TN (ట్రూ నెగెటివ్) మొత్తం సరైన అంచనా ఫలితాలు. అందువల్ల శాతంలో ఖచ్చితత్వాన్ని లెక్కించడానికి, మేము అన్ని ఇతర భాగాలతో విభజిస్తాము. అయితే, ఖచ్చితత్వంలో కొన్ని సమస్యలు ఉన్నాయి మరియు మేము దానిపై పూర్తిగా ఆధారపడలేము.

మన డేటాసెట్ పూర్తిగా అసమతుల్యమని పరిశీలిద్దాం. ఈ దృష్టాంతంలో, సమస్య ప్రకటన ఆధారంగా 98% ఖచ్చితత్వం మంచిది లేదా చెడు కావచ్చు. అందువల్ల మనకు మరికొన్ని కీలక పదాలు ఉన్నాయి, ఇవి మనం లెక్కించే ఖచ్చితత్వం గురించి ఖచ్చితంగా తెలుసుకోవడానికి సహాయపడతాయి. నిబంధనలు క్రింద ఇవ్వబడ్డాయి:

  • TPR (ట్రూ పాజిటివ్ రేట్) లేదా సున్నితత్వం:

ట్రూ పాజిటివ్ రేటును సున్నితత్వం అని కూడా పిలుస్తారు (TP + FN) ద్వారా సూచించబడిన మొత్తం వాస్తవ పాజిటివ్‌లకు సంబంధించి ట్రూ పాజిటివ్ శాతాన్ని కొలుస్తుంది.

క్లాస్ 1 విలువను icted హించారు EG: 1 క్లాస్ 2 విలువను icted హించారు EG: 0 మొత్తం
వాస్తవ తరగతి 1 విలువ

EG: 1

TP (ట్రూ పాజిటివ్) FN (తప్పుడు ప్రతికూల) మొత్తం వాస్తవ పాజిటివ్‌లు
అసలు తరగతి 2 విలువ

EG: 0

FP (తప్పుడు పాజిటివ్)TN (ట్రూ నెగటివ్)మొత్తం వాస్తవ ప్రతికూలతలు
టిపిఆర్ = ట్రూ పాజిటివ్ / (ట్రూ పాజిటివ్ + ఫాల్స్ నెగటివ్
  • TNR (నిజమైన ప్రతికూల రేటు) లేదా విశిష్టత:

నిజమైన ప్రతికూల రేటు లేదా విశిష్టత మొత్తం ప్రతికూలతలకు సంబంధించి వాస్తవ ప్రతికూలతల నిష్పత్తిని కొలుస్తుంది

క్లాస్ 1 విలువను icted హించారు EG: 1 క్లాస్ 2 విలువను icted హించారు EG: 0 మొత్తం
వాస్తవ తరగతి 1 విలువ

EG: 1

TP (ట్రూ పాజిటివ్)FN (తప్పుడు ప్రతికూల)మొత్తం వాస్తవ పాజిటివ్‌లు
అసలు తరగతి 2 విలువ

EG: 0

FP (తప్పుడు పాజిటివ్) TN (ట్రూ నెగటివ్) మొత్తం వాస్తవ ప్రతికూలతలు

TNR = ట్రూ నెగటివ్ / (ట్రూ నెగటివ్ + ఫాల్స్ పాజిటివ్)

  • తప్పుడు పాజిటివ్ రేట్ (FPR):

తప్పుడు పాజిటివ్ రేట్ అంటే ప్రిడిక్టెడ్ ఫాల్స్ పాజిటివ్ (ఎఫ్‌పి) యొక్క మొత్తం అంచనా సంఖ్య యొక్క సానుకూల సంఖ్య (టిపి + ఎఫ్‌పి).

క్లాస్ 1 విలువను icted హించారు EG: 1 క్లాస్ 2 విలువను icted హించారు EG: 0
అసలు తరగతి 1 విలువ EG: 1 TP (ట్రూ పాజిటివ్) FN (తప్పుడు ప్రతికూల)
వాస్తవ తరగతి 2 విలువ EG: 0 FP (తప్పుడు పాజిటివ్) TN (ట్రూ నెగటివ్)
మొత్తం Positive హించిన పాజిటివ్ మొత్తం మొత్తం అంచనా వేసిన ప్రతికూల మొత్తం
FPR = తప్పుడు పాజిటివ్ / (ట్రూ పాజిటివ్ + ఫాల్స్ పాజిటివ్)
  • తప్పుడు ప్రతికూల రేటు (FNR):

తప్పుడు ప్రతికూల రేటు అంచనా వేయబడిన ప్రతికూల ఫలితాల మొత్తం సంఖ్య (TN + FN) కు అంచనా వేయబడిన తప్పుడు ప్రతికూల (FP) శాతం.

పైథాన్‌లో __init__
క్లాస్ 1 విలువను icted హించారు EG: 1 క్లాస్ 2 విలువను icted హించారు EG: 0
అసలు తరగతి 1 విలువ EG: 1TP (ట్రూ పాజిటివ్) FN (తప్పుడు ప్రతికూల)
వాస్తవ తరగతి 2 విలువ EG: 0FP (తప్పుడు పాజిటివ్) TN (ట్రూ నెగటివ్)
మొత్తం Positive హించిన పాజిటివ్ మొత్తం మొత్తం అంచనా వేసిన ప్రతికూల మొత్తం
FNR = తప్పుడు ప్రతికూల / (తప్పుడు ప్రతికూల + నిజమైన ప్రతికూల)

ప్రెసిషన్, రీకాల్ మరియు ఎఫ్-మెజర్

  • గుర్తుచేసుకోండి:

రీకాల్ ట్రూ పాజిటివ్ రేట్‌తో సమానంగా ఉంటుంది మరియు ఇది అన్ని పాజిటివ్ విలువలకు సరిగ్గా అంచనా వేసిన పాజిటివ్ విలువల (టిపి) మొత్తం సంఖ్య యొక్క నిష్పత్తి.

  • ఖచ్చితత్వం:

ప్రెసిషన్ ప్రాథమికంగా మోడల్ సానుకూలంగా ఉంటుందని అంచనా వేసిన అన్ని పాయింట్లను సూచిస్తుంది మరియు వాటిలో ఏ శాతం వాస్తవానికి సానుకూలంగా ఉంటుంది.

ప్రెసిషన్ మరియు రీకాల్ మెట్రిక్స్ ఫలితాలు, ఇవి పై సూత్రాల నుండి చూపిన విధంగా సానుకూల తరగతిపై దృష్టి పెడతాయి.

  • ఎఫ్-కొలత

కాబట్టి ఎఫ్-మెజర్ అనేది ప్రెసిషన్ మరియు రీకాల్ టెక్నిక్ రెండింటినీ మిళితం చేసే టెక్నిక్ మరియు ఇది సాధారణ అంకగణిత మీన్ స్థానంలో హార్మోనిక్ మీన్‌ను ఉపయోగిస్తుంది, దీని కారణంగా తీవ్ర విలువలు శిక్షించబడతాయి. F- కొలతను F1- స్కోరు అని కూడా పిలుస్తారు మరియు ఈ క్రింది ఫార్ములా ద్వారా ఇవ్వబడుతుంది.

ఒక ఉదాహరణను పరిశీలిద్దాం మరియు ఖచ్చితత్వం, ప్రెసిషన్, రీకాల్ మరియు ఎఫ్ 1-స్కోర్‌ను ఎలా లెక్కించవచ్చో చూద్దాం.

ఎన్ = 165 అవును అని icted హించారు NO .హించబడింది
అసలు అవును టిపి = 150 FN = 10
ప్రస్తుత NO FP = 20 TN = 100
    • ఖచ్చితత్వం = (TP + TN) / (TP + TN + FP + FN) = (150 + 100) / (150 + 100 + 20 + 10) = 0.89
    • రీకాల్ = TP / (TP + FN) = 150 / (150 + 10) = 0.93
    • ప్రెసిషన్: TP / (TP + FP) = 150 / (150 + 20) = 0.88

  • F- కొలత = (2 * రీకాల్ * ప్రెసిషన్) / (రీకాల్ + ప్రిజిషన్) = (2 * 0.93 * 0.88) / (0.93 + 0.88) = 0.90

పైథాన్ మరియు స్క్లెర్న్ ఉపయోగించి గందరగోళ మాతృకను సృష్టించడం

స్క్లీర్న్ లైబ్రరీతో పాటు పైథాన్ ఉపయోగించి గందరగోళ మాతృకను ఎలా సృష్టించవచ్చో ఇప్పుడు మనం చూస్తాము.

ఉదాహరణ వేరియబుల్ అంటే ఏమిటి

ఒకటి. ప్రారంభంలో, మేము వాస్తవ డేటా యొక్క కొంత జాబితాను సృష్టిస్తాము మరియు క్రింద చూపిన విధంగా ఖచ్చితత్వాన్ని తనిఖీ చేస్తామని icted హించాము

గందరగోళ మాతృక సృష్టి కోసం పైథాన్ స్క్రిప్ట్. వాస్తవ_డేటా = [1, 1, 0, 1, 0, 0, 1, 0, 0, 0,1,0,1] icted హించిన_డేటా = [0, 1, 1, 1, 0, 0, 1, 0, 1, 0,1,0,1]

2. దిగువ చూపిన విధంగా మేము గందరగోళ మాతృకను sklearn లైబ్రరీ నుండి దిగుమతి చేసుకోవాలి:

sklearn.metrics నుండి దిగుమతి గందరగోళం_మాట్రిక్స్

3. తరువాత, క్రింద చూపిన విధంగా మేము గందరగోళ మాతృకను సృష్టిస్తాము:

తుది_ ఫలితాలు = గందరగోళం_మాట్రిక్స్ (వాస్తవ_డేటా ,_హించిన_డేటా)

నాలుగు. ఇప్పుడు మనం క్రింద చూపిన విధంగా లైబ్రరీని దిగుమతి చేయడం ద్వారా ముందుకు వెళ్లి ఖచ్చితత్వాన్ని లెక్కించవచ్చు:

sklearn.metrics నుండి దిగుమతి ఖచ్చితత్వం_ స్కోర్ ఖచ్చితత్వం = ఖచ్చితత్వం_ స్కోర్ (వాస్తవ_డేటా ,_హించిన_డేటా)

5. చివరగా, మేము క్రింద చూపిన విధంగా F1- స్కోరు లేదా F- కొలతను లెక్కిస్తాము:

sklearn.metrics నుండి దిగుమతి classification_report report = classification_report (వాస్తవ_డేటా ,_హించిన_డేటా)

పూర్తి కోడ్ క్రింద ఉంది:

వాస్తవ_డేటా = [1, 1, 0, 1, 0, 0, 1, 0, 0, 0,1,0,1] icted హించిన_డేటా = [0, 1, 1, 1, 0, 0, 1, 0, 1, 0,1,0,1] sklearn.metrics నుండి దిగుమతి confusion_matrix final_results = confusion_matrix (వాస్తవ_డేటా, icted హించిన_డేటా) sklearn నుండి ప్రింట్ (తుది_ ఫలితాలు). వాస్తవ_డేటా ,_హించిన_డేటా) ముద్రణ (ఖచ్చితత్వం) ముద్రణ (నివేదిక)

matrix

కాబట్టి, దీనితో, మేము ఈ వ్యాసం ముగింపుకు వస్తాము. కన్‌ఫ్యూజన్ మ్యాట్రిక్స్ గురించి మీ గందరగోళం ఇప్పుడు పరిష్కరించబడిందని నేను ఆశిస్తున్నాను.

ఎడురేకా రిగ్రెషన్, క్లస్టరింగ్, డెసిషన్ ట్రీస్, రాండమ్ ఫారెస్ట్, నావ్ బేయెస్ మరియు క్యూ-లెర్నింగ్ వంటి వివిధ యంత్ర అభ్యాస అల్గోరిథంలలో నైపుణ్యాన్ని పొందడానికి మీకు సహాయపడుతుంది. పైథాన్ శిక్షణను ఉపయోగించి ఈ యంత్ర అభ్యాసం మిమ్మల్ని గణాంకాలు, సమయ శ్రేణి మరియు పర్యవేక్షించబడిన, పర్యవేక్షించబడని మరియు ఉపబల అల్గోరిథంల వంటి వివిధ రకాల యంత్ర అభ్యాస అల్గోరిథంల యొక్క భావనలకు బహిర్గతం చేస్తుంది. డేటా సైన్స్ సర్టిఫికేషన్ కోర్సులో, మీరు మీడియా, హెల్త్‌కేర్, సోషల్ మీడియా, ఏవియేషన్, హెచ్‌ఆర్‌పై నిజ జీవిత కేసు అధ్యయనాలను పరిష్కరిస్తారు.