పైథాన్‌లో లాజిస్టిక్ రిగ్రెషన్ ఎలా చేయాలి?



పైథాన్‌లో లాజిస్టిక్ రిగ్రెషన్ ఆధారపడిన మరియు ఒకటి లేదా అంతకంటే ఎక్కువ స్వతంత్ర చరరాశుల మధ్య సంబంధాన్ని నిర్ణయించడం ద్వారా ఫలితాన్ని అంచనా వేయడానికి స్క్లెర్న్ ఉపయోగించి.

పైథాన్‌లో లాజిస్టిక్ రిగ్రెషన్ ఒక ప్రిడిక్టివ్ ఎనాలిసిస్ టెక్నిక్. ఇది బైనరీ వర్గీకరణ సమస్యలకు మెషిన్ లెర్నింగ్‌లో కూడా ఉపయోగించబడుతుంది. పైథాన్‌లో లాజిస్టిక్ రిగ్రెషన్‌ను అర్థం చేసుకోవడానికి ఈ బ్లాగులో మేము ఈ క్రింది విషయాల ద్వారా వెళ్తాము:

  1. రిగ్రెషన్ అంటే ఏమిటి?
  2. పైథాన్‌లో లాజిస్టిక్ రిగ్రెషన్
  3. లాజిస్టిక్ రిగ్రెషన్ vs లీనియర్ రిగ్రెషన్
  4. కేసులు వాడండి
  5. ప్రదర్శన

పైథాన్‌లో లాజిస్టిక్ రిగ్రెషన్‌పై ఈ వివరణాత్మక ట్యుటోరియల్‌ను మీరు మంచి అవగాహన కోసం ప్రదర్శనతో సూచించవచ్చు లేదా దీని ద్వారా వెళ్ళవచ్చు లాజిస్టిక్ రిగ్రెషన్ మాస్టర్ చేయడానికి.





రిగ్రెషన్ అంటే ఏమిటి?

విశ్లేషణ ఒక శక్తివంతమైన గణాంక విశ్లేషణ సాంకేతికత. జ ఆధారపడి ఉంటుంది మా ఆసక్తి యొక్క వేరియబుల్ ఇతర విలువలను అంచనా వేయడానికి ఉపయోగించబడుతుంది స్వతంత్ర చరరాశులు డేటా-సెట్‌లో.

మేము అన్ని సమయాలలో ఒక సహజమైన రీతిలో రిగ్రెషన్‌ను చూస్తాము. గతంలో వాతావరణ పరిస్థితుల యొక్క డేటా-సెట్‌ను ఉపయోగించి వాతావరణాన్ని అంచనా వేయడం వంటిది.



ఫలితాన్ని విశ్లేషించడానికి మరియు అంచనా వేయడానికి ఇది చాలా పద్ధతులను ఉపయోగిస్తుంది, కాని ప్రధానంగా ప్రాధాన్యత ఇవ్వబడుతుంది డిపెండెంట్ వేరియబుల్ మరియు ఒకటి లేదా అంతకంటే ఎక్కువ స్వతంత్ర వేరియబుల్ మధ్య సంబంధం.

విశ్లేషణ బైనరీ వేరియబుల్‌లో ఫలితాన్ని అంచనా వేస్తుంది, ఇది కేవలం రెండు ఫలితాలను మాత్రమే కలిగి ఉంటుంది.



పైథాన్‌లో లాజిస్టిక్ రిగ్రెషన్

బైనరీ వేరియబుల్‌లో ఫలితాన్ని అంచనా వేయడానికి ఆధారిత వేరియబుల్ మరియు ఒకటి లేదా అంతకంటే ఎక్కువ స్వతంత్ర చరరాశులను కలిగి ఉన్న డేటా-సెట్‌ను విశ్లేషించడానికి ఇది ఒక సాంకేతికత, అంటే దీనికి రెండు ఫలితాలు మాత్రమే ఉంటాయి.

ఆధారిత వేరియబుల్ వర్గీకరణ ప్రకృతి లో. డిపెండెంట్ వేరియబుల్ అని కూడా పిలుస్తారు లక్ష్య వేరియబుల్ మరియు స్వతంత్ర చరరాశులను అంటారు ict హాజనిత .

లాజిస్టిక్ రిగ్రెషన్ అనేది లీనియర్ రిగ్రెషన్ యొక్క ప్రత్యేక సందర్భం, ఇక్కడ మేము వర్గీకరణ వేరియబుల్‌లో మాత్రమే ఫలితాన్ని అంచనా వేస్తాము. ఇది లాగ్ ఫంక్షన్‌ను ఉపయోగించి ఈవెంట్ యొక్క సంభావ్యతను ts హించింది.

మేము ఉపయోగిస్తాము సిగ్మోయిడ్ ఫంక్షన్ / కర్వ్ వర్గీకరణ విలువను అంచనా వేయడానికి. ప్రవేశ విలువ ఫలితాన్ని నిర్ణయిస్తుంది (గెలుపు / ఓటమి).

లీనియర్ రిగ్రెషన్ సమీకరణం: y = β0 + X1X1 + X2X2…. + XnXn

  • Y అంటే అంచనా వేయవలసిన డిపెండెంట్ వేరియబుల్.
  • β0 అనేది Y- అంతరాయం, ఇది ప్రాథమికంగా y- అక్షాన్ని తాకిన రేఖలోని బిందువు.
  • β1 అనేది రేఖ యొక్క వాలు (ఆధారిత వేరియబుల్ మరియు స్వతంత్ర వేరియబుల్ మధ్య సంబంధాన్ని బట్టి వాలు ప్రతికూలంగా లేదా సానుకూలంగా ఉంటుంది.)
  • X ఇక్కడ మా ఫలిత ఆధారిత విలువను అంచనా వేయడానికి ఉపయోగించే స్వతంత్ర చరరాశిని సూచిస్తుంది.

సిగ్మోయిడ్ ఫంక్షన్: p = 1/1 + ఇ-వై

లీనియర్ రిగ్రెషన్ సమీకరణంలో సిగ్మోయిడ్ ఫంక్షన్‌ను వర్తించండి.

పైథాన్-ఎడురేకాలో లాజిస్టిక్ రిగ్రెషన్

లాజిస్టిక్ రిగ్రెషన్ సమీకరణం: p = 1/1 + ఇ- (β0 + X1X1 + X2X2…. + XnXn)

వివిధ రకాల లాజిస్టిక్ రిగ్రెషన్‌ను చూద్దాం.

లాజిస్టిక్ రిగ్రెషన్ రకాలు

t sql తేదీ డేటా రకం
    • బైనరీ లాజిస్టిక్ రిగ్రెషన్ - ఇది రెండు సాధ్యం ఫలితాలను మాత్రమే కలిగి ఉంది. ఉదాహరణ- అవును లేదా కాదు
    • మల్టీనోమియల్ లాజిస్టిక్ రిగ్రెషన్ - ఇది మూడు లేదా అంతకంటే ఎక్కువ నామమాత్రపు వర్గాలను కలిగి ఉంది. ఉదాహరణ- పిల్లి, కుక్క, ఏనుగు.
    • ఆర్డినల్ లాజిస్టిక్ రిగ్రెషన్- ఇది మూడు లేదా అంతకంటే ఎక్కువ ఆర్డినల్ వర్గాలను కలిగి ఉంది, ఆర్డినల్ అంటే కేతగిరీలు ఒక క్రమంలో ఉంటాయి. ఉదాహరణ- వినియోగదారు రేటింగ్‌లు (1-5).

లీనియర్ Vs లాజిస్టిక్ రిగ్రెషన్

లీనియర్ రిగ్రెషన్ కలిగి ఉంటుంది అనంతమైన సాధ్యం విలువలు, లాజిస్టిక్ రిగ్రెషన్ ఉంది ఖచ్చితమైన ఫలితాలు .

ప్రతిస్పందన వేరియబుల్ ప్రకృతిలో నిరంతరాయంగా ఉన్నప్పుడు లీనియర్ రిగ్రెషన్ ఉపయోగించబడుతుంది, అయితే ప్రతిస్పందన వేరియబుల్ ప్రకృతిలో వర్గీకరించబడినప్పుడు లాజిస్టిక్ రిగ్రెషన్ ఉపయోగించబడుతుంది.

గతంలో లావాదేవీ వివరాలను ఉపయోగించి బ్యాంకులో డిఫాల్టర్‌ను ting హించడం లాజిస్టిక్ రిగ్రెషన్‌కు ఉదాహరణ, స్టాక్ మార్కెట్ స్కోరు వంటి నిరంతర ఉత్పత్తి సరళ రిగ్రెషన్‌కు ఉదాహరణ.

కేసులు వాడండి

మేము లాజిస్టిక్ రిగ్రెషన్‌ను ఉపయోగించగల ఉపయోగ సందర్భాలు క్రిందివి.

వాతావరణ అంచనా

వాతావరణ అంచనాలు తార్కిక తిరోగమనం యొక్క ఫలితం. ఇక్కడ, మేము మునుపటి వాతావరణ నివేదికల డేటాను విశ్లేషిస్తాము మరియు ఒక నిర్దిష్ట రోజుకు సాధ్యమయ్యే ఫలితాన్ని అంచనా వేస్తాము. కానీ లాజికల్ రిగ్రెషన్ వర్షం పడుతుందో లేదో వంటి వర్గీకరణ డేటాను మాత్రమే అంచనా వేస్తుంది.

అనారోగ్యాన్ని నిర్ణయించడం

మేము చేయవచ్చువా డుఅనారోగ్యం ఏ సందర్భంలోనైనా సానుకూలంగా లేదా ప్రతికూలంగా ఉందో అంచనా వేయడానికి రోగి యొక్క వైద్య చరిత్ర సహాయంతో తార్కిక రిగ్రెషన్.

లాజిస్టిక్ రిగ్రెషన్ ఉపయోగించి ప్రిడిక్షన్ మోడల్‌ను రూపొందించడానికి నమూనా డేటా-సెట్‌ను తీసుకుందాం.

డెమో

మేము ప్రిడిక్షన్ మోడల్‌ను నిర్మించబోతున్నాంఉపయోగించిసహాయంతో పైథాన్‌లో లాజికల్ రిగ్రెషన్యొక్కడేటాసెట్,ఇందులోతార్కిక రిగ్రెషన్ సాధించడానికి మేము ఈ క్రింది దశలను కవర్ చేయబోతున్నాము.

డేటాను సేకరిస్తోంది

లాజిస్టిక్ రిగ్రెషన్ అమలు చేయడానికి మొదటి దశ డేటాను సేకరించడం. డేటా-సెట్ ఉన్న csv ఫైల్‌ను పాండాలను ఉపయోగించి ప్రోగ్రామ్‌లలోకి లోడ్ చేస్తాము. సంబంధిత డేటా మధ్య సంబంధాన్ని విశ్లేషించడం ద్వారా ఇంటి ఆట లేదా దూర ఆట యొక్క అవకాశాన్ని అంచనా వేయడానికి అంచనా నమూనాను రూపొందించడానికి మేము NBA డేటాను ఉపయోగిస్తున్నాము.

పాండాలను పిడిగా దిగుమతి చేసుకోండి

సులభమైన విశ్లేషణ కోసం మీరు మొత్తం డేటాను చదవగలిగే ఆకృతిలోకి పొందుతారు. ఆపై మీరు మీ మోడల్ కోసం ఆధారిత మరియు స్వతంత్ర చరరాశులను నిర్ణయించవచ్చు.

డేటాను విశ్లేషిస్తోంది

వేరియబుల్స్ మధ్య సంబంధాన్ని నిర్ణయించడానికి డేటా-సెట్ విశ్లేషించబడుతుంది. వేరియబుల్స్ మధ్య సంబంధాన్ని తనిఖీ చేయడానికి వేర్వేరు ప్లాట్లను సృష్టించడం ద్వారా.

sns.countplot ('హోమ్', రంగు = 'WINorLOSS', డేటా = df) plt.show ()

పైన ఉన్నది ఇంటి / దూరపు ఆటకు సంబంధించి గెలుపు / ఓడిపోయిన శాతం మధ్య సంబంధం. ఎస్సమానంగామేము డేటాలోని ఇతర సంబంధిత ఎంట్రీల మధ్య సంబంధం యొక్క గ్రాఫ్‌ను ప్లాట్ చేయవచ్చు.

డేటా రాంగ్లింగ్

లక్ష్య-వేరియబుల్ ప్రకారం డేటా-సెట్ సవరించబడుతుంది. మేము డేటాఫ్రేమ్ నుండి అన్ని శూన్య విలువలు మరియు స్ట్రింగ్ విలువలను తొలగిస్తాము.

ముద్రణ (df.isnull (). మొత్తం ())

ప్రిడిక్షన్ మోడల్‌ను నిర్మించేటప్పుడు అవసరం లేని శూన్య విలువలు మరియు విలువలు వంటి అన్ని అసంబద్ధమైన డేటాను మేము తనిఖీ చేస్తాము. మేము ఉపయోగిస్తున్న NBA డేటాసెట్‌లో శూన్య విలువలు లేకపోతే, మేము డేటాను విభజించడంతో ముందుకు వెళ్తాము.

పరీక్ష మరియు రైలు డేటా

మోడల్ పనితీరు కోసం డేటా పరీక్ష డేటా మరియు రైలు డేటాగా విభజించబడింది. ఉపయోగించి డేటాను విభజించారు రైలు_టెస్ట్_స్ప్లిట్ . ఇక్కడ డేటా 70:30 నిష్పత్తిలో విభజించబడింది.

ఇప్పుడు, కోసం మోడల్ ప్రిడిక్షన్ లాజిస్టిక్ రిగ్రెషన్ ఫంక్షన్ స్క్లీర్న్ మాడ్యూల్‌లో లాజిస్టిక్ రిగ్రెషన్ మోడల్‌ను దిగుమతి చేయడం ద్వారా అమలు చేయబడుతుంది.

మోడల్ అప్పుడు ఫిట్ ఫంక్షన్ ఉపయోగించి రైలు సెట్లో సరిపోతుంది. దీని తరువాత ప్రిడిక్షన్ ఫంక్షన్ ఉపయోగించి ప్రిడిక్షన్ జరుగుతుంది.

sklearn.model_selection దిగుమతి రైలు_టెస్ట్_స్ప్లిట్ నుండి sklearn.linear_model దిగుమతి sklearn.metrics నుండి లాజిస్టిక్ రిగ్రెషన్ sklearn.metrics దిగుమతి వర్గీకరణ_ sklearn నుండి రిపోర్ట్ చేయండి. x_test, y_train, y_test = train_test_split (x, y, test_size = 0.33, random_state = 1) logmodel = LogisticRegress () logmodel.fit (x_train, y_train) అంచనాలు = logmodel.predict (x_test) ప్రింట్ (వర్గీకరణ_ నివేదిక) ముద్రణ (గందరగోళం_మాట్రిక్స్ (y_test, అంచనాలు)) ముద్రణ (ఖచ్చితత్వం_ స్కోర్ (y_test, అంచనాలు))

వర్గీకరణ నివేదిక:

వర్గీకరణ నివేదిక ప్రదర్శిస్తుంది ప్రెసిషన్ , రీకాల్, ఎఫ్ 1 మరియు సపోర్ట్ మోడల్ కోసం స్కోర్లు.

ప్రెసిషన్ స్కోరు అంటే మోడల్ చేసిన అంచనా ఖచ్చితమైనది. ఇంటి ఆట యొక్క ఖచ్చితత్వం 0.62 మరియు దూరంగా ఆట కోసం 0.58 .

గుర్తుకు తెచ్చుకోండి మోడల్ ఫలితాన్ని అంచనా వేయగల మొత్తం. ఇంటి ఆట కోసం గుర్తు 0.57 మరియు దూరంగా ఆట కోసం 0.64 . F1 మరియు మద్దతు స్కోర్‌లు అంచనాల కోసం పరీక్షించిన డేటా మొత్తం. NBA డేటా-సెట్‌లో హోమ్ గేమ్ కోసం పరీక్షించిన డేటా 1662 మరియు దూరంగా ఆట కోసం 1586 .

గందరగోళం మాతృక:

జావా ఒక పద్ధతి నుండి బయటపడింది

గందరగోళ మాతృక అనేది అంచనా మోడల్ యొక్క పనితీరును వివరించే పట్టిక. గందరగోళ మాతృకలో వాస్తవ విలువలు మరియు values ​​హించిన విలువలు ఉన్నాయి. మోడల్ యొక్క ఖచ్చితత్వ స్కోర్‌ను లెక్కించడానికి మేము ఈ విలువలను ఉపయోగించవచ్చు.

గందరగోళం మాతృక హీట్ మ్యాప్:

సముద్రతీరం మరియు ఉపయోగించి గందరగోళ మాతృక యొక్క వేడి-మ్యాప్‌ను ప్లాట్ చేద్దాం మేము నిర్మించిన అంచనా నమూనాను దృశ్యమానం చేయడానికి. హీట్ మ్యాప్ ప్లాట్ చేయడానికి, కింది వాక్యనిర్మాణం అవసరం.

sns.heatmap (pd.DataFrame (confusion_matrix (y_test, అంచనాలు))) plt.show ()

హీట్ మ్యాప్ చూడటం ద్వారా, మేము ఈ క్రింది వాటిని ముగించవచ్చు:

  • అన్ని అంచనాలలో, వర్గీకరణ మొత్తం 1730 సార్లు అవును అని icted హించింది, వాటిలో 1012 వాస్తవమైనవి.
  • అన్ని అంచనాలలో, వర్గీకరణ మొత్తం 1518 సార్లు నో అంచనా వేసింది, వాటిలో 944 వాస్తవ సంఖ్య కాదు.

గందరగోళ మాతృక యొక్క ఈ విశ్లేషణతో మన ప్రిడిక్షన్ మోడల్ కోసం ఖచ్చితత్వ స్కోరును ముగించవచ్చు.

ఖచ్చితత్వం స్కోరు:

మోడల్ చేసిన అంచనాల యొక్క ఖచ్చితత్వం యొక్క శాతం ఖచ్చితత్వ స్కోరు. మా మోడల్ కోసం ఖచ్చితత్వం స్కోరు 0.60, ఇది చాలా ఖచ్చితమైనది. కానీ ఎక్కువ ఖచ్చితత్వ స్కోరు సమర్థవంతమైనది మీరు ప్రిడిక్షన్ మోడల్. మెరుగైన అంచనా మోడల్ కోసం మీరు ఎల్లప్పుడూ అధిక ఖచ్చితత్వ స్కోరును లక్ష్యంగా చేసుకోవాలి.

పైన చర్చించిన దశలను అనుసరించడం ద్వారా, మేము NBA డేటాసెట్‌ను ఉపయోగించి ఇంటి / దూర ఆట యొక్క అవకాశాన్ని అంచనా వేసాము. వర్గీకరణ నివేదికను విశ్లేషించిన తరువాత మేము ఇంటి / దూరంగా ఆట యొక్క అవకాశాన్ని can హించవచ్చు.

ఈ బ్లాగులో పైథాన్ భావనలలో లాజిస్టిక్ రిగ్రెషన్ గురించి చర్చించాము, ఇది సరళ విధానానికి ఎలా భిన్నంగా ఉంటుంది. అలాగే, మేము NBA డేటాసెట్ ఉపయోగించి ప్రదర్శనను కవర్ చేసాము. మరింత అంతర్దృష్టి మరియు అభ్యాసం కోసం, మీరు మీకు నచ్చిన డేటాసెట్‌ను ఉపయోగించవచ్చు మరియు పైథాన్‌లో లాజిస్టిక్ రిగ్రెషన్‌ను అమలు చేయడానికి చర్చించిన దశలను అనుసరించండి.

అలాగే, మీలోని డేటా సైంటిస్ట్‌లో నైపుణ్యం సాధించడానికి ఎడురేకా ప్లాట్‌ఫామ్‌లోని వివిధ డేటా-సైన్స్ బ్లాగులను తనిఖీ చేయండి.

మీరు పైథాన్ నేర్చుకోవాలనుకుంటే మరియు డేటా సైన్స్ లో వృత్తిని నిర్మించాలనుకుంటే, మా ఇంటరాక్టివ్, లైవ్-ఆన్‌లైన్ చూడండి ఇక్కడ, మీ అభ్యాస వ్యవధిలో మీకు మార్గనిర్దేశం చేయడానికి 24 * 7 మద్దతుతో వస్తుంది.
ప్రశ్న ఉందా? దయచేసి వ్యాఖ్యలలో పేర్కొనండి మరియు మేము మిమ్మల్ని సంప్రదిస్తాము.