పైథాన్లో లాజిస్టిక్ రిగ్రెషన్ ఒక ప్రిడిక్టివ్ ఎనాలిసిస్ టెక్నిక్. ఇది బైనరీ వర్గీకరణ సమస్యలకు మెషిన్ లెర్నింగ్లో కూడా ఉపయోగించబడుతుంది. పైథాన్లో లాజిస్టిక్ రిగ్రెషన్ను అర్థం చేసుకోవడానికి ఈ బ్లాగులో మేము ఈ క్రింది విషయాల ద్వారా వెళ్తాము:
- రిగ్రెషన్ అంటే ఏమిటి?
- పైథాన్లో లాజిస్టిక్ రిగ్రెషన్
- లాజిస్టిక్ రిగ్రెషన్ vs లీనియర్ రిగ్రెషన్
- కేసులు వాడండి
- ప్రదర్శన
పైథాన్లో లాజిస్టిక్ రిగ్రెషన్పై ఈ వివరణాత్మక ట్యుటోరియల్ను మీరు మంచి అవగాహన కోసం ప్రదర్శనతో సూచించవచ్చు లేదా దీని ద్వారా వెళ్ళవచ్చు లాజిస్టిక్ రిగ్రెషన్ మాస్టర్ చేయడానికి.
రిగ్రెషన్ అంటే ఏమిటి?
విశ్లేషణ ఒక శక్తివంతమైన గణాంక విశ్లేషణ సాంకేతికత. జ ఆధారపడి ఉంటుంది మా ఆసక్తి యొక్క వేరియబుల్ ఇతర విలువలను అంచనా వేయడానికి ఉపయోగించబడుతుంది స్వతంత్ర చరరాశులు డేటా-సెట్లో.
మేము అన్ని సమయాలలో ఒక సహజమైన రీతిలో రిగ్రెషన్ను చూస్తాము. గతంలో వాతావరణ పరిస్థితుల యొక్క డేటా-సెట్ను ఉపయోగించి వాతావరణాన్ని అంచనా వేయడం వంటిది.
ఫలితాన్ని విశ్లేషించడానికి మరియు అంచనా వేయడానికి ఇది చాలా పద్ధతులను ఉపయోగిస్తుంది, కాని ప్రధానంగా ప్రాధాన్యత ఇవ్వబడుతుంది డిపెండెంట్ వేరియబుల్ మరియు ఒకటి లేదా అంతకంటే ఎక్కువ స్వతంత్ర వేరియబుల్ మధ్య సంబంధం.
విశ్లేషణ బైనరీ వేరియబుల్లో ఫలితాన్ని అంచనా వేస్తుంది, ఇది కేవలం రెండు ఫలితాలను మాత్రమే కలిగి ఉంటుంది.
పైథాన్లో లాజిస్టిక్ రిగ్రెషన్
బైనరీ వేరియబుల్లో ఫలితాన్ని అంచనా వేయడానికి ఆధారిత వేరియబుల్ మరియు ఒకటి లేదా అంతకంటే ఎక్కువ స్వతంత్ర చరరాశులను కలిగి ఉన్న డేటా-సెట్ను విశ్లేషించడానికి ఇది ఒక సాంకేతికత, అంటే దీనికి రెండు ఫలితాలు మాత్రమే ఉంటాయి.
ఆధారిత వేరియబుల్ వర్గీకరణ ప్రకృతి లో. డిపెండెంట్ వేరియబుల్ అని కూడా పిలుస్తారు లక్ష్య వేరియబుల్ మరియు స్వతంత్ర చరరాశులను అంటారు ict హాజనిత .
లాజిస్టిక్ రిగ్రెషన్ అనేది లీనియర్ రిగ్రెషన్ యొక్క ప్రత్యేక సందర్భం, ఇక్కడ మేము వర్గీకరణ వేరియబుల్లో మాత్రమే ఫలితాన్ని అంచనా వేస్తాము. ఇది లాగ్ ఫంక్షన్ను ఉపయోగించి ఈవెంట్ యొక్క సంభావ్యతను ts హించింది.
మేము ఉపయోగిస్తాము సిగ్మోయిడ్ ఫంక్షన్ / కర్వ్ వర్గీకరణ విలువను అంచనా వేయడానికి. ప్రవేశ విలువ ఫలితాన్ని నిర్ణయిస్తుంది (గెలుపు / ఓటమి).
లీనియర్ రిగ్రెషన్ సమీకరణం: y = β0 + X1X1 + X2X2…. + XnXn
- Y అంటే అంచనా వేయవలసిన డిపెండెంట్ వేరియబుల్.
- β0 అనేది Y- అంతరాయం, ఇది ప్రాథమికంగా y- అక్షాన్ని తాకిన రేఖలోని బిందువు.
- β1 అనేది రేఖ యొక్క వాలు (ఆధారిత వేరియబుల్ మరియు స్వతంత్ర వేరియబుల్ మధ్య సంబంధాన్ని బట్టి వాలు ప్రతికూలంగా లేదా సానుకూలంగా ఉంటుంది.)
- X ఇక్కడ మా ఫలిత ఆధారిత విలువను అంచనా వేయడానికి ఉపయోగించే స్వతంత్ర చరరాశిని సూచిస్తుంది.
సిగ్మోయిడ్ ఫంక్షన్: p = 1/1 + ఇ-వై
లీనియర్ రిగ్రెషన్ సమీకరణంలో సిగ్మోయిడ్ ఫంక్షన్ను వర్తించండి.
లాజిస్టిక్ రిగ్రెషన్ సమీకరణం: p = 1/1 + ఇ- (β0 + X1X1 + X2X2…. + XnXn)
వివిధ రకాల లాజిస్టిక్ రిగ్రెషన్ను చూద్దాం.
లాజిస్టిక్ రిగ్రెషన్ రకాలు
t sql తేదీ డేటా రకం
- బైనరీ లాజిస్టిక్ రిగ్రెషన్ - ఇది రెండు సాధ్యం ఫలితాలను మాత్రమే కలిగి ఉంది. ఉదాహరణ- అవును లేదా కాదు
- మల్టీనోమియల్ లాజిస్టిక్ రిగ్రెషన్ - ఇది మూడు లేదా అంతకంటే ఎక్కువ నామమాత్రపు వర్గాలను కలిగి ఉంది. ఉదాహరణ- పిల్లి, కుక్క, ఏనుగు.
- ఆర్డినల్ లాజిస్టిక్ రిగ్రెషన్- ఇది మూడు లేదా అంతకంటే ఎక్కువ ఆర్డినల్ వర్గాలను కలిగి ఉంది, ఆర్డినల్ అంటే కేతగిరీలు ఒక క్రమంలో ఉంటాయి. ఉదాహరణ- వినియోగదారు రేటింగ్లు (1-5).
లీనియర్ Vs లాజిస్టిక్ రిగ్రెషన్
లీనియర్ రిగ్రెషన్ కలిగి ఉంటుంది అనంతమైన సాధ్యం విలువలు, లాజిస్టిక్ రిగ్రెషన్ ఉంది ఖచ్చితమైన ఫలితాలు .
ప్రతిస్పందన వేరియబుల్ ప్రకృతిలో నిరంతరాయంగా ఉన్నప్పుడు లీనియర్ రిగ్రెషన్ ఉపయోగించబడుతుంది, అయితే ప్రతిస్పందన వేరియబుల్ ప్రకృతిలో వర్గీకరించబడినప్పుడు లాజిస్టిక్ రిగ్రెషన్ ఉపయోగించబడుతుంది.
గతంలో లావాదేవీ వివరాలను ఉపయోగించి బ్యాంకులో డిఫాల్టర్ను ting హించడం లాజిస్టిక్ రిగ్రెషన్కు ఉదాహరణ, స్టాక్ మార్కెట్ స్కోరు వంటి నిరంతర ఉత్పత్తి సరళ రిగ్రెషన్కు ఉదాహరణ.
కేసులు వాడండి
మేము లాజిస్టిక్ రిగ్రెషన్ను ఉపయోగించగల ఉపయోగ సందర్భాలు క్రిందివి.
వాతావరణ అంచనా
వాతావరణ అంచనాలు తార్కిక తిరోగమనం యొక్క ఫలితం. ఇక్కడ, మేము మునుపటి వాతావరణ నివేదికల డేటాను విశ్లేషిస్తాము మరియు ఒక నిర్దిష్ట రోజుకు సాధ్యమయ్యే ఫలితాన్ని అంచనా వేస్తాము. కానీ లాజికల్ రిగ్రెషన్ వర్షం పడుతుందో లేదో వంటి వర్గీకరణ డేటాను మాత్రమే అంచనా వేస్తుంది.
అనారోగ్యాన్ని నిర్ణయించడం
మేము చేయవచ్చువా డుఅనారోగ్యం ఏ సందర్భంలోనైనా సానుకూలంగా లేదా ప్రతికూలంగా ఉందో అంచనా వేయడానికి రోగి యొక్క వైద్య చరిత్ర సహాయంతో తార్కిక రిగ్రెషన్.
లాజిస్టిక్ రిగ్రెషన్ ఉపయోగించి ప్రిడిక్షన్ మోడల్ను రూపొందించడానికి నమూనా డేటా-సెట్ను తీసుకుందాం.
డెమో
మేము ప్రిడిక్షన్ మోడల్ను నిర్మించబోతున్నాంఉపయోగించిసహాయంతో పైథాన్లో లాజికల్ రిగ్రెషన్యొక్కడేటాసెట్,ఇందులోతార్కిక రిగ్రెషన్ సాధించడానికి మేము ఈ క్రింది దశలను కవర్ చేయబోతున్నాము.
డేటాను సేకరిస్తోంది
లాజిస్టిక్ రిగ్రెషన్ అమలు చేయడానికి మొదటి దశ డేటాను సేకరించడం. డేటా-సెట్ ఉన్న csv ఫైల్ను పాండాలను ఉపయోగించి ప్రోగ్రామ్లలోకి లోడ్ చేస్తాము. సంబంధిత డేటా మధ్య సంబంధాన్ని విశ్లేషించడం ద్వారా ఇంటి ఆట లేదా దూర ఆట యొక్క అవకాశాన్ని అంచనా వేయడానికి అంచనా నమూనాను రూపొందించడానికి మేము NBA డేటాను ఉపయోగిస్తున్నాము.
పాండాలను పిడిగా దిగుమతి చేసుకోండి
సులభమైన విశ్లేషణ కోసం మీరు మొత్తం డేటాను చదవగలిగే ఆకృతిలోకి పొందుతారు. ఆపై మీరు మీ మోడల్ కోసం ఆధారిత మరియు స్వతంత్ర చరరాశులను నిర్ణయించవచ్చు.
డేటాను విశ్లేషిస్తోంది
వేరియబుల్స్ మధ్య సంబంధాన్ని నిర్ణయించడానికి డేటా-సెట్ విశ్లేషించబడుతుంది. వేరియబుల్స్ మధ్య సంబంధాన్ని తనిఖీ చేయడానికి వేర్వేరు ప్లాట్లను సృష్టించడం ద్వారా.
sns.countplot ('హోమ్', రంగు = 'WINorLOSS', డేటా = df) plt.show ()
పైన ఉన్నది ఇంటి / దూరపు ఆటకు సంబంధించి గెలుపు / ఓడిపోయిన శాతం మధ్య సంబంధం. ఎస్సమానంగామేము డేటాలోని ఇతర సంబంధిత ఎంట్రీల మధ్య సంబంధం యొక్క గ్రాఫ్ను ప్లాట్ చేయవచ్చు.
డేటా రాంగ్లింగ్
లక్ష్య-వేరియబుల్ ప్రకారం డేటా-సెట్ సవరించబడుతుంది. మేము డేటాఫ్రేమ్ నుండి అన్ని శూన్య విలువలు మరియు స్ట్రింగ్ విలువలను తొలగిస్తాము.
ముద్రణ (df.isnull (). మొత్తం ())
ప్రిడిక్షన్ మోడల్ను నిర్మించేటప్పుడు అవసరం లేని శూన్య విలువలు మరియు విలువలు వంటి అన్ని అసంబద్ధమైన డేటాను మేము తనిఖీ చేస్తాము. మేము ఉపయోగిస్తున్న NBA డేటాసెట్లో శూన్య విలువలు లేకపోతే, మేము డేటాను విభజించడంతో ముందుకు వెళ్తాము.
పరీక్ష మరియు రైలు డేటా
మోడల్ పనితీరు కోసం డేటా పరీక్ష డేటా మరియు రైలు డేటాగా విభజించబడింది. ఉపయోగించి డేటాను విభజించారు రైలు_టెస్ట్_స్ప్లిట్ . ఇక్కడ డేటా 70:30 నిష్పత్తిలో విభజించబడింది.
ఇప్పుడు, కోసం మోడల్ ప్రిడిక్షన్ లాజిస్టిక్ రిగ్రెషన్ ఫంక్షన్ స్క్లీర్న్ మాడ్యూల్లో లాజిస్టిక్ రిగ్రెషన్ మోడల్ను దిగుమతి చేయడం ద్వారా అమలు చేయబడుతుంది.
మోడల్ అప్పుడు ఫిట్ ఫంక్షన్ ఉపయోగించి రైలు సెట్లో సరిపోతుంది. దీని తరువాత ప్రిడిక్షన్ ఫంక్షన్ ఉపయోగించి ప్రిడిక్షన్ జరుగుతుంది.
sklearn.model_selection దిగుమతి రైలు_టెస్ట్_స్ప్లిట్ నుండి sklearn.linear_model దిగుమతి sklearn.metrics నుండి లాజిస్టిక్ రిగ్రెషన్ sklearn.metrics దిగుమతి వర్గీకరణ_ sklearn నుండి రిపోర్ట్ చేయండి. x_test, y_train, y_test = train_test_split (x, y, test_size = 0.33, random_state = 1) logmodel = LogisticRegress () logmodel.fit (x_train, y_train) అంచనాలు = logmodel.predict (x_test) ప్రింట్ (వర్గీకరణ_ నివేదిక) ముద్రణ (గందరగోళం_మాట్రిక్స్ (y_test, అంచనాలు)) ముద్రణ (ఖచ్చితత్వం_ స్కోర్ (y_test, అంచనాలు))
వర్గీకరణ నివేదిక:
వర్గీకరణ నివేదిక ప్రదర్శిస్తుంది ప్రెసిషన్ , రీకాల్, ఎఫ్ 1 మరియు సపోర్ట్ మోడల్ కోసం స్కోర్లు.
ప్రెసిషన్ స్కోరు అంటే మోడల్ చేసిన అంచనా ఖచ్చితమైనది. ఇంటి ఆట యొక్క ఖచ్చితత్వం 0.62 మరియు దూరంగా ఆట కోసం 0.58 .
గుర్తుకు తెచ్చుకోండి మోడల్ ఫలితాన్ని అంచనా వేయగల మొత్తం. ఇంటి ఆట కోసం గుర్తు 0.57 మరియు దూరంగా ఆట కోసం 0.64 . F1 మరియు మద్దతు స్కోర్లు అంచనాల కోసం పరీక్షించిన డేటా మొత్తం. NBA డేటా-సెట్లో హోమ్ గేమ్ కోసం పరీక్షించిన డేటా 1662 మరియు దూరంగా ఆట కోసం 1586 .
గందరగోళం మాతృక:
జావా ఒక పద్ధతి నుండి బయటపడింది
గందరగోళ మాతృక అనేది అంచనా మోడల్ యొక్క పనితీరును వివరించే పట్టిక. గందరగోళ మాతృకలో వాస్తవ విలువలు మరియు values హించిన విలువలు ఉన్నాయి. మోడల్ యొక్క ఖచ్చితత్వ స్కోర్ను లెక్కించడానికి మేము ఈ విలువలను ఉపయోగించవచ్చు.
గందరగోళం మాతృక హీట్ మ్యాప్:
సముద్రతీరం మరియు ఉపయోగించి గందరగోళ మాతృక యొక్క వేడి-మ్యాప్ను ప్లాట్ చేద్దాం మేము నిర్మించిన అంచనా నమూనాను దృశ్యమానం చేయడానికి. హీట్ మ్యాప్ ప్లాట్ చేయడానికి, కింది వాక్యనిర్మాణం అవసరం.
sns.heatmap (pd.DataFrame (confusion_matrix (y_test, అంచనాలు))) plt.show ()
హీట్ మ్యాప్ చూడటం ద్వారా, మేము ఈ క్రింది వాటిని ముగించవచ్చు:
- అన్ని అంచనాలలో, వర్గీకరణ మొత్తం 1730 సార్లు అవును అని icted హించింది, వాటిలో 1012 వాస్తవమైనవి.
- అన్ని అంచనాలలో, వర్గీకరణ మొత్తం 1518 సార్లు నో అంచనా వేసింది, వాటిలో 944 వాస్తవ సంఖ్య కాదు.
గందరగోళ మాతృక యొక్క ఈ విశ్లేషణతో మన ప్రిడిక్షన్ మోడల్ కోసం ఖచ్చితత్వ స్కోరును ముగించవచ్చు.
ఖచ్చితత్వం స్కోరు:
మోడల్ చేసిన అంచనాల యొక్క ఖచ్చితత్వం యొక్క శాతం ఖచ్చితత్వ స్కోరు. మా మోడల్ కోసం ఖచ్చితత్వం స్కోరు 0.60, ఇది చాలా ఖచ్చితమైనది. కానీ ఎక్కువ ఖచ్చితత్వ స్కోరు సమర్థవంతమైనది మీరు ప్రిడిక్షన్ మోడల్. మెరుగైన అంచనా మోడల్ కోసం మీరు ఎల్లప్పుడూ అధిక ఖచ్చితత్వ స్కోరును లక్ష్యంగా చేసుకోవాలి.
పైన చర్చించిన దశలను అనుసరించడం ద్వారా, మేము NBA డేటాసెట్ను ఉపయోగించి ఇంటి / దూర ఆట యొక్క అవకాశాన్ని అంచనా వేసాము. వర్గీకరణ నివేదికను విశ్లేషించిన తరువాత మేము ఇంటి / దూరంగా ఆట యొక్క అవకాశాన్ని can హించవచ్చు.
ఈ బ్లాగులో పైథాన్ భావనలలో లాజిస్టిక్ రిగ్రెషన్ గురించి చర్చించాము, ఇది సరళ విధానానికి ఎలా భిన్నంగా ఉంటుంది. అలాగే, మేము NBA డేటాసెట్ ఉపయోగించి ప్రదర్శనను కవర్ చేసాము. మరింత అంతర్దృష్టి మరియు అభ్యాసం కోసం, మీరు మీకు నచ్చిన డేటాసెట్ను ఉపయోగించవచ్చు మరియు పైథాన్లో లాజిస్టిక్ రిగ్రెషన్ను అమలు చేయడానికి చర్చించిన దశలను అనుసరించండి.
అలాగే, మీలోని డేటా సైంటిస్ట్లో నైపుణ్యం సాధించడానికి ఎడురేకా ప్లాట్ఫామ్లోని వివిధ డేటా-సైన్స్ బ్లాగులను తనిఖీ చేయండి.
మీరు పైథాన్ నేర్చుకోవాలనుకుంటే మరియు డేటా సైన్స్ లో వృత్తిని నిర్మించాలనుకుంటే, మా ఇంటరాక్టివ్, లైవ్-ఆన్లైన్ చూడండి ఇక్కడ, మీ అభ్యాస వ్యవధిలో మీకు మార్గనిర్దేశం చేయడానికి 24 * 7 మద్దతుతో వస్తుంది.
ప్రశ్న ఉందా? దయచేసి వ్యాఖ్యలలో పేర్కొనండి మరియు మేము మిమ్మల్ని సంప్రదిస్తాము.