యొక్క దృష్టి ఫలితాన్ని అంచనా వేయడానికి అల్గోరిథం ఉపయోగించి ఇన్పుట్ మరియు అవుట్పుట్ వేరియబుల్స్ చుట్టూ తిరుగుతుంది. కొత్త ఇన్పుట్ వేరియబుల్ చిత్రంలోకి వస్తే. లో లీనియర్ రిగ్రెషన్ అల్గోరిథం ఉత్తమ అంచనాలను పొందడానికి మ్యాపింగ్ ఫంక్షన్ను అంచనా వేయడానికి పర్యవేక్షించబడే అభ్యాస సాంకేతికత. ఈ వ్యాసంలో, యంత్ర అభ్యాసం కోసం లీనియర్ రిగ్రెషన్ గురించి నేర్చుకుంటాము. ఈ బ్లాగులో ఈ క్రింది విషయాలు చర్చించబడ్డాయి.
- రిగ్రెషన్ అంటే ఏమిటి?
- రిగ్రెషన్ రకాలు
- లీనియర్ రిగ్రెషన్ అంటే ఏమిటి?
- లీనియర్ రిగ్రెషన్ పరిభాష
- లీనియర్ రిగ్రెషన్ యొక్క ప్రయోజనాలు మరియు అప్రయోజనాలు
- లీనియర్ రిగ్రెషన్ యూజ్ కేసులు
- కేసును వాడండి - లీనియర్ రిగ్రెషన్ అమలు
రిగ్రెషన్ అంటే ఏమిటి?
రిగ్రెషన్ యొక్క ప్రధాన లక్ష్యం లక్షణ వేరియబుల్స్ సమూహం నుండి ఆధారిత లక్షణాలను అంచనా వేయడానికి సమర్థవంతమైన నమూనా నిర్మాణం. అవుట్పుట్ వేరియబుల్ నిజమైన లేదా నిరంతర విలువ అయినప్పుడు రిగ్రెషన్ సమస్య అంటే జీతం, బరువు, ప్రాంతం మొదలైనవి.
రిగ్రెషన్ను హౌసింగ్, ఇన్వెస్టింగ్ వంటి అనువర్తనాల్లో ఉపయోగించే గణాంక మార్గంగా కూడా మేము నిర్వచించవచ్చు. ఇది ఆధారిత వేరియబుల్ మరియు స్వతంత్ర చరరాశుల సమూహం మధ్య సంబంధాన్ని అంచనా వేయడానికి ఉపయోగించబడుతుంది. వివిధ రకాల రిగ్రెషన్ టెక్నిక్లను పరిశీలిద్దాం.
రిగ్రెషన్ రకాలు
కిందివి రిగ్రెషన్ రకాలు.
- సాధారణ లీనియర్ రిగ్రెషన్
- బహుపది రిగ్రెషన్
- వెక్టర్ రిగ్రెషన్కు మద్దతు ఇవ్వండి
- నిర్ణయం చెట్టు రిగ్రెషన్
- రాండమ్ ఫారెస్ట్ రిగ్రెషన్
సాధారణ లీనియర్ రిగ్రెషన్
అత్యంత ఆసక్తికరమైన మరియు సాధారణ రిగ్రెషన్ టెక్నిక్ ఒకటి సరళమైన లీనియర్ రిగ్రెషన్. దీనిలో, స్వతంత్ర చరరాశుల ఆధారంగా ఆధారిత వేరియబుల్ యొక్క ఫలితాన్ని మేము ict హిస్తాము, వేరియబుల్స్ మధ్య సంబంధం సరళంగా ఉంటుంది. అందువల్ల, లీనియర్ రిగ్రెషన్ అనే పదం.
బహుపది రిగ్రెషన్
ఈ రిగ్రెషన్ టెక్నిక్లో, మేము అసలు లక్షణాలను ఇచ్చిన డిగ్రీ యొక్క బహుపది లక్షణాలుగా మారుస్తాము మరియు దానిపై రిగ్రెషన్ చేస్తాము.
వెక్టర్ రిగ్రెషన్కు మద్దతు ఇవ్వండి
కోసం రిగ్రెషన్ లేదా SVR, గరిష్ట మార్జిన్తో హైపర్ప్లేన్ను మేము గుర్తించాము, అంటే గరిష్ట సంఖ్యలో డేటా పాయింట్లు ఆ మార్జిన్లలో ఉంటాయి. ఇది సపోర్ట్ వెక్టర్ మెషిన్ వర్గీకరణ అల్గోరిథంకు చాలా పోలి ఉంటుంది.
నిర్ణయం చెట్టు రిగ్రెషన్
TO రిగ్రెషన్ మరియు రెండింటికీ ఉపయోగించవచ్చు . రిగ్రెషన్ విషయంలో, ప్రామాణిక విచలనాన్ని తగ్గించడం ద్వారా విభజన నోడ్ను గుర్తించడానికి మేము ID3 అల్గోరిథం (ఇటరేటివ్ డైకోటోమైజర్ 3) ను ఉపయోగిస్తాము.
రాండమ్ ఫారెస్ట్ రిగ్రెషన్
యాదృచ్ఛిక అటవీ రిగ్రెషన్లో, మేము అనేక నిర్ణయం చెట్టు రిగ్రెషన్ల అంచనాలను సమిష్టి చేస్తాము. వివిధ రకాల రిగ్రెషన్ గురించి ఇప్పుడు మనకు తెలుసు, సరళమైన సరళ రిగ్రెషన్ గురించి వివరంగా చూద్దాం.
లీనియర్ రిగ్రెషన్ అంటే ఏమిటి?
సింపుల్ లీనియర్ రిగ్రెషన్ అనేది రిగ్రెషన్ టెక్నిక్, దీనిలో స్వతంత్ర వేరియబుల్ డిపెండెంట్ వేరియబుల్తో సరళ సంబంధాన్ని కలిగి ఉంటుంది. రేఖాచిత్రంలోని సరళ రేఖ ఉత్తమమైన అమరిక రేఖ. సరళమైన లీనియర్ రిగ్రెషన్ యొక్క ప్రధాన లక్ష్యం, ఇచ్చిన డేటా పాయింట్లను పరిగణనలోకి తీసుకోవడం మరియు మోడల్ను సాధ్యమైనంత ఉత్తమంగా సరిపోయేలా ఉత్తమమైన ఫిట్ లైన్ను ప్లాట్ చేయడం.
లీనియర్ రిగ్రెషన్ అల్గోరిథం ఎలా పనిచేస్తుందో వెళ్లేముందు, సాధారణ సరళ రిగ్రెషన్లోని కొన్ని ముఖ్యమైన పరిభాషలను పరిశీలిద్దాం.
లీనియర్ రిగ్రెషన్ పరిభాష
లీనియర్ రిగ్రెషన్ అల్గోరిథంకు వెళ్ళే ముందు ఈ క్రింది పరిభాషలు తెలుసుకోవడం ముఖ్యం.
ఖర్చు ఫంక్షన్
ఉత్తమ ఫిట్ లైన్ క్రింద ఇవ్వబడిన సరళ సమీకరణం ఆధారంగా ఉంటుంది.
- అంచనా వేయవలసిన డిపెండెంట్ వేరియబుల్ Y చే సూచించబడుతుంది.
- Y- అక్షాన్ని తాకిన ఒక పంక్తి అంతరాయం ద్వారా సూచించబడుతుంది b0.
- బిఒకటిరేఖ యొక్క వాలు, x Y యొక్క అంచనాను నిర్ణయించే స్వతంత్ర చరరాశులను సూచిస్తుంది.
- ఫలిత అంచనాలో లోపం e చే సూచించబడుతుంది.
ఖర్చు ఫంక్షన్ b కోసం సాధ్యమైనంత ఉత్తమమైన విలువలను అందిస్తుంది0మరియు బిఒకటిడేటా పాయింట్ల కోసం ఉత్తమమైన ఫిట్ లైన్ చేయడానికి. B కోసం ఉత్తమ విలువలను పొందడానికి ఈ సమస్యను కనిష్టీకరణ సమస్యగా మార్చడం ద్వారా మేము దీన్ని చేస్తాము0మరియు బిఒకటి. అసలు విలువ మరియు value హించిన విలువ మధ్య ఈ సమస్యలో లోపం తగ్గించబడుతుంది.
లోపాన్ని తగ్గించడానికి పై ఫంక్షన్ను ఎంచుకుంటాము. మేము లోపం వ్యత్యాసాన్ని చతురస్రం చేస్తాము మరియు అన్ని డేటా పాయింట్ల మీద లోపం సంకలనం చేస్తాము, మొత్తం డేటా పాయింట్ల మధ్య విభజన. అప్పుడు, ఉత్పత్తి చేసిన విలువ అన్ని డేటా పాయింట్ల కంటే సగటు చదరపు లోపాన్ని అందిస్తుంది.
దీనిని MSE (మీన్ స్క్వేర్డ్ ఎర్రర్) అని కూడా పిలుస్తారు మరియు మేము b యొక్క విలువలను మారుస్తాము0మరియు బిఒకటితద్వారా MSE విలువ కనిష్టంగా పరిష్కరించబడుతుంది.
ప్రవణత సంతతి
లీనియర్ రిగ్రెషన్ అర్థం చేసుకోవడానికి తదుపరి ముఖ్యమైన పరిభాష ప్రవణత సంతతి. ఇది నవీకరించే పద్ధతి b0మరియు బిఒకటిMSE ని తగ్గించడానికి విలువలు. దీని వెనుక ఉన్న ఆలోచన ఏమిటంటే b0మరియు బిఒకటిమేము MSE ని కనిష్టానికి తగ్గించే వరకు విలువలు.
నవీకరించడానికి b0మరియు బిఒకటి, మేము ఖర్చు ఫంక్షన్ నుండి ప్రవణతలు తీసుకుంటాము. ఈ ప్రవణతలను కనుగొనడానికి, మేము b కి సంబంధించి పాక్షిక ఉత్పన్నాలను తీసుకుంటాము0మరియు బిఒకటి. ఈ పాక్షిక ఉత్పన్నాలు ప్రవణతలు మరియు b యొక్క విలువలను నవీకరించడానికి ఉపయోగిస్తారు0మరియు బిఒకటి.
ఒక చిన్న అభ్యాస రేటు కనిష్టానికి దగ్గరగా ఉంటుంది, అయితే దీనికి ఎక్కువ సమయం పడుతుంది మరియు పెద్ద అభ్యాస రేటు విషయంలో. తీసుకున్న సమయం త్వరగా కానీ కనీస విలువను అధిగమించే అవకాశం ఉంది. ఇప్పుడు మేము లీనియర్ రిగ్రెషన్లోని పరిభాషలతో ఉన్నాము, యంత్ర అభ్యాసం కోసం లీనియర్ రిగ్రెషన్ యొక్క కొన్ని ప్రయోజనాలు మరియు అప్రయోజనాలను పరిశీలిద్దాం.
ప్రయోజనాలు మరియు అప్రయోజనాలు
ప్రయోజనాలు | ప్రతికూలతలు |
సరళంగా వేరు చేయగల డేటా కోసం లీనియర్ రిగ్రెషన్ అనూహ్యంగా బాగా పనిచేస్తుంది | ఆధారిత మరియు స్వతంత్ర చరరాశుల మధ్య సరళత యొక్క umption హ |
అమలు చేయడానికి, అర్థం చేసుకోవడానికి మరియు శిక్షణ ఇవ్వడానికి సమర్థవంతంగా | ఇది తరచుగా శబ్దం మరియు అతిగా సరిపోయే అవకాశం ఉంది |
డైమెన్షనల్ రిడక్షన్ టెక్నిక్స్, రెగ్యులరైజేషన్ మరియు క్రాస్ ధ్రువీకరణ ఉపయోగించి ఇది ఓవర్ ఫిటింగ్ ను చక్కగా నిర్వహిస్తుంది | లీనియర్ రిగ్రెషన్ అవుట్లైయర్లకు చాలా సున్నితంగా ఉంటుంది |
ఒక నిర్దిష్ట డేటా సమితికి మించిన ఎక్స్ట్రాపోలేషన్ మరో ప్రయోజనం | ఇది మల్టీకాలినియారిటీకి గురవుతుంది |
లీనియర్ రిగ్రెషన్ యూజ్ కేసులు
అమ్మకాల సూచన
ప్రమాద విశ్లేషణ
హౌసింగ్ అప్లికేషన్స్ ధరలు మరియు ఇతర అంశాలను అంచనా వేయడానికి
స్టాక్ ధరలు, పెట్టుబడి మూల్యాంకనం మొదలైనవాటిని అంచనా వేయడానికి ఆర్థిక అనువర్తనాలు.
సరళ రిగ్రెషన్ వెనుక ఉన్న ప్రాథమిక ఆలోచన ఏమిటంటే, ఆధారిత మరియు స్వతంత్ర చరరాశుల మధ్య సంబంధాన్ని కనుగొనడం. ఇది తక్కువ లోపంతో ఫలితాన్ని అంచనా వేసే ఉత్తమమైన యుక్తమైన పంక్తిని పొందడానికి ఉపయోగించబడుతుంది. అధ్యయనం యొక్క గంటలు మరియు ఇతర నిర్ణయాత్మక కారకాలకు సంబంధించి SAT స్కోర్లను అంచనా వేయడం వంటి సాధారణ నిజ జీవిత పరిస్థితులలో మేము సరళ రిగ్రెషన్ను ఉపయోగించవచ్చు.
దీన్ని దృష్టిలో పెట్టుకుని, వినియోగ కేసును పరిశీలిద్దాం.
కేస్ ఉపయోగించండి - లీనియర్ రిగ్రెషన్ అమలు
ఈ ప్రక్రియ క్రింది దశల్లో జరుగుతుంది:
- డేటాను లోడ్ చేస్తోంది
- డేటాను అన్వేషించడం
- డేటాను ముక్కలు చేయడం
- రైలు మరియు స్ప్లిట్ డేటా
- మోడల్ను రూపొందించండి
- మూల్యాంకనం ఖచ్చితత్వం
లీనియర్ రిగ్రెషన్ అమలు చేయడానికి ప్రతి దశల వివరాలను తెలుసుకుందాం.
1. డేటాను లోడ్ చేస్తోంది
సరళ రిగ్రెషన్తో మా ప్రయాణాన్ని ప్రారంభించడానికి స్క్లెయర్న్ (స్కికిట్-లెర్న్) డేటా సెట్స్ మాడ్యూల్లో ఇప్పటికే ఉన్న ప్రాథమిక డయాబెటిస్ డేటా సెట్తో మనం ప్రారంభించవచ్చు.
sklearn దిగుమతి డేటాసెట్ల వ్యాధి = datasets.load_diabetes () ముద్రణ (వ్యాధి)
అవుట్పుట్:
సి ++ సోర్స్ కోడ్ను విలీనం చేయండి
2. డేటాను అన్వేషించడం
మేము డేటాను లోడ్ చేసిన తర్వాత, కింది కోడ్ను ఉపయోగించడం ద్వారా లేబుల్లను తనిఖీ చేయడం ద్వారా అన్వేషించడం ప్రారంభించవచ్చు.
ముద్రణ (disease.keys ())
అవుట్పుట్:
పై కోడ్ డేటా సెట్ నుండి అన్ని లేబుళ్ళను ఇస్తుంది, దీని తరువాత, మేము డేటాను స్లైస్ చేయవచ్చు, తద్వారా చివరికి లైన్ను ప్లాట్ చేయవచ్చు. మేము అన్ని డేటా పాయింట్లను కూడా ఉపయోగిస్తాము, ప్రస్తుతానికి, మేము డేటా నుండి కాలమ్ 2 ను ముక్కలు చేస్తాము.
nmp disease_X = disease.data [:, np.newaxis, 2] ముద్రణ (వ్యాధి_ఎక్స్)
అవుట్పుట్:
ఈ దశ తరువాత, మేము డేటాను రైలు మరియు పరీక్షా సమితిగా విభజిస్తాము.
3. డేటాను విభజించడం
disease_X_train = disease_X [: - 30] disease_X_test = disease_X [-20:] disease_Y_train = disease.target [: - 30] disease_Y_test = disease.target [-20:]
తరువాతి భాగంలో మోడల్ను రూపొందించడం ఉంటుంది, ఇందులో స్క్లెర్న్ నుండి లీనియర్_మోడల్ను దిగుమతి చేస్తుంది.
4. మోడల్ను రూపొందించడం
sklearn దిగుమతి లీనియర్_మోడల్ reg = లీనియర్_మోడల్. లీనియర్ రిగ్రెషన్ () reg.fit (వ్యాధి_ఎక్స్_ట్రెయిన్, వ్యాధి_వై_ట్రెయిన్) y_predict = reg.predict (disease_X_test)
మోడల్ యొక్క ఖచ్చితత్వాన్ని అంచనా వేయడానికి, మేము స్కికిట్-లెర్న్ నుండి సగటు స్క్వేర్డ్ లోపాన్ని ఉపయోగిస్తాము.
5. మూల్యాంకనం
ఖచ్చితత్వం = సగటు_ స్క్వేర్డ్_రర్ర్ (వ్యాధి_వై_టెస్ట్, వై_ప్రెడిక్ట్,) ప్రింట్ (ఖచ్చితత్వం) బరువులు = reg.coef_ intercept = reg.intercept_ print (బరువులు, అంతరాయం)
అవుట్పుట్:
గ్రాఫ్లో డేటా పాయింట్లు ఎలా ఉంటాయనే దానిపై మరింత స్పష్టంగా తెలుసుకోవడానికి, గ్రాఫ్లను కూడా ప్లాట్ చేద్దాం.
matplotlib.pyplot ను plt plt.scatter (disease_X_test, disease_Y_test) plt.plot (disease_X_test, y_predict) plt.show () గా దిగుమతి చేయండి.
అవుట్పుట్:
ఈ దృష్టాంతంలో మరింత ఖచ్చితమైన మోడల్ను పొందడానికి, మేము కేవలం 2 నిలువు వరుసకు బదులుగా మొత్తం డేటాను ఉపయోగించవచ్చు. ఇది క్రింద చూపిన విధంగా ఖచ్చితత్వాన్ని ఇస్తుంది:
# పై కోడ్లో కొద్దిగా మార్పు చేయండి మరియు లోపాలను నివారించడానికి ప్లాటింగ్ కోడ్ను తొలగించండి disease_X = disease.data
అవుట్పుట్:
యంత్ర అభ్యాసం కోసం లీనియర్ రిగ్రెషన్ గురించి మేము నేర్చుకున్న ఈ వ్యాసం చివరకి ఇది మనలను తీసుకువస్తుంది. ఈ ట్యుటోరియల్లో మీతో పంచుకున్న అన్ని విషయాలతో మీరు స్పష్టంగా ఉన్నారని నేను ఆశిస్తున్నాను.
“మెషిన్ లెర్నింగ్ కోసం లీనియర్ రిగ్రెషన్” పై మీరు ఈ కథనాన్ని కనుగొంటే, చూడండి ప్రపంచవ్యాప్తంగా 250,000 కంటే ఎక్కువ సంతృప్తికరమైన అభ్యాసకుల నెట్వర్క్తో విశ్వసనీయ ఆన్లైన్ లెర్నింగ్ సంస్థ.
మీకు ఏవైనా ప్రశ్నలు వస్తే, “మెషిన్ లెర్నింగ్ కోసం లీనియర్ రిగ్రెషన్” యొక్క వ్యాఖ్యల విభాగంలో మీ ప్రశ్నలన్నింటినీ అడగడానికి సంకోచించకండి మరియు మా బృందం సమాధానం ఇవ్వడానికి సంతోషిస్తుంది.