యంత్ర అభ్యాసం కోసం లీనియర్ రిగ్రెషన్‌ను ఎలా అమలు చేయాలి?



ఈ వ్యాసం వివిధ పరిభాషలతో యంత్ర అభ్యాసం కోసం లీనియర్ రిగ్రెషన్ భావనను మరియు లీనియర్ రిగ్రెషన్‌ను అమలు చేయడానికి ఉపయోగ కేసును వివరిస్తుంది.

యొక్క దృష్టి ఫలితాన్ని అంచనా వేయడానికి అల్గోరిథం ఉపయోగించి ఇన్పుట్ మరియు అవుట్పుట్ వేరియబుల్స్ చుట్టూ తిరుగుతుంది. కొత్త ఇన్పుట్ వేరియబుల్ చిత్రంలోకి వస్తే. లో లీనియర్ రిగ్రెషన్ అల్గోరిథం ఉత్తమ అంచనాలను పొందడానికి మ్యాపింగ్ ఫంక్షన్‌ను అంచనా వేయడానికి పర్యవేక్షించబడే అభ్యాస సాంకేతికత. ఈ వ్యాసంలో, యంత్ర అభ్యాసం కోసం లీనియర్ రిగ్రెషన్ గురించి నేర్చుకుంటాము. ఈ బ్లాగులో ఈ క్రింది విషయాలు చర్చించబడ్డాయి.

రిగ్రెషన్ అంటే ఏమిటి?

రిగ్రెషన్ యొక్క ప్రధాన లక్ష్యం లక్షణ వేరియబుల్స్ సమూహం నుండి ఆధారిత లక్షణాలను అంచనా వేయడానికి సమర్థవంతమైన నమూనా నిర్మాణం. అవుట్పుట్ వేరియబుల్ నిజమైన లేదా నిరంతర విలువ అయినప్పుడు రిగ్రెషన్ సమస్య అంటే జీతం, బరువు, ప్రాంతం మొదలైనవి.





రిగ్రెషన్‌ను హౌసింగ్, ఇన్వెస్టింగ్ వంటి అనువర్తనాల్లో ఉపయోగించే గణాంక మార్గంగా కూడా మేము నిర్వచించవచ్చు. ఇది ఆధారిత వేరియబుల్ మరియు స్వతంత్ర చరరాశుల సమూహం మధ్య సంబంధాన్ని అంచనా వేయడానికి ఉపయోగించబడుతుంది. వివిధ రకాల రిగ్రెషన్ టెక్నిక్‌లను పరిశీలిద్దాం.

యంత్ర అభ్యాసంలో ఉదాహరణ-లీనియర్ రిగ్రెషన్ - ఎడురేకా

రిగ్రెషన్ రకాలు

కిందివి రిగ్రెషన్ రకాలు.



  1. సాధారణ లీనియర్ రిగ్రెషన్
  2. బహుపది రిగ్రెషన్
  3. వెక్టర్ రిగ్రెషన్కు మద్దతు ఇవ్వండి
  4. నిర్ణయం చెట్టు రిగ్రెషన్
  5. రాండమ్ ఫారెస్ట్ రిగ్రెషన్

సాధారణ లీనియర్ రిగ్రెషన్

అత్యంత ఆసక్తికరమైన మరియు సాధారణ రిగ్రెషన్ టెక్నిక్ ఒకటి సరళమైన లీనియర్ రిగ్రెషన్. దీనిలో, స్వతంత్ర చరరాశుల ఆధారంగా ఆధారిత వేరియబుల్ యొక్క ఫలితాన్ని మేము ict హిస్తాము, వేరియబుల్స్ మధ్య సంబంధం సరళంగా ఉంటుంది. అందువల్ల, లీనియర్ రిగ్రెషన్ అనే పదం.

బహుపది రిగ్రెషన్

ఈ రిగ్రెషన్ టెక్నిక్‌లో, మేము అసలు లక్షణాలను ఇచ్చిన డిగ్రీ యొక్క బహుపది లక్షణాలుగా మారుస్తాము మరియు దానిపై రిగ్రెషన్ చేస్తాము.

వెక్టర్ రిగ్రెషన్కు మద్దతు ఇవ్వండి

కోసం రిగ్రెషన్ లేదా SVR, గరిష్ట మార్జిన్‌తో హైపర్‌ప్లేన్‌ను మేము గుర్తించాము, అంటే గరిష్ట సంఖ్యలో డేటా పాయింట్లు ఆ మార్జిన్లలో ఉంటాయి. ఇది సపోర్ట్ వెక్టర్ మెషిన్ వర్గీకరణ అల్గోరిథంకు చాలా పోలి ఉంటుంది.



నిర్ణయం చెట్టు రిగ్రెషన్

TO రిగ్రెషన్ మరియు రెండింటికీ ఉపయోగించవచ్చు . రిగ్రెషన్ విషయంలో, ప్రామాణిక విచలనాన్ని తగ్గించడం ద్వారా విభజన నోడ్‌ను గుర్తించడానికి మేము ID3 అల్గోరిథం (ఇటరేటివ్ డైకోటోమైజర్ 3) ను ఉపయోగిస్తాము.

రాండమ్ ఫారెస్ట్ రిగ్రెషన్

యాదృచ్ఛిక అటవీ రిగ్రెషన్లో, మేము అనేక నిర్ణయం చెట్టు రిగ్రెషన్ల అంచనాలను సమిష్టి చేస్తాము. వివిధ రకాల రిగ్రెషన్ గురించి ఇప్పుడు మనకు తెలుసు, సరళమైన సరళ రిగ్రెషన్ గురించి వివరంగా చూద్దాం.

లీనియర్ రిగ్రెషన్ అంటే ఏమిటి?

సింపుల్ లీనియర్ రిగ్రెషన్ అనేది రిగ్రెషన్ టెక్నిక్, దీనిలో స్వతంత్ర వేరియబుల్ డిపెండెంట్ వేరియబుల్‌తో సరళ సంబంధాన్ని కలిగి ఉంటుంది. రేఖాచిత్రంలోని సరళ రేఖ ఉత్తమమైన అమరిక రేఖ. సరళమైన లీనియర్ రిగ్రెషన్ యొక్క ప్రధాన లక్ష్యం, ఇచ్చిన డేటా పాయింట్లను పరిగణనలోకి తీసుకోవడం మరియు మోడల్‌ను సాధ్యమైనంత ఉత్తమంగా సరిపోయేలా ఉత్తమమైన ఫిట్ లైన్‌ను ప్లాట్ చేయడం.

లీనియర్ రిగ్రెషన్ అల్గోరిథం ఎలా పనిచేస్తుందో వెళ్లేముందు, సాధారణ సరళ రిగ్రెషన్‌లోని కొన్ని ముఖ్యమైన పరిభాషలను పరిశీలిద్దాం.

లీనియర్ రిగ్రెషన్ పరిభాష

లీనియర్ రిగ్రెషన్ అల్గోరిథంకు వెళ్ళే ముందు ఈ క్రింది పరిభాషలు తెలుసుకోవడం ముఖ్యం.

ఖర్చు ఫంక్షన్

ఉత్తమ ఫిట్ లైన్ క్రింద ఇవ్వబడిన సరళ సమీకరణం ఆధారంగా ఉంటుంది.

  • అంచనా వేయవలసిన డిపెండెంట్ వేరియబుల్ Y చే సూచించబడుతుంది.
  • Y- అక్షాన్ని తాకిన ఒక పంక్తి అంతరాయం ద్వారా సూచించబడుతుంది b0.
  • బిఒకటిరేఖ యొక్క వాలు, x Y యొక్క అంచనాను నిర్ణయించే స్వతంత్ర చరరాశులను సూచిస్తుంది.
  • ఫలిత అంచనాలో లోపం e చే సూచించబడుతుంది.

ఖర్చు ఫంక్షన్ b కోసం సాధ్యమైనంత ఉత్తమమైన విలువలను అందిస్తుంది0మరియు బిఒకటిడేటా పాయింట్ల కోసం ఉత్తమమైన ఫిట్ లైన్ చేయడానికి. B కోసం ఉత్తమ విలువలను పొందడానికి ఈ సమస్యను కనిష్టీకరణ సమస్యగా మార్చడం ద్వారా మేము దీన్ని చేస్తాము0మరియు బిఒకటి. అసలు విలువ మరియు value హించిన విలువ మధ్య ఈ సమస్యలో లోపం తగ్గించబడుతుంది.

లోపాన్ని తగ్గించడానికి పై ఫంక్షన్‌ను ఎంచుకుంటాము. మేము లోపం వ్యత్యాసాన్ని చతురస్రం చేస్తాము మరియు అన్ని డేటా పాయింట్ల మీద లోపం సంకలనం చేస్తాము, మొత్తం డేటా పాయింట్ల మధ్య విభజన. అప్పుడు, ఉత్పత్తి చేసిన విలువ అన్ని డేటా పాయింట్ల కంటే సగటు చదరపు లోపాన్ని అందిస్తుంది.

దీనిని MSE (మీన్ స్క్వేర్డ్ ఎర్రర్) అని కూడా పిలుస్తారు మరియు మేము b యొక్క విలువలను మారుస్తాము0మరియు బిఒకటితద్వారా MSE విలువ కనిష్టంగా పరిష్కరించబడుతుంది.

ప్రవణత సంతతి

లీనియర్ రిగ్రెషన్ అర్థం చేసుకోవడానికి తదుపరి ముఖ్యమైన పరిభాష ప్రవణత సంతతి. ఇది నవీకరించే పద్ధతి b0మరియు బిఒకటిMSE ని తగ్గించడానికి విలువలు. దీని వెనుక ఉన్న ఆలోచన ఏమిటంటే b0మరియు బిఒకటిమేము MSE ని కనిష్టానికి తగ్గించే వరకు విలువలు.

నవీకరించడానికి b0మరియు బిఒకటి, మేము ఖర్చు ఫంక్షన్ నుండి ప్రవణతలు తీసుకుంటాము. ఈ ప్రవణతలను కనుగొనడానికి, మేము b కి సంబంధించి పాక్షిక ఉత్పన్నాలను తీసుకుంటాము0మరియు బిఒకటి. ఈ పాక్షిక ఉత్పన్నాలు ప్రవణతలు మరియు b యొక్క విలువలను నవీకరించడానికి ఉపయోగిస్తారు0మరియు బిఒకటి.

ఒక చిన్న అభ్యాస రేటు కనిష్టానికి దగ్గరగా ఉంటుంది, అయితే దీనికి ఎక్కువ సమయం పడుతుంది మరియు పెద్ద అభ్యాస రేటు విషయంలో. తీసుకున్న సమయం త్వరగా కానీ కనీస విలువను అధిగమించే అవకాశం ఉంది. ఇప్పుడు మేము లీనియర్ రిగ్రెషన్‌లోని పరిభాషలతో ఉన్నాము, యంత్ర అభ్యాసం కోసం లీనియర్ రిగ్రెషన్ యొక్క కొన్ని ప్రయోజనాలు మరియు అప్రయోజనాలను పరిశీలిద్దాం.

ప్రయోజనాలు మరియు అప్రయోజనాలు

ప్రయోజనాలు ప్రతికూలతలు
సరళంగా వేరు చేయగల డేటా కోసం లీనియర్ రిగ్రెషన్ అనూహ్యంగా బాగా పనిచేస్తుందిఆధారిత మరియు స్వతంత్ర చరరాశుల మధ్య సరళత యొక్క umption హ
అమలు చేయడానికి, అర్థం చేసుకోవడానికి మరియు శిక్షణ ఇవ్వడానికి సమర్థవంతంగాఇది తరచుగా శబ్దం మరియు అతిగా సరిపోయే అవకాశం ఉంది
డైమెన్షనల్ రిడక్షన్ టెక్నిక్స్, రెగ్యులరైజేషన్ మరియు క్రాస్ ధ్రువీకరణ ఉపయోగించి ఇది ఓవర్ ఫిటింగ్ ను చక్కగా నిర్వహిస్తుందిలీనియర్ రిగ్రెషన్ అవుట్‌లైయర్‌లకు చాలా సున్నితంగా ఉంటుంది
ఒక నిర్దిష్ట డేటా సమితికి మించిన ఎక్స్‌ట్రాపోలేషన్ మరో ప్రయోజనంఇది మల్టీకాలినియారిటీకి గురవుతుంది

లీనియర్ రిగ్రెషన్ యూజ్ కేసులు

  • అమ్మకాల సూచన

  • ప్రమాద విశ్లేషణ

  • హౌసింగ్ అప్లికేషన్స్ ధరలు మరియు ఇతర అంశాలను అంచనా వేయడానికి

  • స్టాక్ ధరలు, పెట్టుబడి మూల్యాంకనం మొదలైనవాటిని అంచనా వేయడానికి ఆర్థిక అనువర్తనాలు.

సరళ రిగ్రెషన్ వెనుక ఉన్న ప్రాథమిక ఆలోచన ఏమిటంటే, ఆధారిత మరియు స్వతంత్ర చరరాశుల మధ్య సంబంధాన్ని కనుగొనడం. ఇది తక్కువ లోపంతో ఫలితాన్ని అంచనా వేసే ఉత్తమమైన యుక్తమైన పంక్తిని పొందడానికి ఉపయోగించబడుతుంది. అధ్యయనం యొక్క గంటలు మరియు ఇతర నిర్ణయాత్మక కారకాలకు సంబంధించి SAT స్కోర్‌లను అంచనా వేయడం వంటి సాధారణ నిజ జీవిత పరిస్థితులలో మేము సరళ రిగ్రెషన్‌ను ఉపయోగించవచ్చు.

దీన్ని దృష్టిలో పెట్టుకుని, వినియోగ కేసును పరిశీలిద్దాం.

కేస్ ఉపయోగించండి - లీనియర్ రిగ్రెషన్ అమలు

ఈ ప్రక్రియ క్రింది దశల్లో జరుగుతుంది:

  1. డేటాను లోడ్ చేస్తోంది
  2. డేటాను అన్వేషించడం
  3. డేటాను ముక్కలు చేయడం
  4. రైలు మరియు స్ప్లిట్ డేటా
  5. మోడల్‌ను రూపొందించండి
  6. మూల్యాంకనం ఖచ్చితత్వం

లీనియర్ రిగ్రెషన్ అమలు చేయడానికి ప్రతి దశల వివరాలను తెలుసుకుందాం.

1. డేటాను లోడ్ చేస్తోంది

సరళ రిగ్రెషన్‌తో మా ప్రయాణాన్ని ప్రారంభించడానికి స్క్లెయర్న్ (స్కికిట్-లెర్న్) డేటా సెట్స్ మాడ్యూల్‌లో ఇప్పటికే ఉన్న ప్రాథమిక డయాబెటిస్ డేటా సెట్‌తో మనం ప్రారంభించవచ్చు.

sklearn దిగుమతి డేటాసెట్ల వ్యాధి = datasets.load_diabetes () ముద్రణ (వ్యాధి)

అవుట్పుట్:

సి ++ సోర్స్ కోడ్‌ను విలీనం చేయండి

2. డేటాను అన్వేషించడం

మేము డేటాను లోడ్ చేసిన తర్వాత, కింది కోడ్‌ను ఉపయోగించడం ద్వారా లేబుల్‌లను తనిఖీ చేయడం ద్వారా అన్వేషించడం ప్రారంభించవచ్చు.

ముద్రణ (disease.keys ())

అవుట్పుట్:

పై కోడ్ డేటా సెట్ నుండి అన్ని లేబుళ్ళను ఇస్తుంది, దీని తరువాత, మేము డేటాను స్లైస్ చేయవచ్చు, తద్వారా చివరికి లైన్ను ప్లాట్ చేయవచ్చు. మేము అన్ని డేటా పాయింట్లను కూడా ఉపయోగిస్తాము, ప్రస్తుతానికి, మేము డేటా నుండి కాలమ్ 2 ను ముక్కలు చేస్తాము.

nmp disease_X = disease.data [:, np.newaxis, 2] ముద్రణ (వ్యాధి_ఎక్స్)

అవుట్పుట్:

ఈ దశ తరువాత, మేము డేటాను రైలు మరియు పరీక్షా సమితిగా విభజిస్తాము.

3. డేటాను విభజించడం

disease_X_train = disease_X [: - 30] disease_X_test = disease_X [-20:] disease_Y_train = disease.target [: - 30] disease_Y_test = disease.target [-20:]

తరువాతి భాగంలో మోడల్‌ను రూపొందించడం ఉంటుంది, ఇందులో స్క్లెర్న్ నుండి లీనియర్_మోడల్‌ను దిగుమతి చేస్తుంది.

4. మోడల్‌ను రూపొందించడం

sklearn దిగుమతి లీనియర్_మోడల్ reg = లీనియర్_మోడల్. లీనియర్ రిగ్రెషన్ () reg.fit (వ్యాధి_ఎక్స్_ట్రెయిన్, వ్యాధి_వై_ట్రెయిన్) y_predict = reg.predict (disease_X_test)

మోడల్ యొక్క ఖచ్చితత్వాన్ని అంచనా వేయడానికి, మేము స్కికిట్-లెర్న్ నుండి సగటు స్క్వేర్డ్ లోపాన్ని ఉపయోగిస్తాము.

5. మూల్యాంకనం

ఖచ్చితత్వం = సగటు_ స్క్వేర్డ్_రర్ర్ (వ్యాధి_వై_టెస్ట్, వై_ప్రెడిక్ట్,) ప్రింట్ (ఖచ్చితత్వం) బరువులు = reg.coef_ intercept = reg.intercept_ print (బరువులు, అంతరాయం)

అవుట్పుట్:

గ్రాఫ్‌లో డేటా పాయింట్లు ఎలా ఉంటాయనే దానిపై మరింత స్పష్టంగా తెలుసుకోవడానికి, గ్రాఫ్‌లను కూడా ప్లాట్ చేద్దాం.

matplotlib.pyplot ను plt plt.scatter (disease_X_test, disease_Y_test) plt.plot (disease_X_test, y_predict) plt.show () గా దిగుమతి చేయండి.

అవుట్పుట్:

ఈ దృష్టాంతంలో మరింత ఖచ్చితమైన మోడల్‌ను పొందడానికి, మేము కేవలం 2 నిలువు వరుసకు బదులుగా మొత్తం డేటాను ఉపయోగించవచ్చు. ఇది క్రింద చూపిన విధంగా ఖచ్చితత్వాన్ని ఇస్తుంది:

# పై కోడ్‌లో కొద్దిగా మార్పు చేయండి మరియు లోపాలను నివారించడానికి ప్లాటింగ్ కోడ్‌ను తొలగించండి disease_X = disease.data

అవుట్పుట్:

యంత్ర అభ్యాసం కోసం లీనియర్ రిగ్రెషన్ గురించి మేము నేర్చుకున్న ఈ వ్యాసం చివరకి ఇది మనలను తీసుకువస్తుంది. ఈ ట్యుటోరియల్‌లో మీతో పంచుకున్న అన్ని విషయాలతో మీరు స్పష్టంగా ఉన్నారని నేను ఆశిస్తున్నాను.

“మెషిన్ లెర్నింగ్ కోసం లీనియర్ రిగ్రెషన్” పై మీరు ఈ కథనాన్ని కనుగొంటే, చూడండి ప్రపంచవ్యాప్తంగా 250,000 కంటే ఎక్కువ సంతృప్తికరమైన అభ్యాసకుల నెట్‌వర్క్‌తో విశ్వసనీయ ఆన్‌లైన్ లెర్నింగ్ సంస్థ.

మీకు ఏవైనా ప్రశ్నలు వస్తే, “మెషిన్ లెర్నింగ్ కోసం లీనియర్ రిగ్రెషన్” యొక్క వ్యాఖ్యల విభాగంలో మీ ప్రశ్నలన్నింటినీ అడగడానికి సంకోచించకండి మరియు మా బృందం సమాధానం ఇవ్వడానికి సంతోషిస్తుంది.