మార్కోవ్ గొలుసు పరిచయం:
గూగుల్ వెబ్ పేజీలను ఎలా ర్యాంక్ చేస్తుందో మీరు ఎప్పుడైనా ఆలోచిస్తున్నారా? మీరు మీ పరిశోధన చేసి ఉంటే, అది మార్కోవ్ గొలుసుల ఆలోచనపై ఆధారపడిన పేజ్రాంక్ అల్గోరిథంను ఉపయోగిస్తుందని మీరు తెలుసుకోవాలి. మార్కోవ్ గొలుసుల పరిచయంపై ఈ వ్యాసం మార్కోవ్ గొలుసుల వెనుక ఉన్న ప్రాథమిక ఆలోచనను మరియు వాస్తవ ప్రపంచ సమస్యలకు పరిష్కారంగా వాటిని ఎలా రూపొందించవచ్చో అర్థం చేసుకోవడానికి మీకు సహాయపడుతుంది.
చెఫ్ మరియు తోలుబొమ్మల మధ్య వ్యత్యాసం
కవర్ చేయబడే అంశాల జాబితా ఇక్కడ ఉంది ఈ బ్లాగులో:
- మార్కోవ్ గొలుసు అంటే ఏమిటి?
- మార్కోవ్ ఆస్తి అంటే ఏమిటి?
- మార్కోవ్ గొలుసులను ఒక ఉదాహరణతో అర్థం చేసుకోవడం
- పరివర్తన మాతృక అంటే ఏమిటి?
- పైథాన్లో మార్కోవ్ చైన్
- మార్కోవ్ చైన్ అప్లికేషన్స్
పైథాన్ ఉపయోగించి డేటా సైన్స్ మరియు మెషిన్ లెర్నింగ్పై లోతైన జ్ఞానం పొందడానికి, మీరు ప్రత్యక్ష ప్రసారం కోసం నమోదు చేసుకోవచ్చు 24/7 మద్దతు మరియు జీవితకాల ప్రాప్యతతో ఎడురేకా చేత.
మార్కోవ్ గొలుసు అంటే ఏమిటి?
ఆండ్రీ మార్కోవ్ మొట్టమొదట 1906 లో మార్కోవ్ గొలుసులను ప్రవేశపెట్టాడు. అతను మార్కోవ్ గొలుసులను ఇలా వివరించాడు:
యాదృచ్ఛిక చరరాశులను కలిగి ఉన్న యాదృచ్ఛిక ప్రక్రియ, కొన్ని ump హలు మరియు ఖచ్చితమైన సంభావ్యత నియమాలను బట్టి ఒక రాష్ట్రం నుండి మరొక స్థితికి మారుతుంది.
ఈ యాదృచ్ఛిక అని పిలువబడే ఒక ముఖ్యమైన గణిత ఆస్తి ఆధారంగా వేరియబుల్స్ ఒకటి నుండి మరొకదానికి మారుతాయి మార్కోవ్ ఆస్తి.
ఇది మమ్మల్ని ప్రశ్నకు తీసుకువస్తుంది:
మార్కోవ్ ఆస్తి అంటే ఏమిటి?
వివిక్త సమయం మార్కోవ్ ప్రాపర్టీ, యాదృచ్ఛిక ప్రక్రియ యొక్క తదుపరి సంభావ్యత యొక్క సంభావ్యత ప్రస్తుత స్థితి మరియు సమయంపై మాత్రమే ఆధారపడి ఉంటుందని మరియు దానికి ముందు ఉన్న రాష్ట్రాల శ్రేణి నుండి స్వతంత్రంగా ఉంటుందని పేర్కొంది.
యాదృచ్ఛిక ప్రక్రియ యొక్క తదుపరి సాధ్యమయ్యే చర్య / స్థితి మునుపటి రాష్ట్రాల క్రమం మీద ఆధారపడి ఉండదు, మార్కోవ్ గొలుసులను మెమరీ-తక్కువ ప్రక్రియగా మారుస్తుంది, ఇది వేరియబుల్ యొక్క ప్రస్తుత స్థితి / చర్యపై మాత్రమే ఆధారపడి ఉంటుంది.
దీన్ని గణితశాస్త్రంలో తీసుకుందాం:
యాదృచ్ఛిక ప్రక్రియ, {Xm, m = 0,1,2, Let be గా ఉండనివ్వండి.
ఈ ప్రక్రియ మార్కోవ్ గొలుసు అయితే,
మార్కోవ్ గొలుసు - మార్కోవ్ గొలుసు పరిచయం - ఎడురేకా
అన్ని m, j, i, i0, i1, ⋯ im & minus1
పరిమిత సంఖ్యలో రాష్ట్రాల కొరకు, S = {0, 1, 2, ⋯, r}, దీనిని పరిమిత మార్కోవ్ గొలుసు అంటారు.
P (Xm + 1 = j | Xm = i) ఇక్కడ ఒక రాష్ట్రం నుండి మరొక స్థితికి మారడానికి పరివర్తన సంభావ్యతలను సూచిస్తుంది. ఇక్కడ, పరివర్తన సంభావ్యత సమయం నుండి స్వతంత్రంగా ఉందని మేము uming హిస్తున్నాము.
అంటే P (Xm + 1 = j | Xm = i) ‘m’ విలువపై ఆధారపడి ఉండదు. అందువల్ల, మేము సంగ్రహంగా చెప్పవచ్చు,
మార్కోవ్ చైన్ ఫార్ములా - మార్కోవ్ గొలుసు పరిచయం - ఎడురేకా
కాబట్టి ఈ సమీకరణం సూచిస్తుంది మార్కోవ్ గొలుసు.
మార్కోవ్ గొలుసులు సరిగ్గా ఏమిటో ఇప్పుడు ఒక ఉదాహరణతో అర్థం చేసుకుందాం.
మార్కోవ్ చైన్ ఉదాహరణ
నేను మీకు ఒక ఉదాహరణ ఇచ్చే ముందు, మార్కోవ్ మోడల్ అంటే ఏమిటో నిర్వచించండి:
మార్కోవ్ మోడల్ అంటే ఏమిటి?
మార్కోవ్ మోడల్ అనేది యాదృచ్ఛిక వేరియబుల్స్ను మార్కోవ్ ఆస్తిని అనుసరించే విధంగా యాదృచ్ఛిక వేరియబుల్స్ను మోడల్ చేసే యాదృచ్ఛిక నమూనా.
మార్కోవ్ మోడల్ సరళమైన ఉదాహరణతో ఎలా పనిచేస్తుందో ఇప్పుడు అర్థం చేసుకుందాం.
ముందే చెప్పినట్లుగా, టెక్స్ట్ జనరేషన్ మరియు ఆటో-కంప్లీషన్ అప్లికేషన్లలో మార్కోవ్ గొలుసులు ఉపయోగించబడతాయి. ఈ ఉదాహరణ కోసం, మేము ఒక ఉదాహరణ (యాదృచ్ఛిక) వాక్యాన్ని పరిశీలిస్తాము మరియు మార్కోవ్ గొలుసులను ఉపయోగించడం ద్వారా దీన్ని ఎలా మోడల్ చేయవచ్చో చూస్తాము.
మార్కోవ్ గొలుసు ఉదాహరణ - మార్కోవ్ గొలుసు పరిచయం - ఎడురేకా
పై వాక్యం మా ఉదాహరణ, ఇది పెద్దగా అర్ధం కాదని నాకు తెలుసు (దీనికి అవసరం లేదు), ఇది యాదృచ్ఛిక పదాలను కలిగి ఉన్న వాక్యం, దీనిలో:
కీలు వాక్యంలోని ప్రత్యేకమైన పదాలను సూచించండి, అనగా, 5 కీలు (ఒకటి, రెండు, వడగళ్ళు, సంతోషంగా, ఎడురేకా)
టోకెన్లు మొత్తం పదాల సంఖ్యను సూచించండి, అనగా 8 టోకెన్లు.
ముందుకు వెళుతున్నప్పుడు, ఈ పదాల సంభవించిన ఫ్రీక్వెన్సీని మనం అర్థం చేసుకోవాలి, ఈ క్రింది రేఖాచిత్రం ప్రతి పదం తో పాటు ఆ పదం యొక్క ఫ్రీక్వెన్సీని సూచించే సంఖ్యను చూపిస్తుంది.
కీలు మరియు ఫ్రీక్వెన్సీలు - మార్కోవ్ గొలుసుల పరిచయం - ఎడురేకా
కాబట్టి ఇక్కడ ఎడమ కాలమ్ కీలను సూచిస్తుంది మరియు కుడి కాలమ్ పౌన .పున్యాలను సూచిస్తుంది.
పై పట్టిక నుండి, కీ ‘ఎడురేకా’ ఏ ఇతర కీతో పోలిస్తే 4x పైకి వస్తుందని మేము నిర్ధారించగలము. అటువంటి సమాచారాన్ని er హించడం చాలా ముఖ్యం ఎందుకంటే ఇది ఒక నిర్దిష్ట సమయంలో ఏ పదం సంభవిస్తుందో ict హించడంలో మాకు సహాయపడుతుంది. ఉదాహరణ వాక్యంలోని తరువాతి పదం గురించి నేను take హించుకుంటే, అది సంభవించే అత్యధిక సంభావ్యత ఉన్నందున నేను ‘ఎడురేకా’ తో వెళ్తాను.
సంభావ్యత గురించి మాట్లాడుతూ, మీరు తెలుసుకోవలసిన మరొక కొలత బరువున్న పంపిణీలు.
మా విషయంలో, ‘ఎడురేకా’ కోసం బరువు పంపిణీ 50% (4/8) ఎందుకంటే దాని పౌన frequency పున్యం మొత్తం 8 టోకెన్లలో 4. మిగిలిన కీలు (ఒకటి, రెండు, వడగళ్ళు, సంతోషంగా) అన్నీ సంభవించే 1/8 వ అవకాశం ఉంది (& అసింప్ 13%).
ఇప్పుడు మనకు బరువు పంపిణీ గురించి అవగాహన ఉంది మరియు నిర్దిష్ట పదాలు ఇతరులకన్నా ఎక్కువగా ఎలా సంభవిస్తాయో అనే ఆలోచన ఉంది, మేము తరువాతి భాగంతో ముందుకు వెళ్ళవచ్చు.
మార్కోవ్ గొలుసులను అర్థం చేసుకోవడం - మార్కోవ్ గొలుసుల పరిచయం - ఎడురేకా
పై చిత్రంలో, నేను వాక్యం యొక్క ప్రారంభాన్ని మరియు ముగింపును సూచించే రెండు అదనపు పదాలను జోడించాను, నేను ఈ క్రింది విభాగంలో ఎందుకు చేశానో మీకు అర్థం అవుతుంది.
ఇప్పుడు ఈ కీల కోసం ఫ్రీక్వెన్సీని కూడా కేటాయించండి:
నవీకరించబడిన కీలు మరియు ఫ్రీక్వెన్సీలు - మార్కోవ్ గొలుసుల పరిచయం - ఎడురేకా
ఇప్పుడు మార్కోవ్ మోడల్ను క్రియేట్ చేద్దాం. ఇంతకు ముందే చెప్పినట్లుగా, ఒక నిర్దిష్ట స్థితిలో యాదృచ్ఛిక చరరాశులను మోడల్ చేయడానికి మార్కోవ్ మోడల్ ఉపయోగించబడుతుంది, ఈ వేరియబుల్స్ యొక్క భవిష్యత్తు స్థితులు వాటి ప్రస్తుత స్థితిపై మాత్రమే ఆధారపడి ఉంటాయి మరియు వాటి గత రాష్ట్రాలపై కాదు.
కాబట్టి ప్రాథమికంగా మార్కోవ్ నమూనాలో, తదుపరి స్థితిని అంచనా వేయడానికి, మేము ప్రస్తుత స్థితిని మాత్రమే పరిగణించాలి.
దిగువ రేఖాచిత్రంలో, మా వాక్యంలోని ప్రతి టోకెన్ మరొకదానికి ఎలా దారితీస్తుందో మీరు చూడవచ్చు. భవిష్యత్ స్థితి (తదుపరి టోకెన్) ప్రస్తుత స్థితి (ప్రస్తుత టోకెన్) పై ఆధారపడి ఉందని ఇది చూపిస్తుంది. కాబట్టి మార్కోవ్ మోడల్లో ఇది చాలా ప్రాథమిక నియమం.
దిగువ రేఖాచిత్రం జత టోకెన్లు ఉన్నాయని చూపిస్తుంది, ఇక్కడ జతలోని ప్రతి టోకెన్ ఒకే జతలో మరొకదానికి దారితీస్తుంది.
మార్కోవ్ చైన్ పెయిర్స్ - మార్కోవ్ గొలుసు పరిచయం - ఎడురేకా
దిగువ రేఖాచిత్రంలో, నేను ప్రతి కీని జత చేయగల తదుపరి టోకెన్ల శ్రేణితో చూపించే నిర్మాణ ప్రాతినిధ్యాన్ని సృష్టించాను.
మార్కోవ్ చైన్ పెయిర్స్ యొక్క శ్రేణి - మార్కోవ్ గొలుసు పరిచయం - ఎడురేకా
ఈ ఉదాహరణను సంగ్రహించడానికి, పై ఉదాహరణలో మేము చూసిన కీలు మరియు టోకెన్ల శ్రేణిని ఉపయోగించి మీరు ఒక వాక్యాన్ని రూపొందించాల్సిన దృష్టాంతాన్ని పరిగణించండి. మేము ఈ ఉదాహరణను అమలు చేయడానికి ముందు, మరొక ముఖ్యమైన విషయం ఏమిటంటే, మేము రెండు ప్రారంభ చర్యలను పేర్కొనాలి:
ప్రారంభ సంభావ్యత పంపిణీ (అనగా ప్రారంభ స్థితి = 0, (‘ప్రారంభ’ కీ))
ఒక రాష్ట్రం నుండి మరొక రాష్ట్రానికి దూకడం యొక్క పరివర్తన సంభావ్యత (ఈ సందర్భంలో, ఒక టోకెన్ నుండి మరొకదానికి మారే సంభావ్యత)
మేము ప్రారంభంలోనే బరువు పంపిణీని నిర్వచించాము, కాబట్టి మనకు సంభావ్యత మరియు ప్రారంభ స్థితి ఉంది, ఇప్పుడు ఉదాహరణతో చూద్దాం.
కాబట్టి ప్రారంభ టోకెన్తో ప్రారంభించడం [ప్రారంభం]
తరువాత, మనకు ఒకే టోకెన్ మాత్రమే ఉంది, అనగా [ఒకటి]
ప్రస్తుతం, వాక్యానికి ఒకే పదం ఉంది, అనగా ‘ఒకటి’
రిమోట్ పద్ధతి ఇన్వొకేషన్ జావా ఉదాహరణ
ఈ టోకెన్ నుండి, తదుపరి టోకెన్ [ఎడురేకా]
వాక్యం ‘ఒక ఎడురేకా’ కు నవీకరించబడింది
[ఎడురేకా] నుండి మేము ఈ క్రింది టోకెన్లలో దేనినైనా వెళ్ళవచ్చు [రెండు, వడగళ్ళు, సంతోషంగా, ముగింపు]
‘రెండు’ ఎంపిక కావడానికి 25% అవకాశం ఉంది, ఇది అసలు వాక్యాన్ని ఏర్పరుస్తుంది (ఒక ఎడురేకా రెండు ఎడురేకా వడగళ్ళు ఎడురేకా హ్యాపీ ఎడురేకా). ఏదేమైనా, ‘ముగింపు’ ఎంచుకోబడితే, ఆ ప్రక్రియ ఆగిపోతుంది మరియు మేము క్రొత్త వాక్యాన్ని ఉత్పత్తి చేస్తాము, అనగా, ‘ఒక ఎడురేకా’.
మీరు మార్కోవ్ మోడల్ను నిర్మించి, దాని ద్వారా ఒక పరీక్ష కేసును నడిపినందున మీ వెనుక భాగంలో ఒక పాట్ ఇవ్వండి. పై ఉదాహరణను సంగ్రహించడానికి, మేము ప్రాథమికంగా ప్రస్తుత స్థితిని (ప్రస్తుత పదం) తరువాతి స్థితిని (తదుపరి పదం) నిర్ణయించడానికి ఉపయోగించాము. మార్కోవ్ ప్రక్రియ అదే.
ఇది యాదృచ్ఛిక ప్రక్రియ, దీనిలో యాదృచ్ఛిక వేరియబుల్స్ ఒక రాష్ట్రం నుండి మరొక స్థితికి మారుతాయి, ఆ విధంగా వేరియబుల్ యొక్క భవిష్యత్తు స్థితి ప్రస్తుత స్థితిపై మాత్రమే ఆధారపడి ఉంటుంది.
దీన్ని తదుపరి దశకు తీసుకుందాం మరియు ఈ ఉదాహరణ కోసం మార్కోవ్ మోడల్ను గీయండి.
స్టేట్ ట్రాన్సిషన్ రేఖాచిత్రం - మార్కోవ్ గొలుసుల పరిచయం - ఎడురేకా
పై బొమ్మను స్టేట్ ట్రాన్సిషన్ రేఖాచిత్రం అంటారు. మేము దిగువ విభాగంలో దీని గురించి మరింత మాట్లాడుతాము, ఎందుకంటే ఈ రేఖాచిత్రం ఒక రాష్ట్రం నుండి మరొక రాష్ట్రానికి పరివర్తనాలు మరియు సంభావ్యతను చూపుతుందని గుర్తుంచుకోండి.
చిత్రంలోని ప్రతి ఓవల్ ఒక కీని సూచిస్తుందని గమనించండి మరియు బాణాలు దానిని అనుసరించగల కీల వైపు మళ్ళించబడతాయి. అలాగే, బాణాలపై బరువులు సూచిస్తాయి సంభావ్యత లేదా సంబంధిత రాష్ట్రాలకు / నుండి పరివర్తనం యొక్క బరువు పంపిణీ.
కాబట్టి మార్కోవ్ మోడల్ ఎలా పనిచేస్తుందో దాని గురించి. ఇప్పుడు మార్కోవ్ ప్రాసెస్లోని కొన్ని ముఖ్యమైన పరిభాషలను అర్థం చేసుకోవడానికి ప్రయత్నిద్దాం.
పరివర్తన సంభావ్యత మాతృక అంటే ఏమిటి?
పై విభాగంలో మేము మార్కోవ్ మోడల్ యొక్క పనిని సరళమైన ఉదాహరణతో చర్చించాము, ఇప్పుడు మార్కోవ్ ప్రాసెస్లోని గణిత పరిభాషలను అర్థం చేసుకుందాం.
మార్కోవ్ ప్రాసెస్లో, ఒక రాష్ట్రం నుండి మరొక రాష్ట్రానికి పరివర్తన సంభావ్యతలను సూచించడానికి మేము మాతృకను ఉపయోగిస్తాము. ఈ మాతృకను పరివర్తన లేదా సంభావ్యత మాతృక అంటారు. దీనిని సాధారణంగా పి.
ట్రాన్సిషన్ మ్యాట్రిక్స్ - మార్కోవ్ గొలుసు పరిచయం - ఎడురేకా
గమనిక, పిజ్ & జి 0, మరియు అన్ని విలువలకు ‘నేను’,
ట్రాన్సిషన్ మ్యాట్రిక్స్ ఫార్ములా - మార్కోవ్ గొలుసు పరిచయం - ఎడురేకా
ఈ విషయాన్ని వివరిస్తాను. మన ప్రస్తుత స్థితి ‘నేను’ అని uming హిస్తే, తదుపరి లేదా రాబోయే రాష్ట్రం సంభావ్య రాష్ట్రాల్లో ఒకటిగా ఉండాలి. కాబట్టి, k యొక్క అన్ని విలువల సమ్మషన్ తీసుకునేటప్పుడు, మనం తప్పక ఒకటి పొందాలి.
రాష్ట్ర పరివర్తన రేఖాచిత్రం అంటే ఏమిటి?
మార్కోవ్ మోడల్ను స్టేట్ ట్రాన్సిషన్ రేఖాచిత్రం సూచిస్తుంది. రేఖాచిత్రం మార్కోవ్ గొలుసులో వివిధ రాష్ట్రాల మధ్య పరివర్తనలను చూపిస్తుంది. పరివర్తన మాతృక మరియు రాష్ట్ర పరివర్తన మాతృకను ఉదాహరణతో అర్థం చేసుకుందాం.
పరివర్తన మ్యాట్రిక్స్ ఉదాహరణ
1, 2, మరియు 3 రాష్ట్రాలు మరియు క్రింది సంభావ్యతలతో మార్కోవ్ గొలుసును పరిగణించండి:
ట్రాన్సిషన్ మ్యాట్రిక్స్ ఉదాహరణ - మార్కోవ్ గొలుసు పరిచయం - ఎడురేకా
స్టేట్ ట్రాన్సిషన్ రేఖాచిత్రం ఉదాహరణ - మార్కోవ్ గొలుసుల పరిచయం - ఎడురేకా
పై రేఖాచిత్రం మార్కోవ్ గొలుసు కోసం రాష్ట్ర పరివర్తన రేఖాచిత్రాన్ని సూచిస్తుంది. ఇక్కడ, 1,2 మరియు 3 సాధ్యమయ్యే మూడు రాష్ట్రాలు, మరియు ఒక రాష్ట్రం నుండి ఇతర రాష్ట్రాలకు సూచించే బాణాలు పరివర్తన సంభావ్యత పిజ్ను సూచిస్తాయి. ఎప్పుడు, పిజ్ = 0, దీని అర్థం రాష్ట్రం ‘నేను’ మరియు రాష్ట్రం ‘జ’ మధ్య పరివర్తన లేదు.
ఇప్పుడు మేము మార్కోవ్ గొలుసుల వెనుక ఉన్న గణితాన్ని మరియు తర్కాన్ని తెలుసుకోండి, ఒక సాధారణ డెమోని నడుపుదాం మరియు మార్కోవ్ గొలుసులు ఎక్కడ ఉపయోగించవచ్చో అర్థం చేసుకోండి.
పైథాన్లో మార్కోవ్ చైన్
ఈ డెమోని అమలు చేయడానికి, నేను పైథాన్ను ఉపయోగిస్తాను, కాబట్టి మీకు పైథాన్ తెలియకపోతే, మీరు ఈ క్రింది బ్లాగుల ద్వారా వెళ్ళవచ్చు:
ఇప్పుడు కోడింగ్తో ప్రారంభిద్దాం!
మార్కోవ్ చైన్ టెక్స్ట్ జనరేటర్
సమస్యల నివేదిక: మార్కోవ్ ప్రాపర్టీని వర్తింపచేయడానికి మరియు డోనాల్డ్ ట్రంప్ ప్రసంగ డేటా సమితిని అధ్యయనం చేయడం ద్వారా టెక్స్ట్ అనుకరణలను రూపొందించగల మార్కోవ్ మోడల్ను సృష్టించడం.
డేటా సెట్ వివరణ: టెక్స్ట్ ఫైల్లో 2016 లో డోనాల్డ్ ట్రంప్ ఇచ్చిన ప్రసంగాల జాబితా ఉంది.
తర్కం: ప్రసంగంలో ఉపయోగించిన ప్రతి పదాన్ని పరిగణనలోకి తీసుకోవడం ద్వారా డొనాల్డ్ యొక్క ట్రంప్ ప్రసంగాన్ని రూపొందించడానికి మార్కోవ్ ప్రాపర్టీని వర్తించండి మరియు ప్రతి పదానికి, తరువాత ఉపయోగించే పదాల నిఘంటువును సృష్టించండి.
స్ట్రింగ్ నుండి జావా కొత్త తేదీ
దశ 1: అవసరమైన ప్యాకేజీలను దిగుమతి చేయండి
సంఖ్యను np గా దిగుమతి చేయండి
దశ 2: డేటా సమితిని చదవండి
ట్రంప్ = ఓపెన్ ('C: //Users//NeelTemp//Desktop//demos//speeches.txt', ఎన్కోడింగ్ = 'utf8'). చదవండి () # డేటా ప్రింట్ (ట్రంప్) ప్రదర్శించు స్పీచ్ 1 ... ధన్యవాదాలు మీరు చాలా. అది చాలా బాగుంది. అతను గొప్ప వ్యక్తి కాదా? అతను దానిని పొందలేడు. ఇది సరైంది కాదు. నేను ఇక్కడ ఉన్నాను, చాలా గట్టిగా ఇక్కడ ఉన్నాను అని నేను మీకు చెప్పాలి, ఎందుకంటే నాకు స్టీవ్ కింగ్ పట్ల గొప్ప గౌరవం ఉంది మరియు సిటిజెన్స్ యునైటెడ్, డేవిడ్ మరియు ప్రతిఒక్కరికీ గొప్ప గౌరవం ఉంది మరియు టీ పార్టీకి విపరీతమైన గౌరవం ఉంది. అలాగే, అయోవా ప్రజలు కూడా. వారికి ఉమ్మడిగా ఏదో ఉంది. కష్టపడి పనిచేసేవారు ....
దశ 3: సెట్ చేసిన డేటాను వ్యక్తిగత పదాలుగా విభజించండి
corpus = trump.split () # కార్పస్ ప్రింట్ (కార్పస్) 'శక్తివంతమైన,', 'కానీ', 'కాదు', 'శక్తివంతమైనది', 'వంటిది', 'మాకు.', 'ఇరాన్', 'ఉంది', ' సీడ్ ',' టెర్రర్ ', ...
తరువాత, ప్రసంగాలలో విభిన్న జత పదాలను ఉత్పత్తి చేసే ఫంక్షన్ను సృష్టించండి. స్థలాన్ని ఆదా చేయడానికి, మేము జనరేటర్ వస్తువును ఉపయోగిస్తాము.
దశ 4: కీలకు జతలను మరియు తదుపరి పదాలను సృష్టించడం
డెఫ్ మేక్_పెయిర్స్ (కార్పస్): నేను పరిధిలో (లెన్ (కార్పస్) - 1): దిగుబడి (కార్పస్ [i], కార్పస్ [i + 1]) జతలు = మేక్_పెయిర్స్ (కార్పస్)
తరువాత, పదాల జతలను నిల్వ చేయడానికి ఖాళీ నిఘంటువును ప్రారంభిద్దాం.
ఒకవేళ జతలోని మొదటి పదం ఇప్పటికే నిఘంటువులో కీలకంగా ఉంటే, పదాన్ని అనుసరించే పదాల జాబితాకు తదుపరి సంభావ్య పదాన్ని చేర్చండి. పదం కీ కాకపోతే, డిక్షనరీలో క్రొత్త ఎంట్రీని సృష్టించండి మరియు జతలోని మొదటి పదానికి సమానమైన కీని కేటాయించండి.
దశ 5: నిఘంటువును జతచేస్తుంది
word_dict = word word పదం_1 కోసం, పదం_2 జతగా: word_1 లో word_dict.keys (): word_dict [word_1] .అప్పెండ్ (word_2) else: word_dict [word_1] = [word_2]
తరువాత, మేము కార్పస్ నుండి యాదృచ్చికంగా ఒక పదాన్ని ఎంచుకుంటాము, అది మార్కోవ్ గొలుసును ప్రారంభిస్తుంది.
దశ 6: మార్కోవ్ మోడల్ను రూపొందించండి
# మొదటి పదాన్ని మొదటి_వర్డ్ = np.random.choice (కార్పస్) ఎంచుకోండి # మొదటి పదాన్ని క్యాపిటలైజ్డ్ పదంగా ఎంచుకోండి, తద్వారా ఎంచుకున్న పదం ఒక వాక్యం మధ్య నుండి తీసుకోబడదు, అయితే first_word.islower (): # గొలుసు నుండి ప్రారంభించండి ఎంచుకున్న పద గొలుసు = [first_word] # ఉత్తేజిత పదాల సంఖ్యను ప్రారంభించండి n_words = 20
మొదటి పదాన్ని అనుసరించి, గొలుసులోని ప్రతి పదం యాదృచ్ఛికంగా ట్రంప్ యొక్క ప్రత్యక్ష ప్రసంగాలలో నిర్దిష్ట పదాన్ని అనుసరించిన పదాల జాబితా నుండి నమూనాగా ఉంటుంది. ఇది క్రింది కోడ్ స్నిప్పెట్లో చూపబడింది:
నేను పరిధిలో (n_words): chain.append (np.random.choice (word_dict [chain [-1]]))
దశ 7: అంచనాలు
చివరగా, ఉత్తేజిత వచనాన్ని ప్రదర్శిద్దాం.
# చేరండి గొలుసును స్ట్రింగ్ ప్రింట్గా తిరిగి ఇస్తుంది (''. చేరండి (గొలుసు)) నమ్మశక్యం కాని వ్యక్తుల సంఖ్య. మరియు హిల్లరీ క్లింటన్, మా ప్రజలను కలిగి ఉన్నారు మరియు ఇంత గొప్ప ఉద్యోగం. మరియు మేము ఒబామాను ఓడించలేము
కాబట్టి ట్రంప్ ప్రసంగాన్ని పరిగణనలోకి తీసుకోవడం ద్వారా నాకు లభించిన వచనం ఇది. ఇది చాలా అర్ధవంతం కాకపోవచ్చు కాని పాఠాలను స్వయంచాలకంగా రూపొందించడానికి మార్కోవ్ గొలుసులు ఎలా ఉపయోగించవచ్చో మీకు అర్థమయ్యేలా చేస్తుంది.
ఇప్పుడు మరికొన్ని అనువర్తనాలను చూద్దాం మార్కోవ్ గొలుసులు మరియు వాస్తవ ప్రపంచ సమస్యలను పరిష్కరించడానికి అవి ఎలా ఉపయోగించబడుతున్నాయి.
మార్కోవ్ చైన్ అప్లికేషన్స్
మార్కోవ్ గొలుసుల వాస్తవ ప్రపంచ అనువర్తనాల జాబితా ఇక్కడ ఉంది:
గూగుల్ పేజ్ ర్యాంక్: మొత్తం వెబ్ను మార్కోవ్ మోడల్గా భావించవచ్చు, ఇక్కడ ప్రతి వెబ్ పేజీ ఒక రాష్ట్రంగా ఉంటుంది మరియు ఈ పేజీల మధ్య లింక్లు లేదా సూచనలు సంభావ్యతతో పరివర్తనాలు అని భావించవచ్చు. కాబట్టి ప్రాథమికంగా, మీరు ఏ వెబ్పేజీతో సర్ఫింగ్ ప్రారంభించినా, ఒక నిర్దిష్ట వెబ్ పేజీకి వెళ్ళే అవకాశం, X అనేది ఒక స్థిర సంభావ్యత అని చెప్పండి.
వర్డ్ ప్రిడిక్షన్ టైప్ చేయడం: రాబోయే పదాలను అంచనా వేయడానికి మార్కోవ్ గొలుసులు ఉపయోగించబడుతున్నాయి. వాటిని ఆటో-కంప్లీషన్ మరియు సలహాలలో కూడా ఉపయోగించవచ్చు.
సబ్రెడిట్ సిమ్యులేషన్: ఖచ్చితంగా మీరు రెడ్డిట్లోకి వచ్చారు మరియు వారి థ్రెడ్లు లేదా సబ్రెడిట్లలో ఒకదానిపై పరస్పర చర్య చేసారు. రెడ్డిట్ ఒక సబ్రెడిట్ సిమ్యులేటర్ను ఉపయోగిస్తుంది, ఇది వారి సమూహాలలో జరిగే అన్ని వ్యాఖ్యలు మరియు చర్చలను కలిగి ఉన్న భారీ మొత్తంలో డేటాను వినియోగిస్తుంది. మార్కోవ్ గొలుసులను ఉపయోగించడం ద్వారా, సిమ్యులేటర్ వ్యాఖ్యలు మరియు విషయాలను సృష్టించడానికి, పదం నుండి పద సంభావ్యతలను ఉత్పత్తి చేస్తుంది.
టెక్స్ట్ జనరేటర్: మార్కోవ్ గొలుసులు సాధారణంగా నకిలీ గ్రంథాలను రూపొందించడానికి లేదా పెద్ద వ్యాసాలను రూపొందించడానికి మరియు ప్రసంగాలను సంకలనం చేయడానికి ఉపయోగిస్తారు. మీరు వెబ్లో చూసే పేరు జనరేటర్లలో కూడా ఇది ఉపయోగించబడుతుంది.
మార్కోవ్ గొలుసులను ఉపయోగించడం ద్వారా వాస్తవ ప్రపంచ సమస్యను ఎలా పరిష్కరించాలో ఇప్పుడు మీకు తెలుసు, మీరు మరింత తెలుసుకోవడానికి ఆసక్తిగా ఉన్నారని నేను ఖచ్చితంగా అనుకుంటున్నాను. ఇతర గణాంక భావనలతో ప్రారంభించడానికి మీకు సహాయపడే బ్లాగుల జాబితా ఇక్కడ ఉంది:
దీనితో, మేము ఈ ఇంట్రడక్షన్ టు మార్కోవ్ చెయిన్స్ బ్లాగ్ చివరికి వచ్చాము. ఈ అంశానికి సంబంధించి మీకు ఏవైనా ప్రశ్నలు ఉంటే, దయచేసి క్రింద ఒక వ్యాఖ్యను ఇవ్వండి మరియు మేము మిమ్మల్ని సంప్రదిస్తాము.
ట్రెండింగ్ టెక్నాలజీలపై మరిన్ని బ్లాగుల కోసం వేచి ఉండండి.
మీరు డేటా సైన్స్ లో ఆన్లైన్ స్ట్రక్చర్డ్ ట్రైనింగ్ కోసం చూస్తున్నట్లయితే, ఎడురేకా! ప్రత్యేకంగా క్యూరేటెడ్ కలిగి ఉంది స్టాటిస్టిక్స్, డేటా రాంగ్లింగ్, ఎక్స్ప్లోరేటరీ డేటా అనాలిసిస్, కె-మీన్స్ క్లస్టరింగ్, డెసిషన్ ట్రీస్, రాండమ్ ఫారెస్ట్, నైవ్ బేయెస్ వంటి మెషిన్ లెర్నింగ్ అల్గోరిథంలలో నైపుణ్యాన్ని పొందడానికి మీకు సహాయపడే ప్రోగ్రామ్. మీరు టైమ్ సిరీస్, టెక్స్ట్ మైనింగ్ మరియు డీప్ లెర్నింగ్ పరిచయం వంటి అంశాలను నేర్చుకుంటారు. ఈ కోర్సు కోసం కొత్త బ్యాచ్లు త్వరలో ప్రారంభమవుతాయి !!