ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ చాలా ముఖ్యమైనది మరియు ఒక ముఖ్య అంశం మరియు ప్రోగ్రామింగ్ భాష. వాస్తవ-ప్రపంచ దృశ్యాలలో ఇటువంటి భావనల యొక్క అనువర్తనం చాలా ఉంది. ఈ వ్యాసంలో, పైథాన్లో ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ను ఎలా అమలు చేయాలో చర్చించాము
జావాలో ఒక శక్తికి ఏదో పెంచడం ఎలా
- ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ యొక్క అప్లికేషన్స్
- పైథాన్లో ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ను నిర్మించడం
- OCR ఇంజిన్ యొక్క ప్రయోజనాలు మరియు అప్రయోజనాలు
ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ యొక్క అప్లికేషన్స్
మార్గాలు మరియు ప్రయాణికుల వివరాలను తెలుసుకోవడానికి టికెట్లోని కీలక సమాచారాన్ని స్కాన్ చేయడానికి మరియు గుర్తించడానికి టికెట్ కౌంటర్లు దీనిని విస్తృతంగా ఉపయోగిస్తాయి. కాగితపు వచనాన్ని డిజిటల్ ఫార్మాట్లలోకి మార్చడం, అక్కడ కెమెరాలు అధిక రిజల్యూషన్ ఛాయాచిత్రాలను సంగ్రహిస్తాయి మరియు తరువాత వాటిని ఒక పదం లేదా పిడిఎఫ్ ఆకృతిలోకి తీసుకురావడానికి OCR ఉపయోగించబడుతుంది.
పైథాన్తో OCR పరిచయం “టెస్రాక్ట్” మరియు “ఓర్కాడ్” వంటి బహుముఖ గ్రంథాలయాల చేరికకు ఘనత. ఈ లైబ్రరీలు చాలా మంది కోడర్లు మరియు డెవలపర్లకు వారి కోడ్ డిజైన్ను సరళీకృతం చేయడానికి సహాయపడ్డాయిమరియు వారి ప్రాజెక్టుల యొక్క ఇతర అంశాలపై ఎక్కువ సమయం గడపడానికి వారిని అనుమతించండి. ప్రయోజనాలు అపారమైనవి కాబట్టి, అది ఏమిటో మరియు అది ఎలా జరిగిందో చూద్దాం.
పైథాన్లో ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ను నిర్మించడం
మేము మొదట “పైట్సెరాక్ట్” ఉపయోగించి క్లాస్ చేయాలి. ఈ తరగతి చిత్రాలను దిగుమతి చేసుకోవడానికి మరియు వాటిని స్కాన్ చేయడానికి మాకు సహాయపడుతుంది. ఈ ప్రక్రియలో ఇది “ocr.py” పొడిగింపుతో ఫైళ్ళను అవుట్పుట్ చేస్తుంది. ఈ క్రింది కోడ్ చూద్దాం. ఫంక్షన్ బ్లాక్ “process_image” మనకు లభించే వచనాన్ని పదును పెట్టడానికి ఉపయోగించబడుతుంది.
కింది రూట్ హ్యాండ్లర్ మరియు వ్యూ ఫంక్షన్ అనువర్తనానికి జోడించబడ్డాయి (app.py).
రూటర్ హ్యాండ్లర్ కోడ్
// రూట్ హ్యాండ్లర్ @ app.route ('/ v {oc / ocr'.format (_VERSION), పద్ధతులు = [' POST ']) def ocr (): ప్రయత్నించండి: url = request.json [' image_url '] if' jpg 'url: output = process_image (url) return jsonify (output' output ': output}) else: return jsonify (error' error ':' only .jpg files, దయచేసి '}) తప్ప: return jsonify (error' error ':' మీరు పంపాలని అనుకున్నారా: image 'image_url': 'some_jpeg_url'} '})
OCR ఇంజిన్ కోడ్
// OCR ENGINE దిగుమతి పైల్స్ దిగుమతి పిల్ దిగుమతి నుండి చిత్రం పిల్ దిగుమతి నుండి చిత్రం స్ట్రింగ్ఐఓ దిగుమతి నుండి ఇమేజ్ ఫిల్టర్ url): తిరిగి ఇమేజ్.ఓపెన్ (స్ట్రింగ్ఐఓ (రిక్వెస్ట్స్.జెట్ (url) .కాంటెంట్)) //
దయచేసి దిగుమతులను నవీకరించాలని మరియు API సంస్కరణ సంఖ్యను జోడించాలని నిర్ధారించుకోండి.
దిగుమతి దిగుమతి దిగుమతి నుండి దిగుమతి లాగింగ్ ఫార్మాటర్, ఫ్లాస్క్ దిగుమతి నుండి ఫైల్హ్యాండ్లర్ ఫ్లాస్క్, అభ్యర్థన, ocr దిగుమతి ప్రక్రియ నుండి jsonify _imERS _VERSION = 1 # API వెర్షన్
మేము OCR ఇంజిన్ ఫంక్షన్ యొక్క JSON ప్రతిస్పందనలో “process_image ()” ను జతచేస్తున్నాము. API లోకి మరియు వెలుపల వెళ్లే సమాచారాన్ని సేకరించడానికి JSON ఉపయోగించబడుతుంది. దాన్ని ఇన్స్టాల్ చేయడానికి PIL నుండి “ఇమేజ్” లైబ్రరీని ఉపయోగించి మేము ఆబ్జెక్ట్ ఫైల్లో ప్రతిస్పందనను పాస్ చేస్తాము.
ఈ కోడ్ .jpg చిత్రాలతో మాత్రమే ఉత్తమంగా పనిచేస్తుందని దయచేసి గమనించండి. బహుళ చిత్ర ఆకృతులను కలిగి ఉండే సంక్లిష్ట గ్రంథాలయాలను మేము ఉపయోగిస్తే, అప్పుడు అన్ని చిత్రాలను సమర్థవంతంగా ప్రాసెస్ చేయవచ్చు. ఈ కోడ్ను మీరే ప్రయత్నించడానికి మీకు ఆసక్తి ఉంటే, దయచేసి “పిల్లో” లైబ్రరీ నుండి సేకరించిన PIL ని ఇన్స్టాల్ చేయండి.
& ఎద్దు “app.py” అయిన అనువర్తనాన్ని అమలు చేయడం ద్వారా ప్రారంభించండి:
// $ cd ../home/flask_server/ $ python app.py //
& ఎద్దు అప్పుడు, మరొక టెర్మినల్ పరుగులో:
// $ curl -X POST http: // localhost: 5000 / v1 / ocr -d 'image' image_url ':' some_url '}' -H 'కంటెంట్-రకం: అప్లికేషన్ / json'
ఉదాహరణకి:
// $ curl -X POST http: // localhost: 5000 / v1 / ocr -d 'C' C: UsersakashDownloadsPic1 ':' https://edureka.com/images/blog_images/ocr/ocr.jpg '}' - H 'కంటెంట్-రకం: అప్లికేషన్ / json' output 'అవుట్పుట్': 'ABCDEnFGH I JnKLMNOnPQRST'} //
OCR ఇంజిన్ యొక్క ప్రయోజనాలు మరియు అప్రయోజనాలు
పైథాన్లో OCR ను ఉపయోగించే అనేక అనువర్తనాల్లో, జనాదరణ పొందినది చేతివ్రాత గుర్తింపు. వ్రాతపూర్వక వచనాన్ని పున ate సృష్టి చేయడమే ప్రజలు దీనిని వర్తింపజేస్తారు, తరువాత అసలు లిపిని ఫోటోకాపీ చేయకుండా అనేక కాపీలుగా మార్చవచ్చు. ఇది ఏకరూపత మరియు స్పష్టతను తీసుకురావడం.
PDF లను పాఠాలుగా మార్చడానికి మరియు వాటిని వేరియబుల్స్గా నిల్వ చేయడానికి OCR కూడా ఉపయోగపడుతుంది. ఇది తరువాత అదనపు పనుల కోసం ముందస్తు ప్రాసెసింగ్ మొత్తానికి లోబడి ఉంటుంది. పైథాన్ ప్రపంచంలో OCR యొక్క భావన ప్రయోజనకరమైన అంశంగా అనిపించినప్పటికీ, ఇది ఖచ్చితంగా దాని ప్రతికూలతలను పంచుకుంటుంది.
OCR ఎల్లప్పుడూ 100% ఖచ్చితత్వానికి హామీ ఇవ్వదు. ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ కాన్సెప్ట్స్ సహాయంతో చాలా గంటల శిక్షణ అవసరం, ఇది OCR ఇంజిన్ పేలవమైన చిత్రాలను తెలుసుకోవడానికి మరియు గుర్తించడానికి వీలు కల్పిస్తుంది. చేతివ్రాత చిత్రాలను గుర్తించవచ్చు కాని అవి రచన యొక్క శైలి, పేజీ యొక్క రంగు, చిత్రానికి విరుద్ధం మరియు చిత్రం యొక్క తీర్మానం వంటి అనేక అంశాలపై ఆధారపడి ఉంటాయి.
దీనితో, పైథాన్ వ్యాసంలో ఈ ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ ముగింపుకు వచ్చాము. OCR ఎలా పనిచేస్తుందో మీరు అర్థం చేసుకుంటారని నేను ఆశిస్తున్నాను.
పైథాన్తో పాటు దాని వివిధ అనువర్తనాలతో లోతైన జ్ఞానం పొందడానికి, మీరు చేయవచ్చు 24/7 మద్దతు మరియు జీవితకాల ప్రాప్యతతో ప్రత్యక్ష ఆన్లైన్ శిక్షణ కోసం.
మాకు ప్రశ్న ఉందా? “పైథాన్లో ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్” యొక్క వ్యాఖ్యల విభాగంలో వాటిని పేర్కొనండి మరియు మేము మీ వద్దకు తిరిగి వస్తాము.