ஆப்டிகல் கேரக்டர் ரகசியம் (OCR) என்றால் என்ன?

ஆப்டிகல் கேரக்டர் ரெகக்னிஷன் (OCR) என்பது ஒரு டிஜிட்டல் பதிப்பை உருவாக்குகிறது, இது அச்சிடப்பட்ட, தட்டச்சு செய்யப்பட்ட அல்லது கையால் எழுதப்பட்ட ஆவணத்தை உருவாக்குகிறது. PDF வடிவத்தில் ஸ்கேன் செய்யப்பட்ட ஆவணங்களில் OCR பொதுவாகப் பயன்படுத்தப்படுகிறது, ஆனால் ஒரு படக் கோப்பில் உள்ள கணினியின் படிக்கக்கூடிய உரை உருவாக்க முடியும்.

OCR என்றால் என்ன?

OCR என்பது உரை அங்கீகாரமாக குறிப்பிடப்படுகிறது, இது அச்சிடப்பட்ட அல்லது எழுதப்பட்ட ஆவணங்களிலிருந்து எண்கள், எழுத்துக்கள் மற்றும் சிற்றெழுத்துக்கள் (மேலும் கீற்றுகள் என அழைக்கப்படும்) போன்ற எழுத்துக்களை மாற்றியமைக்கும் மென்பொருள் தொழில்நுட்பமாகும், இது ஒரு மின்னணு வடிவமாகவும், கணினிகள் மற்றும் பிற மென்பொருள் நிரல்களிலும் எளிதாக வாசிக்கப்பட்டு வாசிக்கப்படுகிறது. சில OCR நிரல்கள் ஒரு ஆவணத்தை ஸ்கேன் அல்லது டிஜிட்டல் கேமராவுடன் புகைப்படம் எடுத்துள்ளன, மற்றவர்கள் OCR இல்லாமல் முன்பு ஸ்கேன் அல்லது புகைப்படம் எடுத்த ஆவணங்களுக்கு இந்த செயல்முறையைப் பயன்படுத்தலாம். OCR PDF ஆவணங்களில் தேட அனுமதிக்கிறது, உரையைத் திருத்தவும் மற்றும் மீண்டும் வடிவமைக்கவும் ஆவணங்கள்.

OCR க்கு என்ன பயன்படுத்தப்படுகிறது?

விரைவாக, ஒவ்வொரு நாளும் ஸ்கேனிங் தேவைகளை, OCR ஒரு பெரிய ஒப்பந்தம் அல்ல. நீங்கள் ஸ்கேன் செய்யும் அளவுக்கு பெரிய அளவில் ஸ்கேனிங் செய்தால், உங்களுக்கு தேவையான சரியானவற்றை கண்டுபிடிக்க PDF களில் தேட முடியும் என்றால் உங்கள் ஸ்கேனர் நிரலில் OCR செயல்பாடு மிகவும் முக்கியமானது. OCR உடன் வேறு சில விஷயங்கள் உள்ளன:

ஏன் OCR பயன்படுத்த வேண்டும்?

ஏன் ஒரு படம் எடுக்க வேண்டும், இல்லையா? ஏனெனில் நீங்கள் எதையும் திருத்த முடியாது அல்லது உரையைத் தேட முடியாது, ஏனெனில் இது ஒரு படமாக இருக்கும். ஆவணத்தை ஸ்கேன் செய்து, OCR மென்பொருளை இயக்குவதன் மூலம் நீங்கள் அந்தக் கோப்பை திருத்த முடியும் மற்றும் தேடலாம்.

OCR இன் வரலாறு

1914 ஆம் ஆண்டுக்கான உரை அங்கீகாரம் மிகவும் ஆரம்ப பயன்பாட்டில் இருந்த போதிலும்கூட, OCR தொடர்பான தொழில்நுட்பங்களின் பரவலான பரவலான வளர்ச்சி மற்றும் பயன்பாடு 1950 களில் ஆர்வத்தோடு தொடங்கியது, குறிப்பாக டிஜிட்டல் ரீடேட் ரீஃப்டிங் உரைக்கு எளிதாக மாற்றக்கூடிய மிகவும் எளிதான எழுத்துருக்கள் உருவாக்கப்பட்டுள்ளன. இந்த எளிமையான எழுத்துருக்களில் முதல் டேவிட் ஷெப்பார்ட் உருவாக்கியது மற்றும் பொதுவாக OCR-7B என்று அறியப்பட்டது. கடன் அட்டைகள் மற்றும் டெபிட் கார்டுகள் ஆகியவற்றில் பயன்படுத்தப்படும் நிலையான எழுத்துருவிற்கு OCR-7B இன்றும் நிதி தொழிற்துறையில் பயன்படுத்தப்படுகிறது. 1960 களில், பல நாடுகளில் தபால் சேவைகள் OCR தொழில்நுட்பத்தைப் பயன்படுத்தி, அமெரிக்கா, கிரேட் பிரிட்டன், கனடா மற்றும் ஜேர்மனி உள்ளிட்ட மின்னஞ்சல் வரிசையாக்கத்தை விரைவாக துரிதப்படுத்தியது. OCR இன்னமும் உலகெங்கிலும் தபால் சேவைகளுக்கு அஞ்சல் அனுப்புவதற்கு முக்கிய தொழில்நுட்பம் ஆகும். 2000 ஆம் ஆண்டில், OCR தொழில்நுட்பத்தின் வரம்புகள் மற்றும் திறன்களின் முக்கிய அறிவு, போட்களையும் ஸ்பேமர்களையும் தடுக்க CAPTCHA திட்டங்களை உருவாக்க பயன்படுத்தப்பட்டது.

பல தசாப்தங்களாக, OCR செயற்கை நுண்ணறிவு , இயந்திர கற்றல் , மற்றும் கணினி பார்வை போன்ற தொடர்புடைய தொழில்நுட்ப பகுதிகளில் முன்னேற்றங்கள் காரணமாக மிகவும் துல்லியமான மற்றும் அதிநவீன வளர்ந்துள்ளது. இன்று, ஒ.சி.ஆர் மென்பொருளானது முறைமை அங்கீகாரம், அம்ச கண்டறிதல் மற்றும் உரை செயலாக்கம் ஆகியவற்றைப் பயன்படுத்துகிறது.