லினக்ஸ் குரல் அங்கீகாரம் மாநில

அறிமுகம்

நான் கட்டுரைகளை ஆராய்ச்சி நேரம் நிறைய செலவழிக்கிறேன் மற்றும் அடிக்கடி நான் ரயில் நிலையம் அல்லது பொதுவாக மற்றும் பற்றி பொதுவாக ஒரு கட்டுரையில் பொருள் பற்றி யோசிக்கிறேன்.

ஒரு மாலை என் வேலையில் இருந்து 1.5 மைல் தூரத்தில் நடந்து கொண்டிருந்தேன், "நான் என்ன சொல்ல விரும்புகிறேனோ அதை பதிவு செய்ய முடியுமா என்று நினைத்தேன், பிறகு நான் அதைத் திருத்திக் கொள்ளவும், பின்னர் அதை வடிவமைக்கவும் முடியும், .

லினக்ஸில் டிக்டேஷன் மென்பொருளைப் பயன்படுத்தி மைக்ரோஃபோன் மூலம் நேரடியாக பதிவு செய்தல், எம்பி 3 அல்லது WAV வடிவமைப்புக்கு கோப்பை பதிவு செய்தல் மற்றும் கட்டளை வரியின் மூலம் மாற்றுவது, அதேபோல் குரோம் மற்றும் அண்ட்ராய்டு பயன்பாடுகள்.

இந்த கட்டுரை கடின உழைப்பு நாட்களுக்கு பிறகு என் கண்டுபிடிப்பை உயர்த்தி காட்டுகிறது.

லினக்ஸ் விருப்பங்கள்

லினக்ஸில் டிக்ஷனிங் மற்றும் குரல் அடையாளம் காணும் மென்பொருளை கண்டுபிடிக்க முயற்சிப்பது அவ்வளவு எளிதானது அல்ல, கிடைக்கக்கூடிய விருப்பங்கள் புத்திசாலி அல்ல.

இந்த விக்கிபீடியா பக்கம் CMU Sphinx, ஜூலியஸ் மற்றும் சைமன் உள்ளிட்ட சாத்தியமான விருப்பங்களின் பட்டியலைக் கொண்டுள்ளது.

நான் இப்போது டெபியி டெலிங்கை அடிப்படையாகக் கொண்ட SparkyLinux ஐ பயன்படுத்துகிறேன், களஞ்சியங்களில் மட்டுமே குரல் அங்கீகரிப்பு தொகுப்பு Sphinx என்று சொல்ல முடியும்.

நான் முயற்சித்த முடிவுக்கு வந்த லினக்ஸ் லினக்ஸ் நிரல்களானது பாக்கெட்ஸ்பிங்க்ஸ் ஆகும், நான் WAV கோப்புகளை உரையிலும் Freespeech-VR க்காகவும் மாற்றினேன், இது ஒரு பைதான் பயன்பாடாக உள்ளது, இது ஒரு மைக்ரோஃபோனில் இருந்து நேராக பதிவு செய்ய உதவுகிறது.

குரல்நொட் II மற்றும் டிக்டானோட் உள்ளிட்ட இரண்டு Chrome பயன்பாடுகளையும் நான் முயற்சித்தேன்.

இறுதியாக நான் "டிக்டேஷன் மற்றும் மின்னஞ்சல்" மற்றும் "பேச்சு மற்றும் பேச்சு டிக்டேஷன்" அண்ட்ராய்டு ஆப்ஸ் முயற்சி.

Freespeech-வி.ஆர்

Freespeech-VR நிலையான களஞ்சியங்களில் கிடைக்கவில்லை. நான் இங்கே இருந்து கோப்புகளை பதிவிறக்கம்.

Zip கோப்பின் உள்ளடக்கங்களை பதிவிறக்கம் செய்து பிரித்தெடுத்த பிறகு, நான் ஒரு முனையத்தை திறந்து கோப்புகளைப் பிரித்தெடுக்கப்பட்ட கோப்புறையில் செல்லவும்.

நான் freespeech-vr திறக்க பின்வரும் கட்டளை தட்டச்சு.

sudo பைதான் freespeech-vr

நான் ஒரு ஜோடி ஹெட்ஃபோன்கள் ஒரு மிகவும் ஒழுக்கமான ஒலிவாங்கி மற்றும் ஒரு தெளிவான தெற்கு ஆங்கிலம் உச்சரிப்பு கொண்டிருக்கிறது.

பின்வரும் உரையானது freespeech-vr window இல் தோன்றியது:

விளைவு அலகு நாய்களுக்கு வரவேற்கிறோம் இன்று சோதனைகள் நிர்வகிக்கப்படுவதை உறுதிசெய்வது உரைக்கு எப்போது ஒரு முறை வழிமுறையைப் பயன்படுத்துகிறது என்பதைப் பேச வேண்டும் பேச்சு நான் ஒவ்வொருவருக்கும் ஒரே ஒரு நிலையில் இருப்பதால், ஒரு கோழிகள் தங்கமாக இருப்பதால், Ea இது என் பெயர் அடுத்த பெயர் தொலைபேசி அழைப்பு இந்த கோப்பு விரைவில் போதுமான ஒரு வழக்கு தொலைபேசி ஹேண்ட்ஸ்-ஸ்பேஸ் Going இது ஒரு தொலைபேசிகள் பகிர்ந்து கொள்ளப்படும் ஒரு பயிற்சி மற்றும் கருவிகள் கருவிகள் பேசும் பயன்படுத்த நீங்கள் முடிந்ததும் ஒரு பயன்படுத்தப்படும் கோப்பு கடைசியாக ஒரு கதை ஒரு மற்றும் ஒரு பயன்படுத்தி போது அது எவ்வளவு வெற்றிகரமாக இந்த லினக்ஸ் இருந்தது நீங்கள் தவிர்க்க வேண்டும்

நான் இந்த நாய்களின் வலைத்தளத்தின் யூனிட் அல்ல, எப்போது வேண்டுமானாலும் கோல்டன் கோழிகளைப் பற்றி எதுவும் குறிப்பிடவில்லை என்று இப்போது சொல்ல விரும்புகிறேன். குரல் அங்கீகார மென்பொருளைப் பயன்படுத்துவதற்கான செயல்முறையை நான் விவரிக்க முயற்சிக்கிறேன்.

நான் மென்பொருளை ஒரு சில முறை முயற்சித்தேன்.

PocketSphinx

PocketSphinx ஒரு WAV கோப்பை எடுத்து கட்டளை வரி பயன்படுத்தி உரை மாற்ற முடியும்.

டெபாசிசு களஞ்சியங்கள் வழியாக பாக்கெட்ஸ்ஃபின்ஸ்கள் கிடைக்கின்றன, பெரும்பாலான விநியோகங்களுக்கு கிடைக்க வேண்டும்.

நான் PocketSphinx உடன் காணப்படும் முக்கியப் பிரச்சினை, குரல் அறிதல், மொழி கோப்புகள், அகராதிகள் மற்றும் கணினியை எவ்வாறு பயிற்றுவிப்பது என்ற கருத்தில் நீங்கள் ஒரு பட்டம் தேவை என்பதைக் குறிக்கிறது.

PocketSphinx ஐ நிறுவிய பின் CMU Sphinx வலைத்தளத்திற்கு சென்று முடிந்தவரை அதிகமான தகவலைப் படிக்க வேண்டும். நீங்கள் பின்வரும் மாதிரி கோப்பை பதிவிறக்க வேண்டும்.

(நீங்கள் ஒரு சொந்த ஆங்கிலம் பேச்சாளர் இல்லை என்றால் நீங்கள் பொருத்தமான என்று மொழி மாதிரி தேர்வு).

பொதுவாக PocketSphinx மற்றும் Sphinx க்கான ஆவணங்கள் லேயர் நபரைப் புரிந்து கொள்ளுவது கடினம் ஆனால் அகராதியில் கோப்புகள் பயன்படுத்தக்கூடியவையாகும், சாத்தியமான சொற்களின் பட்டியல் மற்றும் மொழி மாதிரிகள் வழங்குவதற்கான சாத்தியமான உச்சரிப்புகளின் பட்டியலைக் கொடுக்க முடியும்.

PocketSphinx ஐ சோதிக்க நான் என் சொந்த குரல், அல் பசினோ இருந்து "டெவில்ஸ் வழக்கறிஞர்" மற்றும் "மோர்கன் ஃப்ரீமேன்" ஒரு துணுக்கை இருந்து ஒரு துணுக்கை ஒரு பதிவு பயன்படுத்தப்படுகிறது. இது வேறுபட்ட குரல்களுக்கு முயற்சி செய்வதுதான். என்னைப் பொறுத்தவரையில் மோர்கன் ஃப்ரீமேன் என்ற ஒரு கதையை யாரும் சொல்ல முடியாது, யாரும் அல் பசினோவைப் போன்ற ஒரு வரியை வழங்கவில்லை.

PocketSphinx வேலை செய்ய அது ஒரு WAV கோப்பு தேவைப்படுகிறது மற்றும் அது ஒரு குறிப்பிட்ட வடிவத்தில் இருக்க வேண்டும். கோப்பு MP3 வடிவத்தில் இருந்தால், ffmpeg கட்டளையை அதை WAV வடிவமாக மாற்றவும்:

ffmpeg -i inputfilename.mp3 -acodec pcm_s16le -ar 16000 outputfilename.wav

PocketSphinx ஐ இயக்க பின்வரும் கட்டளையைப் பயன்படுத்தவும்:

pocketsphinx_continuous -dict /usr/share/pocketsphinx/model/lm/en_US/cmu07a.dic -infile voice2.wav -lm cmusphinx-5.0-en-us.lm 2> voice2.log

pocketsphinx_continuous ஒரு WAV கோப்பை எடுத்து உரைக்கு மாற்றியமைக்கிறது.

பாக்கெட்ஃபின்ஸின் மேலே உள்ள கட்டளையில் "/usr/share/pocketsphinx/model/lm/en_US/cmu07a.dic" எனும் மொழி கோப்பகத்தை "cmusphinx-5.0-en-us.lm" மொழி மாதிரியைப் பயன்படுத்தி கூறப்படுகிறது. உரை மாற்றப்படும் கோப்பு voice2.wav என்று அழைக்கப்படுகிறது (இது நான் என் குரலில் செய்த ஒரு பதிவு ஆகும்). இறுதியாக 2> அனைத்து verbose வெளியீட்டையும் உங்களுக்கு அளிக்கிறது, இது voice2.log என்ற கோப்பில் அவசியம் தேவையில்லை. சோதனைகளின் உண்மையான முடிவு முனைய சாளரத்தில் காட்டப்படும்.

என் குரல் பயன்படுத்தி முடிவு பின்வருமாறு:

அடுத்த வாரம் ஒரு வாரம் அறியாமை மென்பொருளைப் பற்றி எந்தவொரு வரியும் வராது

முடிவுகள் ஃப்ரீஸ்ஸ்பெக்- vr போலவே பயங்கரமானவை அல்ல, ஆனால் இன்னும் உண்மையில் உபயோகமாக இல்லை. நான் அல் பாசினோவுடன் பாக்கெஸ்கைன்ஸைப் பயன்படுத்தி முயற்சி செய்தேன், ஆனால் இது எந்த முடிவுகளையும் தரவில்லை.

இறுதியாக நான் மோர்கன் ஃப்ரீமேனின் குரலை "ப்ரூஸ் ஆல்மைட்டி" படத்தில் இருந்து பயன்படுத்திக் கொண்டேன், இங்கே கிடைத்த முடிவுகள்:

000000000: நாங்கள் அவளுடன் இருப்போம்
000000001: இப்போது அந்த கடுமையான ஆமாம் என்று இப்போது yeah இந்த நாம் உயிருடன் இருந்திருக்கிறேன் மிகவும் நான் ஹாட் மூலம் பகுதியாக இருக்கிறேன்
000000002: உயிர்க்கொல்லி யார் பேஸ்பால் ஒரு பிட் முக்கிய வெளியே அல்லது வாழ்க்கையில் என்ன செய்ய வேண்டும் என்று எனக்கு தெரியும்
000000003: மீள்பொருள்கள் எவை?
000000004: அவர்கள் அதை எழுதவில்லை
000000005: அவர்கள் என்னை வலது பக்கம் வைத்திருக்கிறார்கள்
000000006: நீங்கள் விதிகள் இருக்க வேண்டும்
000000007: நான் உன்னை எதிர்பார்த்திருக்கிறேன்
000000008: அவர் கொலோசெயர் கிறிஸ்துமஸ் கட்சி ஒரு விளக்கம் என்று இங்கே கற்று
000000009: இது o எழுத எழுத ஒரு வழி மாறிவிடும். நான் நினைத்தேன் கழுவி சில எப்போதும் அணிய
000000010: பிரச்சனை ஒற்றுமையாக அவர் நான் உலகில் நான் நினைக்கிறேன் என்று அனைத்து இல்லை போது நான் அந்த நேரத்தில் அவர்கள் மதிப்பிட நான் நல்ல கொடுக்க மாட்டேன் வீடுகள் நான் பார்த்திருக்கிறேன் என்று
000000011: இது ஒரு தந்தை
000000012: இதைப் பற்றி என்ன நிறைய இருக்கிறது
000000013: கொடுக்கப்பட்டது
000000014: எல்லாவற்றிற்கும் நிறைய விழாதீர்கள்
000000015: சரியான வீழ்ச்சி
000000016: நன்றாக எனக்கு பிடி
000000017: நான் அவர்கள் ஒரு திருமணம் என்று அனைத்து என்று நாம் ஒரு போகிறது என்று கூட ஒரு மகிழ்ச்சியற்ற இல்லை நான் வழியில் போலல்லாமல் விரும்பவில்லை

என் சோதனை அரிதாக விஞ்ஞானமாக கருதப்படுகிறது மற்றும் பாக்கெச்பின்ஸின் டெவலப்பர்கள் நான் மென்பொருளை சரியாக பயன்படுத்துவதில்லை என்று கூறலாம். குரல் பயிற்சி என்று அழைக்கப்படும் ஒரு நுட்பமும் உள்ளது, இது சிறந்த அகராதிகள் மற்றும் மொழி கோப்புகளை உருவாக்க பயன்படுகிறது.

இருப்பினும், என் ஆழ்ந்த கருத்து, தரமான தினசரி பயன்பாட்டிற்கு மிகவும் கடினம் என்பதுதான்.

குரல்நூட்டு II

VoiceNote II என்பது Google Voice recognition API ஐப் பயன்படுத்தும் ஒரு Chrome பயன்பாடாகும்.

நீங்கள் Chrome அல்லது Chromium உலாவிகளைப் பயன்படுத்துகிறீர்கள் என்றால், நீங்கள் வலை ஸ்டோர் வழியாக VoiceNote II ஐ நிறுவ முடியும்.

VoiceNote II இல் உள்ள சின்னங்கள் வித்தியாசமான முறையில் வடிவமைக்கப்பட்டுள்ளன, மேலும் சாளரத்தின் கீழே உள்ள மொழியை அமைப்பது மற்றும் திருத்தும் பொத்தானும் கீழே உள்ளது, இருப்பினும் பதிவு பொத்தானை மேல் வலதுபுறத்தில் உள்ளது.

நீங்கள் செய்ய வேண்டிய முதல் விஷயம் ஒரு மொழியை தேர்ந்தெடுத்து, உலக ஐகானைக் கிளிக் செய்வதன் மூலம் இது அடைய முடியும்.

பதிவுசெய்யத் தொடங்குவதற்கு, மைக்ரோஃபோன் ஐகானைக் கிளிக் செய்து, மைக்ரோஃபோனில் பேசுங்க. மிகச் சிறந்த முடிவுகளுக்கு மெதுவாக பேசுவதைக் கண்டேன், மென்பொருள் மென்பொருளை வைத்திருக்க வாய்ப்பு கிடைத்தது.

முடிவுகள் கீழே காணப்பட முடியாதவை அல்ல:

வணக்கம் மற்றும் இணைக்க வரவேற்கிறேன். Text convert to dunelm farrell மந்தநிலை 2008 க்கு மாற்றங்கள் மற்றும் மாற்றங்கள் 2014.bian அல்லது rpm தொகுப்பு காட்ட குரல் உரை addon சிறந்த வழி ஆதரவு நீங்கள் உரையை திறக்க உரை திறக்க உரை திறக்க எடின்பர்க் பிரஞ்சு ஜேர்மனியில் எடின்பர்க் பிரஞ்சு ஜேர்மனியில் தேர்வு நீங்கள் கடல் மைக்ரோஃபோனில் நீங்கள் நேரம் ஒரு உரை கோப்பு உங்கள் உரை எழுதி முடிந்ததும் நன்றாக அது மிகவும் சிறந்த இங்கிலாந்து ஆங்கிலம் இருந்து மிகவும் தரமான ஆங்கிலம் உச்சரிப்பு தான் ஆனால் நான் இந்த torrentalong textvia போகிறேன் உண்மையான ஆவணத்துடன் நீங்கள் கேட்பதற்கே உங்களைப் பழிப்பதற்கான தவறுகளை நீங்கள் காணலாம்

Dictanote

டிக்டானோட் என்பது மற்றொரு குரங்கு ஆப் ஆகும், இது டிக்டேஷன் நோக்கங்களுக்காக பயன்படுத்தப்படக்கூடியது மேலும் மேலும் உள்ளுணர்வுடனும் இருப்பதுபோல் தோன்றியது, ஆனால் முடிவுகள் VoiceNote II ஐ விட சிறந்தவை அல்ல.

நான் டிக்னானோட்டின் டெமோ பதிப்பை மட்டுமே பயன்படுத்துகிறேன், இது உங்களை புதிய ஆவணங்களை உருவாக்குவதை தடுக்கிறது, ஆனால் நீங்கள் ஏற்கனவே ஆசிரியரிடமிருந்த உரைக்கு மேல் பேசுவதை அனுமதிக்கிறது. நான் குரல் அங்கீகாரம் சோதிக்க முடிந்தது ஆனால் முடிவு VoiceNote II விட சிறந்தது, அதனால் நான் சார்பு பதிப்பு பதிவு செய்யவில்லை.

டிக்டேஷன் அண்ட் மெயில்

"டிக்டேஷன் அண்ட் மெயில்" என்பது அண்ட்ராய்டு அப்ளிகேஷன் ஆகும், இது உள்ளூர் கூகுள் குரல் அங்கீகரிப்பு API ஐ பயன்படுத்துகிறது.

"டிக்டேஷன் அண்ட் மெயில்" முடிவுகளானது, வேறு எந்த திட்டத்தையும் விட இந்த விடயத்தில் முயற்சி செய்ததைவிட மிகச் சிறந்தது.

லினக்ஸ் பற்றி லினக்ஸ் வரவேற்பு., இன்று நாம் உரைக்கு ஒலி மாற்றுவதைப் பற்றி பேசுகிறோம்

"டிக்டேஷன் அண்ட் மெயில்" உடனான தந்திரம் மெதுவாக பேசுவதோடு, உச்சரிப்புடன் நீங்கள் ஒரு உச்சரிப்பைக் கொண்டிருக்கும்.

நீங்கள் பேசிய முடிந்தபிறகு முடிவுகளை உங்களுக்கு மின்னஞ்சல் அனுப்பலாம்.

பேச்சு மற்றும் பேச்சு டிக்டேஷன்

நான் முயற்சித்த பிற Android பயன்பாடு "பேச்சு மற்றும் பேச்சு டிக்டேஷன்".

இந்த பயன்பாட்டிற்கான இடைமுகம் கொத்து சிறந்த மற்றும் குரல் அங்கீகாரம் உண்மையில் நன்றாக வேலை. ஆணையை பதிவு செய்தபின், மின்னஞ்சல் மூலம் உள்ளிட்ட பல்வேறு வழிகளில் முடிவுகளை பகிர்ந்து கொள்ள முடிந்தது.

லினக்ஸில் about.com க்கு வரவேற்பு இன்று பேச்சு உரையாடலைப் பற்றி பேசுகிறோம்

உன்னால் முடிந்ததைப் பார்க்க முடிந்தால், உன்னால் முடிந்தவரை எதிர்பார்க்க முடியும் என தெளிவாக தெரிகிறது. மெதுவாக பேசுவது முக்கியமானது.

சுருக்கம்

இவரது லினக்ஸ் குரல் அங்கீகாரம் மற்றும் குறிப்பாக ஆணவத்துடன் தொடர்பு கொள்ள சில வழிகள் உள்ளன. Google Voice API ஐப் பயன்படுத்தும் சில பயன்பாடுகள் உள்ளன ஆனால் அவை இன்னும் களஞ்சியங்களில் பட்டியலிடப்படவில்லை.

ChromeOS பயன்பாடுகள் சிறிது சிறப்பாக இருக்கின்றன, ஆனால் என் Android தொலைபேசியைப் பயன்படுத்தி சிறந்த முடிவுகளை எட்டியது. ஒருவேளை தொலைபேசிக்கு ஒரு சிறந்த ஒலிவாங்கி உள்ளது, எனவே குரல் அங்கீகார மென்பொருளானது மாற்றத்திற்கான சிறந்த வாய்ப்பு உள்ளது.

உண்மையில் பொருந்தக்கூடியனவாக குரல் அங்கீகாரத்திற்காக குறைவான அமைப்பு தேவைப்பட்டால் மேலும் உள்ளுணர்வுடன் இருக்க வேண்டும். மொழி மாதிரிகள் மற்றும் அகராதிகள் ஆகியவற்றை புரிந்துகொள்ளும் பொருட்டு நீங்கள் குழப்பம் தேவையில்லை.

உலகம் முழுவதிலும் பயன்படுத்தப்படும் நூற்றுக்கணக்கான மொழிகளைப் பற்றி கவலைப்படாத ஒரு நாட்டில், பிராந்தியத்தில் இருந்து பல பிராந்தியங்கள் உள்ளன, ஏனென்றால் எல்லோருக்கும் வேறுபட்ட குரல் இருப்பதால், குரல் அங்கீகாரத்தின் முழு கலை மிகவும் சவாலானது என்பதை நான் பாராட்டுகிறேன்.

ஆகையால், என் பகுப்பாய்வு, குரல் அறிதல் மென்பொருள் இன்னும் முன்னேற்றம் வேலை என்று ஆகிறது.