Google Books இல் 'Ngram Viewer' கருவி எவ்வாறு பயன்படுத்துவது

ஒரு Ngram, பொதுவாக N-gram என்று அழைக்கப்படுகிறது உரை அல்லது பேச்சு உள்ளடக்கத்தை ஒரு புள்ளிவிவர பகுப்பாய்வு உரை சில வகையான உருப்படியை கண்டுபிடிக்க (ஒரு எண்) கண்டுபிடிக்க. இது அனைத்து வகையான, ஒலிப்புக்கள், முன்னொட்டுகள், சொற்றொடர்கள் அல்லது கடிதங்கள் போன்றது. ஆராய்ச்சியாளருக்கு வெளியே N- கிராம் ஓரளவு தெளிவற்றதாக இருந்தாலும், அது உண்மையில் பல்வேறு துறைகளில் பயன்படுத்தப்படுகிறது, மேலும் இயற்கை மொழி பேசும் மொழியுடன் புரிந்துகொண்டு பதிலளிக்கும் கணினி நிரல்களை உருவாக்கும் மக்களுக்கு நிறைய தாக்கங்கள் உள்ளன. இது, சுருக்கமாக, யோசனை கூகிள் வட்டி இருக்கும்.

Google புத்தகங்கள் Ngram Viewer இன் விஷயத்தில், பகுப்பாய்வு செய்ய வேண்டிய உரை, கூகுள் புக்ஸ் சர்ச் என்ஜினில் விரிவுபடுத்த பொது நூலகங்களிடமிருந்து ஸ்கேன் செய்த புத்தகங்களின் மொத்த அளவிலான புத்தகங்களில் இருந்து வருகிறது. கூகிள் புத்தகங்கள் Ngram Viewer க்கு, நீங்கள் "Corpus." என தேட போகிறீர்கள். Ngram Viewer இல் உள்ள தோழர் மொழியால் பிரிக்கப்படுகிறார், இருப்பினும் நீங்கள் பிரிட்டிஷ் மற்றும் அமெரிக்க ஆங்கிலத்தை தனித்தனியாக பகுப்பாய்வு செய்யலாம் அல்லது அவற்றை ஒன்றிணைக்கலாம். இது பிரிட்டனில் இருந்து அமெரிக்க விதிமுறைகளைப் பயன்படுத்துவதற்கு சுவாரசியமாக இருப்பதுடன், வரைபடங்களை மாற்றுவதையும் பார்க்கிறது.

எப்படி Ngram படைப்புகள்

  1. Books.google.com/ngrams இல் Google Books Ngram Viewer க்குச் செல்க.
  2. Google வலைத் தேடல்களைப் போலல்லாமல், விஷயங்கள் முக்கியமானவை, எனவே சரியான பெயர்ச்சொற்களை முதலீடு செய்வதை உறுதிப்படுத்தவும்.
  3. நீங்கள் பகுப்பாய்வு செய்ய விரும்பும் சொற்றொடர்களையோ சொற்றொடர்களையோ தட்டச்சு செய்க. ஒவ்வொரு வாக்கியத்தையும் ஒரு கமாவால் பிரிக்க வேண்டும். கூகிள் பரிந்துரைக்கிறது, "ஆல்பர்ட் ஐன்ஸ்டீன், ஷெர்லாக் ஹோம்ஸ், ஃபிராங்கண்ஸ்டைன்" நீங்கள் தொடங்குவதற்கு.
  4. அடுத்து, ஒரு தேதி வரம்பில் தட்டச்சு செய்க. இயல்புநிலை 1800 முதல் 2000 வரை உள்ளது, ஆனால் சமீபத்திய புத்தகங்கள் உள்ளன (2011 இன் மிக சமீபத்தில் கூகிள் ஆவணத்தில் பட்டியலிடப்பட்டவை, ஆனால் அது மாறலாம்.)
  5. ஒரு கார்பஸைத் தேர்வு செய்க. நீங்கள் வெளிநாட்டு மொழி நூல்கள் அல்லது ஆங்கிலத்தை தேடலாம், மேலும் தரமான தேர்வுகள் கூடுதலாக, நீங்கள் "ஆங்கிலம் (2009) அல்லது அமெரிக்க ஆங்கிலம் (2009)" போன்றவற்றைக் காணலாம். இவை Google க்கு புதுப்பித்த பழைய முதுகெலும்புகள், ஆனால் பழைய தரவு செட் எதிராக உங்கள் ஒப்பீடுகள் செய்ய சில காரணங்களை நீங்கள் கொண்டிருக்கலாம். பெரும்பாலான பயனர்கள் அவற்றை புறக்கணித்து மிக சமீபத்திய கார்போராவில் கவனம் செலுத்தலாம்.
  6. உங்கள் மென்மையான நிலை அமைக்கவும். ஸ்மார்ட் இறுதியில் வரைகலை எவ்வளவு மென்மையான என்பதை குறிக்கிறது. மிகச் சரியான துல்லியமான பிரதிநிதித்துவம் 0 என்பது ஒரு நறுமண அளவைக் குறிக்கும், ஆனால் அது படிக்க கடினமாக இருக்கலாம். இயல்புநிலை 3 க்கு அமைக்கப்பட்டது. பெரும்பாலான சந்தர்ப்பங்களில், இதை சரிசெய்ய தேவையில்லை.
  1. புத்தகங்கள் பொத்தானை நிறைய தேடுக . (நீங்கள் தேடல் வரியில் நுழையலாம்.)

நோராம் என்ன காட்டுகிறது?

கூகிள் புத்தகங்கள் NGR வியூவர் நேரம் மூலம் புத்தகங்கள் ஒரு குறிப்பிட்ட சொற்றொடர் பயன்படுத்தி பிரதிபலிக்கும் ஒரு வரைபடம் வெளியீடு. நீங்கள் ஒன்றுக்கு மேற்பட்ட வார்த்தை அல்லது சொற்றொடர் உள்ளிட்டிருந்தால், வெவ்வேறு தேடல் சொற்களுக்கு மாறுபட்ட வண்ண கோடு கோடுகள் இருக்கும். இது Google Trends க்கு மிகவும் ஒத்திருக்கிறது, தேடல் மட்டுமே நீண்ட காலமாகக் கொண்டிருக்கிறது.

இங்கே ஒரு நிஜ வாழ்க்கை உதாரணம்.நாம் சமீபத்தில் வினிகர் துண்டுகள் பற்றி ஆர்வமாக இருந்தோம். அவர்கள் பிரையர் தொடரில் லாரா இங்கால்ஸ் வைல்டர் லிட்டில் ஹவுஸ் குறிப்பிடப்பட்டுள்ளது, ஆனால் நாம் ஒரு விஷயம் பற்றி கேட்டதில்லை. வினிகர் துண்டுகள் பற்றி மேலும் அறிய Google இன் வலைத் தேடல் முதலில் பயன்படுத்தினோம். வெளிப்படையாக, அவர்கள் அமெரிக்க தெற்கு உணவு பகுதியாக கருதப்படுகிறது மற்றும் உண்மையில் காடி இருந்து தயாரிக்கப்படுகின்றன. ஒவ்வொரு வருடமும் புதிய உற்பத்திகளை அனைவருக்கும் கிடைக்காதபோது அவர்கள் மீண்டும் மீண்டும் கேட்கிறார்கள். அது முழு கதையா?

நாங்கள் Google Ngram Viewer ஐ தேடினோம், 1800 களின் பிற்பகுதியிலும் பிற்பகுதியிலும் சில குறிப்புகள் உள்ளன, 1940 களில் நிறைய குறிப்புகளும், அண்மைக்காலங்களில் (ஒருவேளை சில பை ஞாபக சக்தி.) சில குறிப்புகள் உள்ளன. ஒரு நேர்மறையான தரவின் தரவிற்கான சிக்கல் 3. 1800 களில் குறிப்பிட்டுள்ள ஒரு பீடபூமி உள்ளது. ஒவ்வொரு வருடமும் ஐந்து ஆண்டுகளுக்கு ஒரு குறிப்பிட்ட பை என்ற எண்ணின் சமமான எண்ணிக்கையிலா? என்ன நடக்கிறது என்று அந்த நேரத்தில் வெளியிடப்பட்ட புத்தகங்கள் நிறைய இல்லை, ஏனெனில் மற்றும் எங்கள் தரவு மென்மையாக்க அமைக்க ஏனெனில், அது படம் திரிக்கப்பட்ட. ஒருவேளை வினிகர் பை குறிப்பிட்ட ஒரு புத்தகம் இருந்தது, அது ஒரு ஸ்பைக் தவிர்க்க சராசரியாக கிடைத்தது. 0-க்கு 0-ஐ மாற்றியமைப்பதன் மூலம், இதுவே சரியாக இருக்கும் என்று நாம் பார்க்கலாம். 1869 ஆம் ஆண்டில் ஸ்பைக் மையம், மற்றும் 1897 மற்றும் 1900 இல் மற்றொரு ஸ்பைக் உள்ளது.

மற்ற நேரங்களில் வினிகரைப் பற்றி யாரும் பேசவில்லையா? அவர்கள் ஒருவேளை அந்த துண்டுகள் பற்றி பேசினேன். எல்லா இடங்களிலும் மிதக்கும் உணவுகள் அங்கு இருந்தன. அவர்கள் புத்தகங்களைப் பற்றி எழுதவில்லை , இது இந்த Ngram தேடல்களின் வரம்புக்குட்பட்டது.

மேம்பட்ட NGR தேடல்கள்

Ngrams பல்வேறு உரை தேடல்களின் அனைத்து வகைகளையும் உள்ளடக்கியது என்று நாங்கள் எப்படிச் சொன்னோம் என்பதை நினைவில் வையுங்கள். NGR பார்வையாளருடன் ஒரு பிட் துறையைச் சேர்ப்பதற்கு Google உங்களை அனுமதிக்கிறது. மீனைப் பதிலாக நார்மலாகப் பதிலாக மீன் தேடுவதற்கு நீங்கள் விரும்பினால், நீங்கள் குறிச்சொற்களைப் பயன்படுத்தி அவ்வாறு செய்யலாம். இந்த வழக்கில், நீங்கள் "fish_VERB"

கூகுள் தனது இணையதளத்தில் நீங்கள் பயன்படுத்தக்கூடிய முழுமையான கட்டளைகளையும், பிற மேம்பட்ட ஆவணங்களையும் வழங்குகிறது.