கே-க்ளஸ்டரிங் என்றால் என்ன?

K- பொருள் வழிமுறையுடன் தரவு செயலாக்கம்

K - க்ளஸ்டரிங் வழிமுறையானது தரவு உறவு மற்றும் இயந்திர கற்றல் கருவியாகும், அந்த உறவுகளை எந்தவொரு முன்னறிமான அறிவும் இன்றி, தொடர்புடைய கருத்துக்கள் குழுக்களாக கிளஸ்டர் கண்காணிப்புக்கு பயன்படுத்தப்படும். மாதிரி மூலம், அல்காரிதம் எந்த வகை, அல்லது க்ளஸ்டர், தரவு சேர்ந்தவை, க்ளஸ்டர் எண்ணிக்கை மதிப்பு k மூலம் வரையறுக்கப்படுகிறது .

K- வழி வழிமுறையானது எளிய கிளஸ்டெர் உத்திகளில் ஒன்றாகும், மேலும் இது பொதுவாக மருத்துவ இமேஜிங், உயிரியளவுகள் மற்றும் தொடர்புடைய துறைகளில் பயன்படுத்தப்படுகிறது. K- ன் நன்மை என்பது க்ளஸ்டரிங் என்பது உங்கள் தொடக்க தரவு (அல்காரிதம் மேற்பார்வை செய்யப்பட்ட படிவத்தைப் பயன்படுத்தி) தரவைப் பற்றிய படிமுறைக்கு அறிவுறுத்துவதைக் காட்டிலும் (அதன் மேற்பார்வையற்ற படிவத்தைப் பயன்படுத்தி) அதைப் பற்றி சொல்கிறது.

இது லாயிட் அல்காரிதம் என குறிப்பிடப்படுகிறது, குறிப்பாக கணினி விஞ்ஞான வட்டாரங்களில், 1957 இல் ஸ்டூவர்ட் லாய்ட் முதலில் ஸ்டூவர்ட் லாய்ட் முன்மொழியப்பட்டது. "K-means" என்ற வார்த்தை 1967 ஆம் ஆண்டில் ஜேம்ஸ் மெக்யூயினால் உருவாக்கப்பட்டது.

எப்படி k- பொருள் வழிமுறை பணிகள்

K- வழி வழிமுறை என்பது அதன் பரிணாம வழிமுறை ஆகும், அது அதன் செயல்பாட்டிலிருந்து அதன் பெயர் பெறுகிறது. K குழுக்களாக அல்காரிதம் கிளாசர்களைப் பார்ப்பது, அங்கு k உள்ளீடு அளவுருவாக வழங்கப்படுகிறது. அது ஒவ்வொரு கவனிப்பும் கொத்துகளுடனான கவனிப்புக்கு அருகாமையில் இருப்பதன் அடிப்படையில் கொத்தாக அளிக்கிறது. கிளஸ்டரின் சராசரி பின்னர் சரிசெய்யப்பட்டு மறுபடியும் தொடங்குகிறது. படிமுறை எவ்வாறு செயல்படுகிறது:

  1. அல்காரிதம் தன்னிச்சையாக ஆரம்ப க்ளஸ்டர் மையங்கள் (அதாவது) என k புள்ளிகளைத் தேர்ந்தெடுக்கிறது.
  2. தரவுத்தொகுப்பிலுள்ள ஒவ்வொரு புள்ளியும் ஒவ்வொரு புள்ளியிலும் ஒவ்வொரு கிளஸ்டர் மையத்திலும் யூக்லிடியன் தூரத்தை அடிப்படையாகக் கொண்ட மூடிய கிளஸ்டருக்கு ஒதுக்கப்பட்டுள்ளது.
  3. ஒவ்வொரு கிளஸ்டர் மையமும் அந்த கிளஸ்டில் உள்ள புள்ளிகளின் சராசரியாக சரிசெய்யப்படுகிறது.
  4. க்ளஸ்டர்கள் குவிந்து செல்லும் வரை 2 மற்றும் 3 படிகளைப் படியுங்கள். ஒத்திசைவு செயலாக்கத்தைப் பொறுத்து வேறுபட்டதாக வரையறுக்கப்படலாம், ஆனால் வழக்கமாக இது 2 மற்றும் 3 படிநிலைகள் திரும்பும்போது எந்த அவதானிகளும் மாறாத மாற்றங்கள் அல்லது மாற்றங்கள் கிளஸ்டர்களின் வரையறையில் ஒரு மாறுபட்ட வித்தியாசத்தை ஏற்படுத்தாது என்பதாகும்.

க்ளஸ்டர்களின் எண்ணிக்கையைத் தேர்ந்தெடுக்கும்

K க்கு முக்கிய குறைபாடுகளில் ஒன்று - வழிமுறைக்கு ஒரு உள்ளீடு என க்ளஸ்டர்களைக் குறிப்பிட வேண்டும் என்பதுதான் க்ளஸ்டரிங். வடிவமைக்கப்பட்டபடி, நெறிமுறை சரியான கிளஸ்டர்களை தீர்மானிப்பதற்கும், பயனர் இதை முன்கூட்டியே அடையாளப்படுத்துவதற்கும் பொறுத்தது.

உதாரணமாக, நீங்கள் ஆண் அல்லது பெண் என பைனரி பாலின அடையாளத்தை அடிப்படையாகக் கொண்ட குழுவினர் இருந்தால், k- வழிமுறையை k = 3 எனக் குறிப்பிடுவதன் மூலம் மக்களை மூன்று கிளஸ்டர்களாக இரண்டு அல்லது இரண்டு அல்லது இரண்டு k = 2 இன் உள்ளீடு, மிகவும் இயல்பான பொருத்தம் அளிக்கப்படும்.

இதேபோல், தனிநபர்களின் ஒரு குழுவானது சொந்த மாநிலத்தின் அடிப்படையில் எளிதில் கிளஸ்டர் செய்யப்பட்டிருந்தால், k - 20 என்ற உள்ளீடு k = 20 உடன் வழிமுறையை அழைக்கலாம், முடிவுகள் பயனுள்ளதாக இருக்கும்.

இந்த காரணத்திற்காக, உங்கள் தரவிற்கான சிறந்த மதிப்பைக் கண்டறிவதற்கு k இன் வெவ்வேறு மதிப்புகளுடன் முயற்சிக்க இது ஒரு நல்ல யோசனை. இயந்திர அறிவாற்றலுக்கான அறிவைத் தேடுவதில் பிற தரவு சுரங்க வழிமுறைகளைப் பயன்படுத்துவதை நீங்கள் விரும்பலாம்.