புள்ளிவிவரங்கள் உங்கள் இன்பாக்ஸை சுத்தமாக வைத்திருப்பது எப்படி என்பதை அறியவும்
பேயீசியன் ஸ்பேம் வடிப்பான்கள் அதன் உள்ளடக்கங்களின் அடிப்படையில் ஸ்பேம் என்ற செய்தி நிகழ்தகவு கணக்கிடலாம். எளிமையான உள்ளடக்கத்தை அடிப்படையாகக் கொண்ட வடிகட்டிகளைப் போலல்லாமல், பேயேஸியன் ஸ்பேம் வடிகட்டுதல் ஸ்பேம் மற்றும் நல்ல அஞ்சல் ஆகியவற்றிலிருந்து கற்றுக் கொள்கிறது, இதன் விளைவாக மிகவும் வலுவான, தழுவி மற்றும் திறமையான ஸ்பேம் எதிர்ப்பு அணுகுமுறை விளைவாக, எல்லாவற்றிற்கும் மேலாக தவறான எந்த தவறான நிலைப்பாட்டையும் அளிக்கிறது.
நீங்கள் குப்பை மின்னஞ்சலை எவ்வாறு அங்கீகரிக்கிறீர்கள்?
நீங்கள் ஸ்பேமை எவ்வாறு கண்டறிவது என்பதைச் சிந்தித்துப் பாருங்கள். ஒரு விரைவு பார்வை போதும். ஸ்பேமைப் போல் என்னவென்று உங்களுக்குத் தெரியும், நல்ல மின்னஞ்சல் என்னவென்று உங்களுக்குத் தெரியும்.
நல்ல மின்னஞ்சலைப் போல ஸ்பேமின் நிகழ்தகவு சுற்றி ... பூஜ்யம்.
உள்ளடக்க-அடிப்படையிலான வடிப்பான்களை மதிப்பீடு செய்ய வேண்டாம்
தானாக ஸ்பேம் வடிகட்டிகள் அப்படி செய்திருந்தால் நன்றாக இருக்கும், இல்லையா?
உள்ளடக்கத்தை அடிப்படையாகக் கொண்ட ஸ்பேம் வடிப்பான்களைச் சோதித்துப் பாருங்கள். ஸ்பேமின் பொதுவான வார்த்தைகள் மற்றும் பிற பண்புகளை அவர்கள் தேடுகிறார்கள். ஒவ்வொரு சிறப்பியல்பு உறுப்பு ஒரு ஸ்கோர் ஒதுக்கப்படுகிறது, மற்றும் முழு செய்தி ஒரு ஸ்பேம் ஸ்கோர் தனிப்பட்ட மதிப்பெண்களை இருந்து கணக்கிடப்படுகிறது. சில ஸ்கோரிங் வடிப்பான்கள் முறையான மெயிலின் சிறப்பியல்புகளைப் பார்க்கவும், செய்தியின் இறுதி மதிப்பைக் குறைக்கும்.
ஸ்கோரிங் வடிகட்டிகள் அணுகுமுறை வேலை செய்கிறது, ஆனால் பல குறைபாடுகள் உள்ளன:
- சிறப்பியல்புகளின் பட்டியல் ஸ்பேம் (மற்றும் நல்ல அஞ்சல்) வடிப்பாளரின் பொறியியலாளர்களுக்கு கிடைக்கிறது. பொதுவான ஸ்பேமின் ஒரு நல்ல அறிவைப் பெற யாராவது வரலாம், அஞ்சல் முகவரிகளை நூற்றுக்கணக்கான மின்னஞ்சல் முகவரிகளில் சேகரிக்க வேண்டும். இது வடிகட்டிகளின் திறனை பலவீனப்படுத்துகிறது, குறிப்பாக நல்ல அஞ்சல் பண்புகள் ஒவ்வொரு நபருக்கும் வித்தியாசமாக இருக்கும் , ஆனால் இது கணக்கில் எடுத்துக்கொள்ளப்படவில்லை.
- பார்ப்பதற்கான குணங்கள் , கல்லில் அதிகமாகவோ அல்லது குறைவாகவோ அமைக்கப்பட்டிருக்கின்றன . ஸ்பேமர்கள் தங்களை மாற்றிக்கொள்ள முயற்சிக்கிறார்கள் (மற்றும் அவர்களின் ஸ்பேம் வடிகட்டிகளுக்கு நல்ல அஞ்சல் போல் தோன்றுகிறது), வடிகட்டி பண்புகள் கைமுறையாக மாற்றி அமைக்கப்பட வேண்டும் - இன்னும் பெரிய முயற்சி.
- ஒவ்வொரு வார்த்தையிலும் ஒதுக்கப்படும் மதிப்பானது அநேகமாக ஒரு நல்ல மதிப்பீட்டை அடிப்படையாகக் கொண்டது, ஆனால் அது இன்னும் தன்னிச்சையாக உள்ளது. பண்புகளின் பட்டியலைப் போலவே, இது ஸ்பேமின் மாறும் உலகை மாற்றியமைப்பதற்கும் ஒரு தனிநபர் பயனரின் தேவைகளுக்கும் பொருந்தாது.
பேய்சியன் ஸ்பேம் வடிகட்டிகள் தங்களைத் தற்காத்துக் கொள்ளுங்கள், சிறந்த மற்றும் சிறப்பான பெறுதல்
பேயீசியன் ஸ்பேம் வடிகட்டிகள் உள்ளடக்கத்தை அடிப்படையாகக் கொண்ட வடிகட்டிகளைப் போன்ற ஒரு வகை ஆகும். எளிய அணுகுமுறை ஸ்பேம் வடிகட்டிகளின் சிக்கல்களால் அவற்றின் அணுகுமுறை விலகிச் செல்கிறது, இருப்பினும், அது மிகவும் தீவிரமாக இருக்கிறது. கைமுறையாக உருவாக்கப்பட்ட பண்புகள் மற்றும் அவற்றின் மதிப்பெண்களை வடிகட்டிகள் அடையக்கூடிய பலவீனம் இருப்பதால், இந்த பட்டியல் நீக்கப்பட்டது.
அதற்கு பதிலாக, பேயேசியன் ஸ்பேம் வடிகட்டிகள் பட்டியலில் தங்களை உருவாக்கவும். வெறுமனே, நீங்கள் ஸ்பேம் என வகைப்படுத்திய மின்னஞ்சல்களின் ஒரு பெரிய (பெரிய) கொத்து மற்றும் நல்ல அஞ்சல் மற்றொரு கொத்து தொடங்குங்கள். ஸ்பேமில் தோன்றும் பல்வேறு பண்புகளின் நிகழ்தகவு மற்றும் நல்ல அஞ்சல் ஆகியவற்றில், வடிகட்டிகள் இருவரும் பார்த்து ஒழுங்கான அஞ்சல் மற்றும் ஸ்பேமைப் பகுப்பாய்வு செய்கின்றன.
எப்படி ஒரு Bayesian ஸ்பேம் வடிகட்டி ஒரு மின்னஞ்சல் சோதனை
பேய்சியன் ஸ்பேம் வடிகட்டியைக் காணக்கூடிய பண்புகள் இருக்கக்கூடும்:
- செய்தியின் உடலில் உள்ள வார்த்தைகள், நிச்சயமாக, மற்றும்
- அதன் தலைப்புகள் (அனுப்புநர்கள் மற்றும் செய்தி பாதைகள் , எடுத்துக்காட்டாக!), ஆனால்
- HTML / CSS குறியீடு போன்ற மற்ற அம்சங்கள் (நிறங்கள் மற்றும் பிற வடிவமைப்பு போன்றவை), அல்லது கூட
- வார்த்தை ஜோடிகள், சொற்றொடர்கள் மற்றும்
- மெட்டா தகவல் (ஒரு குறிப்பிட்ட சொற்றொடர் தோன்றுகிறது, எடுத்துக்காட்டாக).
உதாரணமாக, "கார்டேசியன்" உதாரணமாக, ஸ்பேமில் தோன்றாது, ஆனால் நீங்கள் பெறும் முறையான மின்னஞ்சலில் பெரும்பாலும் தோன்றாது, "கார்ட்டீசியன்" ஸ்பேம் குறிக்கப்படும் நிகழ்தகவு பூஜ்ஜியத்திற்கு அருகில் உள்ளது. "டோனர்", மறுபுறம், ஸ்பேமில் பிரத்தியேகமாக மற்றும் பெரும்பாலும் தோன்றுகிறது. "டோனர்" ஸ்பேமில் காணப்படுவதற்கான மிக அதிக வாய்ப்பு உள்ளது, 1 (100%) ஐ விட அதிகம் இல்லை.
ஒரு புதிய செய்தி வந்தால், அது பேயேஸியன் ஸ்பேம் வடிப்பான் மூலம் பகுப்பாய்வு செய்யப்படுகிறது, மேலும் ஸ்பேம் முழுமையான செய்தியின் நிகழ்தகவு தனிப்பட்ட பண்புகளைப் பயன்படுத்தி கணக்கிடப்படுகிறது.
ஒரு செய்தி "கார்டீசியன்" மற்றும் "டோனர்" ஆகியவற்றைக் கொண்டிருப்பதாக கருதுங்கள். இந்த வார்த்தைகளிலிருந்து ஸ்பேம் அல்லது சட்டபூர்வமான அஞ்சல் கிடைத்திருக்கிறதா என்பதை இன்னும் தெளிவுபடுத்தவில்லை. மற்ற பண்புகள் (வட்டம் மற்றும் மிக அநேகமாக) ஸ்பேம் அல்லது நல்ல அஞ்சல் என வடிகட்டியை வடிகட்ட அனுமதிக்கும் ஒரு நிகழ்தகவு குறிக்கும்.
பேய்சியன் ஸ்பேம் வடிப்பான்கள் தானாகவே கற்கலாம்
இப்போது நாம் ஒரு வகைப்பாடு கொண்டிருப்பதால், வடிகட்டியைப் பயிற்றுவிப்பதற்கு செய்தி பயன்படுத்தப்படலாம். இந்த விஷயத்தில், "கார்டீசியன்" இன் சிறந்த செய்தி ("கார்டீசியன்" மற்றும் "டோனர்" ஆகிய இரண்டையும் உள்ளடக்கிய செய்தி ஸ்பேம் எனக் கண்டறியப்பட்டால்), அல்லது ஸ்பேம் குறிக்கும் "டோனர்" நிகழ்தகவு மறுபரிசீலனை செய்யப்பட வேண்டும் எனக் குறிக்கப்படுகிறது.
இந்த தானியங்கு தகவல்தொடர்பு நுட்பத்தைப் பயன்படுத்துவதன் மூலம், பேயேஸியன் வடிப்பான்கள் அவர்களது சொந்த மற்றும் பயனர் முடிவுகளை அறியலாம் (வடிகட்டிகளால் ஒரு தவறான மதிப்பீட்டை கைமுறையாக சரிசெய்யினால்). Bayesian வடிகட்டல் பொருந்தக்கூடிய அவர்கள் தனிப்பட்ட மின்னஞ்சல் பயனர் மிகவும் பயனுள்ளதாக இருக்கும் உறுதி செய்கிறது. பெரும்பாலான மக்கள் ஸ்பேம் இதே போன்ற பண்புகளை கொண்டிருக்கலாம் போது, முறையான அஞ்சல் எல்லோருக்கும் பண்புரீதியாக வேறுபட்டது.
பியாசியன் வடிகட்டிகள் கடந்த காலத்தில் எப்படி ஸ்பேமர்களைப் பெற முடியும்?
ஸ்பேம் என பேயீசியன் ஸ்பேம் வடிகட்டுதல் செயல்முறைக்கு முறையான மெயிலின் பண்புகள் முக்கியம். வடிகட்டிகள் ஒவ்வொரு பயனருக்கும் குறிப்பாக பயிற்சியளிக்கப்பட்டால், ஸ்பேமர்களுக்கு எல்லோருடைய (அல்லது பெரும்பாலான மக்களின்) ஸ்பேம் வடிகட்டிகளிலும் பணிபுரியும் கடினமான நேரம் இருக்கும், மேலும் வடிகட்டிகள் கிட்டத்தட்ட அனைவருக்கும் ஸ்பேமர்கள் முயற்சி செய்யலாம்.
தங்கள் ஸ்பேம் செய்திகளை எல்லோருக்கும் கிடைக்கும் சாதாரண மின்னஞ்சலைப் போல் செய்தால், ஸ்பேமர்கள் அதை நன்கு பயிற்றுவிக்கப்பட்ட பேய்சிய வடிப்பான்களை கடந்தும் செய்யும்.
ஸ்பேமர்கள் வழக்கமாக சாதாரண மின்னஞ்சல்களை அனுப்புவதில்லை. இந்த மின்னஞ்சல்கள் குப்பை மின்னஞ்சலில் வேலை செய்யாது என்பதால் இதை நினைத்துப் பார்ப்போம். எனவே, சாதாரண, போரிங் மின்னஞ்சல்கள் கடந்த ஸ்பேம் வடிகட்டிகள் செய்ய ஒரே வழி போது அவர்கள் வாய்ப்புகளை செய்ய மாட்டேன்.
ஸ்பேமர்கள் பெரும்பாலும் சாதாரணமாக காணப்படும் மின்னஞ்சல்களுக்கு மாறினால், எங்கள் இன்பாக்ஸில் ஸ்பேம் நிறையப் பார்ப்போம், மின்னஞ்சல் பேய்சியன் நாட்களில் (அல்லது இன்னும் மோசமாக) இது போன்ற ஏமாற்றமடையலாம் . இது பல வகையான ஸ்பேமை சந்தையில் சேதப்படுத்தியிருக்கும், இருப்பினும், நீண்ட காலமாக நீடிக்காது.
வலுவான குறிகாட்டிகள் ஒரு பேய்சியன் ஸ்பேம் வடிகட்டி அச்சில்கள் & # 39; ஹீல்
ஸ்பேமர்கள் தங்கள் வழக்கமான உள்ளடக்கத்துடன் கூட பேய்சியன் வடிகட்டிகள் மூலம் தங்கள் வழியைச் செயல்படுத்துவதற்கு ஒரு விதிவிலக்கு காணப்படலாம். பீஸ்ஸிய புள்ளிவிவரங்களின் இயல்பில் இது உள்ளது. ஒரு வார்த்தை அல்லது சொற்களானது நல்ல மின்னஞ்சலில் தோன்றுகிறது, இது ஸ்பேம் போல் வடிகட்டப்பட்ட ஹாம் என மதிப்பிடப்படுவதற்கு ஏதுவான செய்தியைத் திருப்புவது மிகவும் முக்கியமானது.
ஸ்பேமர்கள் நீங்கள் எதைத் திறந்த செய்திகளைக் காண HTML திரும்ப ரசீதுகளைப் பயன்படுத்துவதன் மூலம், உங்களின் உறுதி-தீ நல்ல மின்னஞ்சல் சொற்களை தீர்மானிக்க ஒரு வழியை கண்டுபிடித்தால், அவர்கள் ஒரு குப்பை மின்னஞ்சலில் ஒன்றை சேர்த்து, பயிற்சி பெற்ற பேய்சியன் வடிப்பான்.
ஜான் கிரஹாம்-கும்மிங் இரண்டு பேய்சியன் வடிப்பான்கள் ஒருவருக்கொருவர் எதிராக வேலை செய்வதைத் தடுக்க முயன்றது, "கெட்டது" என்பது "நல்ல" வடிப்பான் மூலமாக எந்த செய்திகளைப் பெறும் என்பதைப் பொருத்துகிறது. அவர் செயல்படும் என்று கூறுகிறார், செயல்முறை நேரம் மற்றும் நுகர்வு என்றாலும். இந்த நிகழ்வின் பெரும்பகுதியை நாம் பெரிய அளவில் பார்க்காமல், தனிநபர்களின் மின்னஞ்சல் குணாதிசயங்களைப் பொருட்படுத்தாமல் பார்ப்போம் என்று நாங்கள் நினைக்கவில்லை. அதற்கு பதிலாக ஸ்பேமர்கள் (சிலர் IBM இல் ஒருவேளை சிலர் "அல்டமென்" போன்ற) நிறுவனங்களுக்கு சில முக்கிய வார்த்தைகளை கண்டுபிடிப்பார்கள்.
வழக்கமாக, ஸ்பேம் எப்பொழுதும் (குறிப்பிடத்தக்கது) வழக்கமான அஞ்சலில் இருந்து மாறுபடும் அல்லது ஸ்பேமாக இருக்காது.
பாட்டம் லைன்: பேய்சியன் வடிகட்டுதல் வலிமை அதன் பலவீனம் இருக்க முடியும்
பேயீசியன் ஸ்பேம் வடிகட்டிகள் உள்ளடக்கம் சார்ந்த வடிப்பான்களைக் கொண்டுள்ளன:
- தனிப்பட்ட மின்னஞ்சல் பயனரின் ஸ்பேம் மற்றும் நல்ல அஞ்சல் ஆகியவற்றை அடையாளம் காண குறிப்பாக பயிற்றுவிக்கப்பட்டனர் .
- தொடர்ச்சியாக மற்றும் அதிக முயற்சி அல்லது கையேடு பகுப்பாய்வு இல்லாமல் ஸ்பேமர்களின் சமீபத்திய தந்திரங்களை ஏற்ப .
- தனிப்பட்ட பயனரின் நல்ல அஞ்சல் கணக்கை கணக்கில் எடுத்து, மிகக் குறைந்த தவறான விகிதங்களைக் கொண்டிருக்க வேண்டும்.
- துரதிருஷ்டவசமாக, இது பேய்சியன் எதிர்ப்பு ஸ்பேம் வடிகட்டிகளில் குருட்டு நம்பிக்கையை ஏற்படுத்தும் என்றால், இது அவ்வப்போது தவறுகளை இன்னும் தீவிரமாக வழங்குகிறது . தவறான எதிர்மறையின் எதிர்மறையான விளைவு (சரியாக அஞ்சல் போல் தோற்றமளிக்கும் ஸ்பேம்) பயனர்களைத் தொந்தரவு செய்வதற்கும், ஏமாற்றுவதற்கும் சாத்தியம் உள்ளது.