ஒரு பயன்பாட்டு மொழியியல் துறையாக கணக்கீட்டு மொழியியல். கணக்கீட்டு மொழியியல்

"கணக்கீட்டு மொழியியல்" என்ற சொல் பொதுவாக கணினி கருவிகள் - நிரல்கள், தரவை ஒழுங்கமைப்பதற்கும் செயலாக்குவதற்கும் கணினி தொழில்நுட்பங்கள் - சில நிபந்தனைகள், சூழ்நிலைகள், சிக்கல் பகுதிகள் மற்றும் அதன் நோக்கத்தில் மொழியின் செயல்பாட்டை மாதிரியாக்குவதற்கான பரந்த பகுதியைக் குறிக்கிறது. மொழியியலில் மட்டுமல்ல, தொடர்புடைய துறைகளிலும் மொழியின் கணினி மாதிரிகளின் பயன்பாடு. உண்மையில், பிந்தைய வழக்கில் மட்டுமே நாம் கடுமையான அர்த்தத்தில் பயன்பாட்டு மொழியியல் பற்றி பேசுகிறோம், ஏனெனில் மொழியின் கணினி மாடலிங் என்பது மொழியியல் துறையில் கணினி அறிவியல் கோட்பாட்டின் பயன்பாட்டின் ஒரு துறையாகவும் கருதப்படலாம். இருப்பினும், பொதுவான நடைமுறை என்னவென்றால், கணக்கீட்டு மொழியியல் துறையானது மொழியியலில் கணினிகளைப் பயன்படுத்துவது தொடர்பான அனைத்தையும் உள்ளடக்கியது: "கணக்கீட்டு மொழியியல்" என்ற சொல் பல்வேறு அறிவியல் மற்றும் நடைமுறை சிக்கல்களைத் தீர்க்க கணினிகளைப் பயன்படுத்துவதற்கான பொதுவான நோக்குநிலையை அமைக்கிறது. மொழிக்கு, இந்தப் பிரச்சனைகளைத் தீர்ப்பதற்கான வழிகளைக் கட்டுப்படுத்தாமல்."

கணக்கீட்டு மொழியியலின் நிறுவன அம்சம். கணக்கீட்டு மொழியியல் 60 களில் ஒரு சிறப்பு அறிவியல் துறையாக வடிவம் பெற்றது. இந்த பகுதியில் வெளியீடுகளின் ஓட்டம் மிகவும் பெரியது. கருப்பொருள் சேகரிப்புகளுக்கு கூடுதலாக, பத்திரிகை " கணக்கீட்டு மொழியியல்"உலகெங்கிலும் உள்ள பிராந்திய கட்டமைப்புகளைக் கொண்ட (குறிப்பாக, ஒரு ஐரோப்பிய கிளை) கணக்கீட்டு மொழியியல் சங்கத்தால் பல நிறுவன மற்றும் அறிவியல் பணிகள் மேற்கொள்ளப்படுகின்றன. ஒவ்வொரு இரண்டு வருடங்களுக்கும், கணக்கீட்டு மொழியியல் - COLING - பற்றிய சர்வதேச மாநாடுகள் நடத்தப்படுகின்றன. தொடர்புடையது பல்வேறு நிலைகளின் செயற்கை நுண்ணறிவு தொடர்பான சர்வதேச மாநாடுகளிலும் சிக்கல்கள் பரவலாக குறிப்பிடப்படுகின்றன.

கணக்கீட்டு மொழியியலுக்கான அறிவாற்றல் கருவிகள்

கணக்கீட்டு மொழியியல் ஒரு சிறப்பு பயன்பாட்டு ஒழுக்கமாக முதன்மையாக அதன் கருவியால் - அதாவது அதன் பயன்பாட்டால் வேறுபடுத்தப்படுகிறது. கணினி கருவிகள்மொழி தரவு செயலாக்கம். ஏனெனில் கணினி நிரல்கள், ஒரு மொழியின் செயல்பாட்டின் சில அம்சங்களை மாதிரியாகக் கொண்டு பல்வேறு நிரலாக்கக் கருவிகளைப் பயன்படுத்தலாம், பொது மெட்டாலாங்குவேஜ் பற்றி பேச வேண்டிய அவசியமில்லை என்று தோன்றுகிறது. எனினும், அது இல்லை. கணினி மாடலிங் சிந்தனையின் பொதுவான கொள்கைகள் உள்ளன, அவை எப்படியாவது எந்த கணினி மாதிரியிலும் செயல்படுத்தப்படுகின்றன. இந்த மொழி செயற்கை நுண்ணறிவில் உருவாக்கப்பட்ட அறிவுக் கோட்பாட்டை அடிப்படையாகக் கொண்டது மற்றும் அறிவாற்றல் அறிவியலின் ஒரு முக்கிய கிளையை உருவாக்குகிறது.

அறிவின் கோட்பாட்டின் முக்கிய ஆய்வறிக்கை சிந்தனை என்பது அறிவை செயலாக்கி உருவாக்கும் செயல்முறையாகும் என்று கூறுகிறது. "அறிவு" அல்லது "அறிவு" என்பது வரையறுக்க முடியாத வகையாகக் கருதப்படுகிறது. மனித அறிவாற்றல் அமைப்பு அறிவை செயலாக்கும் ஒரு "செயலியாக" செயல்படுகிறது. அறிவாற்றல் மற்றும் அறிவாற்றல் அறிவியலில், இரண்டு முக்கிய வகையான அறிவு வேறுபடுகிறது - அறிவிப்பு ("எதை அறிவது") மற்றும் நடைமுறை ("எப்படி அறிதல்"2)). அறிவிப்பு அறிவு பொதுவாக முன்மொழிவுகள், எதையாவது பற்றிய அறிக்கைகள் வடிவில் வழங்கப்படுகிறது. அறிவிப்பு அறிவின் ஒரு பொதுவான உதாரணம் சாதாரண விளக்க அகராதிகளில் சொற்களின் விளக்கமாக கருதப்படலாம். உதாரணமாக, ஒரு கோப்பை] - "ஒரு சிறிய வட்ட வடிவ குடிநீர் பாத்திரம், பொதுவாக ஒரு கைப்பிடியுடன், பீங்கான், மண் பாத்திரங்கள் போன்றவற்றால் ஆனது." அறிவிப்பு அறிவு "உண்மை-பொய்" அடிப்படையில் சரிபார்ப்பு நடைமுறைக்கு ஏற்றது. செயல்முறை அறிவு என்பது செயல்பாடுகளின் வரிசையாக (பட்டியல்) வழங்கப்படுகிறது, செய்ய வேண்டிய செயல்கள். சில சூழ்நிலைகளில் செயல்களைப் பற்றிய சில பொதுவான வழிமுறைகள் இது. நடைமுறை அறிவுக்கு ஒரு பொதுவான உதாரணம் வீட்டு உபகரணங்களைப் பயன்படுத்துவதற்கான வழிமுறைகள்.

அறிவிப்பு அறிவைப் போலன்றி, நடைமுறை அறிவு உண்மையா அல்லது பொய்யா என சரிபார்க்க முடியாது. அல்காரிதத்தின் வெற்றி அல்லது தோல்வியால் மட்டுமே அவற்றை மதிப்பிட முடியும்.

கணக்கீட்டு மொழியியலின் அறிவாற்றல் கருவிகளின் பெரும்பாலான கருத்துக்கள் ஒரே மாதிரியானவை: அவை மனித அறிவாற்றல் அமைப்பின் சில உண்மையான நிறுவனங்களையும் சில உலோக மொழிகளில் இந்த நிறுவனங்களை பிரதிநிதித்துவப்படுத்தும் வழிகளையும் ஒரே நேரத்தில் குறிப்பிடுகின்றன. வேறு வார்த்தைகளில் கூறுவதானால், மெட்டலாங்குவேஜின் கூறுகள் ஆன்டாலாஜிக்கல் மற்றும் கருவி அம்சத்தைக் கொண்டுள்ளன. ஆன்டாலாஜிக்கல் ரீதியாக, அறிவிப்பு மற்றும் நடைமுறை அறிவின் பிரிவு ஒத்திருக்கிறது பல்வேறு வகையானமனித அறிவாற்றல் அமைப்பு பற்றிய அறிவு. எனவே, குறிப்பிட்ட பொருள்கள், யதார்த்தத்தின் பொருள்கள் பற்றிய அறிவு முக்கியமாக அறிவிக்கப்படுகிறது, மேலும் ஒரு நபரின் நடக்க, ஓட மற்றும் காரை ஓட்டுவதற்கான செயல்பாட்டு திறன்கள் அறிவாற்றல் அமைப்பில் நடைமுறை அறிவாக உணரப்படுகின்றன. கருவியாக, அறிவை (ஆன்டாலஜிகல் நடைமுறை மற்றும் அறிவிப்பு இரண்டும்) விளக்கங்கள், விளக்கங்கள் மற்றும் ஒரு வழிமுறை அல்லது அறிவுறுத்தல்களின் தொகுப்பாகக் குறிப்பிடலாம். வேறு வார்த்தைகளில் கூறுவதானால், யதார்த்தமான "அட்டவணை" என்ற பொருளைப் பற்றிய ஆன்டாலஜிக்கல் பிரகடன அறிவு, வழிமுறைகளின் தொகுப்பாக, அதன் உருவாக்கத்திற்கான வழிமுறைகள், அசெம்பிளி (=செயல்முறை அறிவின் ஆக்கபூர்வமான அம்சம்) அல்லது அதன் வழக்கமான பயன்பாட்டிற்கான ஒரு வழிமுறையாக (= செயல்பாட்டு நடைமுறை அறிவின் அம்சம்). முதல் வழக்கில், இது ஒரு புதிய தச்சருக்கு வழிகாட்டியாகவும், இரண்டாவதாக, அலுவலக மேசையின் திறன்களின் விளக்கமாகவும் இருக்கலாம். தலைகீழ் உண்மையும் உள்ளது: ஆன்டாலஜிகல் நடைமுறை அறிவை பிரகடனமாக குறிப்பிடலாம்.

எந்தவொரு ஆன்டாலஜிக்கல் பிரகடன அறிவையும் செயல்முறையாகப் பிரதிநிதித்துவப்படுத்த முடியுமா, மேலும் எந்தவொரு ஆன்டாலஜிக்கல் செயல்முறை அறிவையும் அறிவிப்பாகக் குறிப்பிட முடியுமா என்பது ஒரு தனி விவாதம் தேவை. எந்தவொரு அறிவிப்பு அறிவும், கொள்கையளவில், செயல்முறை ரீதியாக பிரதிநிதித்துவப்படுத்தப்படலாம் என்பதை ஆராய்ச்சியாளர்கள் ஒப்புக்கொள்கிறார்கள், இருப்பினும் இது அறிவாற்றல் அமைப்புக்கு மிகவும் வீணானது. தலைகீழ் உண்மையாக இருக்க வாய்ப்பில்லை. உண்மை என்னவென்றால், அறிவிப்பு அறிவு மிகவும் வெளிப்படையானது, நடைமுறை அறிவை விட ஒரு நபர் புரிந்துகொள்வது எளிது. அறிவிப்பு அறிவுக்கு மாறாக, நடைமுறை அறிவு முக்கியமாக மறைமுகமாக உள்ளது. இவ்வாறு, மொழித்திறன், நடைமுறை அறிவாக இருப்பதால், ஒருவரிடமிருந்து மறைக்கப்பட்டு, அவரால் உணரப்படுவதில்லை. மொழி செயல்பாட்டின் வழிமுறைகளை விளக்கும் முயற்சி செயலிழப்புக்கு வழிவகுக்கிறது. எடுத்துக்காட்டாக, லெக்சிகல் சொற்பொருள் துறையில் வல்லுநர்கள் அறிந்திருக்கிறார்கள், எடுத்துக்காட்டாக, ஒரு வார்த்தையின் உள்ளடக்கத்தைப் படிக்கத் தேவையான நீண்ட கால சொற்பொருள் உள்நோக்கம், பகுப்பாய்வு செய்யப்படும் வார்த்தையின் சரியான மற்றும் தவறான பயன்பாடுகளை வேறுபடுத்தும் திறனை ஆராய்ச்சியாளர் ஓரளவு இழக்க வழிவகுக்கிறது. மற்ற உதாரணங்கள் கொடுக்க முடியும். இயக்கவியலின் பார்வையில், மனித உடல் இரண்டு ஊசல்களின் ஒரு சிக்கலான அமைப்பு என்று அறியப்படுகிறது.

அறிவின் கோட்பாட்டில், அறிவைப் படிக்கவும் பிரதிநிதித்துவப்படுத்தவும் பல்வேறு அறிவு கட்டமைப்புகள் பயன்படுத்தப்படுகின்றன - பிரேம்கள், காட்சிகள், திட்டங்கள். M. மின்ஸ்கியின் கூற்றுப்படி, "ஒரு சட்டமானது ஒரு ஒரே மாதிரியான சூழ்நிலையைப் பிரதிநிதித்துவப்படுத்த வடிவமைக்கப்பட்ட ஒரு தரவுக் கட்டமைப்பாகும்" [மின்ஸ்கி 1978, ப.254]. இன்னும் விரிவாக, ஒரு பிரேம் என்பது சில சொற்பொருள் உறவுகளால் ஒன்றோடொன்று இணைக்கப்பட்ட ஸ்லாட்டுகளைக் கொண்ட ஒரு வகைப்படுத்தப்பட்ட கருப்பொருள் ரீதியாக ஒருங்கிணைந்த சூழ்நிலையைப் பற்றிய அறிவின் பிரகடனப் பிரதிநிதித்துவத்திற்கான ஒரு கருத்தியல் அமைப்பு என்று நாம் கூறலாம். தெளிவு நோக்கங்களுக்காக, ஒரு சட்டகம் பெரும்பாலும் அட்டவணையாகக் குறிப்பிடப்படுகிறது, அதன் வரிசைகள் ஸ்லாட்டுகளை உருவாக்குகின்றன. ஒவ்வொரு ஸ்லாட்டிற்கும் அதன் சொந்த பெயர் மற்றும் உள்ளடக்கம் உள்ளது (அட்டவணை 1 ஐப் பார்க்கவும்).

அட்டவணை 1

அட்டவணை பார்வையில் "டேபிள்" சட்டத்தின் துண்டு

குறிப்பிட்ட பணியைப் பொறுத்து, சட்ட கட்டமைப்பானது மிகவும் சிக்கலானதாக இருக்கும்; ஒரு சட்டத்தில் உள்ளமை சப்ஃப்ரேம்கள் மற்றும் பிற பிரேம்களுக்கான குறிப்புகள் இருக்கலாம்.

ஒரு அட்டவணைக்கு பதிலாக, பிரதிநிதித்துவத்தின் முன்கணிப்பு வடிவம் பெரும்பாலும் பயன்படுத்தப்படுகிறது. இந்த வழக்கில், சட்டமானது ஒரு முன்னறிவிப்பு அல்லது வாதங்களுடன் கூடிய செயல்பாட்டின் வடிவத்தில் உள்ளது. ஒரு சட்டத்தை பிரதிநிதித்துவப்படுத்த வேறு வழிகள் உள்ளன. எடுத்துக்காட்டாக, இது பின்வரும் படிவத்தின் டூப்பிள் என குறிப்பிடப்படலாம்: ( (பிரேம் பெயர்) (ஸ்லாட் பெயர்)) (ஸ்லாட் மதிப்பு,),..., (ஸ்லாட் பெயர் n) (ஸ்லாட் மதிப்பு l)).

பொதுவாக, அறிவு பிரதிநிதித்துவ மொழிகளில் உள்ள சட்டங்கள் இந்த வகையைக் கொண்டுள்ளன.

கணக்கீட்டு மொழியியலின் பிற அறிவாற்றல் வகைகளைப் போலவே, சட்டத்தின் கருத்தும் ஒரே மாதிரியானது. உயிரியல் ரீதியாக, இது மனித அறிவாற்றல் அமைப்பின் ஒரு பகுதியாகும், மேலும் இந்த அர்த்தத்தில், சட்டத்தை கெஸ்டால்ட், முன்மாதிரி, ஸ்டீரியோடைப், ஸ்கீம் போன்ற கருத்துகளுடன் ஒப்பிடலாம். அறிவாற்றல் உளவியலில், இந்த வகைகள் ஒரு ஆன்டாலஜிக்கல் பார்வையில் இருந்து கருதப்படுகின்றன. இவ்வாறு, டி. நார்மன் மனித அறிவாற்றல் அமைப்பில் இருப்பு மற்றும் அறிவின் அமைப்பிற்கான இரண்டு முக்கிய வழிகளை வேறுபடுத்துகிறார் - சொற்பொருள் நெட்வொர்க்குகள் மற்றும் திட்டங்கள். "ஸ்கீமாக்கள்" என்று அவர் எழுதுகிறார், "தனிப்பட்ட, சுயாதீனமான அறிவின் அலகுகளை பிரதிநிதித்துவப்படுத்துவதற்காக ஒருங்கிணைக்கப்பட்ட அறிவின் ஒழுங்கமைக்கப்பட்ட தொகுப்புகள். சாமுக்கான எனது திட்டமானது அவரது உடல் அம்சங்கள், அவரது செயல்பாடுகள் மற்றும் ஆளுமைப் பண்புகளை விவரிக்கும் தகவலைக் கொண்டிருக்கலாம். இந்த திட்டம் விவரிக்கும் பிற திட்டங்களுடன் தொடர்புடையது. அதன் மற்ற பக்கங்கள்" [நார்மன் 1998, ப. 359]. பிரேம் வகையின் கருவிப் பக்கத்தை நாம் எடுத்துக் கொண்டால், இது அறிவின் பிரகடனப் பிரதிநிதித்துவத்திற்கான கட்டமைப்பாகும். தற்போதுள்ள AI அமைப்புகளில், பிரேம்கள் சிக்கலான அறிவு கட்டமைப்புகளை உருவாக்கலாம்; சட்ட அமைப்புகள் படிநிலையை அனுமதிக்கின்றன - ஒரு சட்டகம் மற்றொரு சட்டத்தின் பகுதியாக இருக்கலாம்.

உள்ளடக்கத்தில், ஒரு சட்டத்தின் கருத்து விளக்க வகைக்கு மிக நெருக்கமாக உள்ளது. உண்மையில், ஒரு ஸ்லாட் என்பது வேலன்ஸ் ஒரு அனலாக் ஆகும், ஒரு ஸ்லாட்டை நிரப்புவது ஒரு செயல்பாட்டின் அனலாக் ஆகும். அவற்றுக்கிடையேயான முக்கிய வேறுபாடு என்னவென்றால், விளக்கத்தில் வார்த்தையின் உள்ளடக்கத்தைப் பற்றிய மொழியியல் ரீதியாக பொருத்தமான தகவல்கள் மட்டுமே உள்ளன, மேலும் சட்டகம், முதலில், வார்த்தையுடன் இணைக்கப்பட வேண்டிய அவசியமில்லை, இரண்டாவதாக, கொடுக்கப்பட்ட சிக்கல் சூழ்நிலையுடன் தொடர்புடைய அனைத்து தகவல்களையும் உள்ளடக்கியது. புறமொழி (உலகத்தைப் பற்றிய அறிவு) உட்பட 3).

ஒரு ஸ்கிரிப்ட் என்பது ஒரே மாதிரியான சூழ்நிலை அல்லது ஒரே மாதிரியான நடத்தை பற்றிய அறிவின் செயல்முறை பிரதிநிதித்துவத்திற்கான ஒரு கருத்தியல் கட்டமைப்பாகும். ஒரு ஸ்கிரிப்ட்டின் கூறுகள் ஒரு அல்காரிதம் அல்லது வழிமுறைகளின் படிகள். அவர்கள் வழக்கமாக "உணவக வருகை காட்சி", "கொள்முதல் காட்சி" போன்றவற்றைப் பற்றி பேசுகிறார்கள்.

ஆரம்பத்தில், சட்டமானது நடைமுறை பிரதிநிதித்துவத்திற்கும் பயன்படுத்தப்பட்டது (cf. "செயல்முறை சட்டகம்"), ஆனால் இப்போது "ஸ்கிரிப்ட்" என்ற சொல் இந்த அர்த்தத்தில் அடிக்கடி பயன்படுத்தப்படுகிறது. ஒரு காட்சியை அல்காரிதமாக மட்டுமல்லாமல், நெட்வொர்க்காகவும் குறிப்பிடலாம், இதன் செங்குத்துகள் சில சூழ்நிலைகளுக்கு ஒத்திருக்கும், மேலும் வளைவுகள் சூழ்நிலைகளுக்கு இடையிலான இணைப்புகளுக்கு ஒத்திருக்கும். ஸ்கிரிப்ட் என்ற கருத்துடன், சில ஆராய்ச்சியாளர்கள் நுண்ணறிவின் கணினி மாதிரியாக்க ஸ்கிரிப்ட் வகையைப் பயன்படுத்துகின்றனர். ஆர். ஷெங்கின் கூற்றுப்படி, ஸ்கிரிப்ட் என்பது பொதுவாக ஏற்றுக்கொள்ளப்பட்ட, நன்கு அறியப்பட்ட காரண உறவுகளின் வரிசையாகும். உதாரணமாக, உரையாடலைப் புரிந்துகொள்வது

வெளியில் வாளிகள் போல் கொட்டுகிறது.

நீங்கள் இன்னும் கடைக்குச் செல்ல வேண்டும்: வீட்டில் சாப்பிட எதுவும் இல்லை - நேற்று விருந்தினர்கள் எல்லாவற்றையும் துடைத்தனர்.

"மழை பெய்தால், வெளியில் செல்வது விரும்பத்தகாதது, ஏனெனில் நீங்கள் நோய்வாய்ப்படலாம்" போன்ற தெளிவற்ற சொற்பொருள் இணைப்புகளை அடிப்படையாகக் கொண்டது. இந்த இணைப்புகள் ஒரு ஸ்கிரிப்டை உருவாக்குகின்றன, இது சொந்த பேச்சாளர்களால் ஒருவருக்கொருவர் பேச்சு மற்றும் பேச்சு அல்லாத நடத்தையைப் புரிந்துகொள்ள பயன்படுத்தப்படுகிறது.

ஒரு குறிப்பிட்ட சிக்கல் சூழ்நிலையில் காட்சியைப் பயன்படுத்துவதன் விளைவாக, ஏ திட்டம்) ஒரு குறிப்பிட்ட இலக்கை அடைவதற்கு வழிவகுக்கும் சாத்தியமான செயல்கள் பற்றிய அறிவை நடைமுறை ரீதியாக பிரதிநிதித்துவப்படுத்த ஒரு திட்டம் பயன்படுத்தப்படுகிறது. ஒரு திட்டம் ஒரு இலக்கை செயல்களின் வரிசையுடன் தொடர்புபடுத்துகிறது.

பொதுவாக, ஒரு திட்டமானது அமைப்பின் ஆரம்ப நிலையை இறுதி நிலைக்கு மாற்றும் மற்றும் ஒரு குறிப்பிட்ட துணை இலக்கு மற்றும் இலக்கை அடைய வழிவகுக்கும் நடைமுறைகளின் வரிசையை உள்ளடக்கியது. AI அமைப்புகளில், தொடர்புடைய தொகுதியின் திட்டமிடல் அல்லது திட்டமிடல் செயல்பாட்டின் விளைவாக ஒரு திட்டம் எழுகிறது - திட்டமிடல் தொகுதி. திட்டமிடல் செயல்முறையானது ஒன்று அல்லது அதற்கு மேற்பட்ட காட்சிகளில் இருந்து தரவை மாற்றியமைத்து, சோதனை நடைமுறைகளால் செயல்படுத்தப்பட்டு, சிக்கல் சூழ்நிலையைத் தீர்க்கும். இந்த திட்டம் நிர்வாக தொகுதியால் செயல்படுத்தப்படுகிறது, இது அமைப்பின் அறிவாற்றல் நடைமுறைகள் மற்றும் உடல் செயல்பாடுகளை கட்டுப்படுத்துகிறது. அடிப்படை வழக்கில், ஒரு அறிவார்ந்த அமைப்பில் ஒரு திட்டம் என்பது செயல்பாடுகளின் எளிய வரிசையாகும்; மிகவும் சிக்கலான பதிப்புகளில், திட்டம் ஒரு குறிப்பிட்ட பொருள், அதன் வளங்கள், திறன்கள், இலக்குகள், ஆகியவற்றுடன் தொடர்புடையது. விரிவான தகவல்ஒரு சிக்கலான சூழ்நிலை, முதலியன பற்றி. ஒரு திட்டத்தின் தோற்றம் உலக மாதிரிக்கு இடையிலான தகவல்தொடர்பு செயல்பாட்டில் நிகழ்கிறது, அதன் ஒரு பகுதி காட்சிகள், திட்டமிடல் தொகுதி மற்றும் நிர்வாக தொகுதி ஆகியவற்றால் உருவாகிறது.

ஒரு ஸ்கிரிப்ட் போலல்லாமல், ஒரு திட்டம் ஒரு குறிப்பிட்ட சூழ்நிலையுடன் தொடர்புடையது, ஒரு குறிப்பிட்ட செயல்திறன் மற்றும் ஒரு குறிப்பிட்ட இலக்கை அடைவதை நோக்கமாகக் கொண்டுள்ளது. திட்டத்தின் தேர்வு ஒப்பந்தக்காரரின் வளங்களால் நிர்வகிக்கப்படுகிறது. ஒரு அறிவாற்றல் அமைப்பில் அதன் உருவாக்கத்திற்கான ஒரு திட்டத்தின் சாத்தியக்கூறு ஒரு முன்நிபந்தனையாகும், மேலும் சாத்தியக்கூறின் பண்பு ஒரு சூழ்நிலைக்கு பொருந்தாது.

மற்றொரு முக்கியமான கருத்து உலகின் மாதிரி. உலகின் மாதிரி பொதுவாக ஒரு தொகுப்பாக புரிந்து கொள்ளப்படுகிறது ஒரு குறிப்பிட்ட வழியில்ஒரு அறிவாற்றல் அமைப்பு அல்லது அதன் கணினி மாதிரியில் உள்ளார்ந்த உலகத்தைப் பற்றிய ஒழுங்கமைக்கப்பட்ட அறிவு. இன்னும் கொஞ்சம் பொதுவான பார்வைஉலகின் அமைப்பு, அதன் வடிவங்கள் போன்றவற்றைப் பற்றிய அறிவைச் சேமிக்கும் அறிவாற்றல் அமைப்பின் ஒரு பகுதியாக உலக மாதிரி பேசப்படுகிறது. மற்றொரு புரிதலில், ஒரு உலக மாதிரியானது ஒரு உரையைப் புரிந்துகொள்வதன் முடிவுகளுடன் அல்லது இன்னும் பரந்த அளவில், சொற்பொழிவுகளுடன் தொடர்புடையது. உரையாடலைப் புரிந்துகொள்ளும் செயல்பாட்டில், அதன் மன மாதிரி கட்டமைக்கப்படுகிறது, இது உரையின் உள்ளடக்கத் திட்டத்தின் தொடர்பு மற்றும் கொடுக்கப்பட்ட பாடத்தின் உலகப் பண்பு பற்றிய அறிவின் விளைவாகும் [ஜான்சன்-லேயர்ட் 1988, ப. 237 எஃப்.எஃப்]. முதல் மற்றும் இரண்டாவது புரிதல்கள் பெரும்பாலும் இணைக்கப்படுகின்றன. புலனுணர்வு சார்ந்த மொழியியல் மற்றும் அறிவாற்றல் அறிவியலில் பணிபுரியும் மொழியியல் ஆராய்ச்சியாளர்களுக்கு இது பொதுவானது.

சட்டத்தின் வகையுடன் நெருக்கமாக தொடர்புடையது காட்சியின் கருத்து. காட்சி வகை முதன்மையாக இலக்கியத்தில் உண்மையான மற்றும் சிறப்பம்சமாக அறிவிக்கப்பட்ட பிரதிநிதித்துவத்திற்கான கருத்தியல் கட்டமைப்பின் பெயராகப் பயன்படுத்தப்படுகிறது. மொழி அர்த்தம்(லெக்ஸீம்கள், தொடரியல் கட்டுமானங்கள், இலக்கண வகைகள் போன்றவை) சூழ்நிலைகள் மற்றும் அவற்றின் பாகங்கள்5). மொழியியல் வடிவங்களுடன் தொடர்புடையதாக இருப்பதால், ஒரு காட்சி பெரும்பாலும் ஒரு குறிப்பிட்ட சொல் அல்லது வெளிப்பாட்டின் மூலம் உண்மையாக்கப்படுகிறது. சதி இலக்கணங்களில் (கீழே காண்க), ஒரு அத்தியாயம் அல்லது கதையின் ஒரு பகுதியாக ஒரு காட்சி தோன்றும். காட்சிகளின் பொதுவான எடுத்துக்காட்டுகள் AI அமைப்பு செயல்படும் கனசதுரங்களின் தொகுப்பு, கதையில் செயலின் இடம் மற்றும் செயலில் பங்கேற்பாளர்கள் போன்றவை. செயற்கை நுண்ணறிவில், காட்சிகள் பட அங்கீகார அமைப்புகளிலும், சிக்கல் சூழ்நிலைகளின் ஆய்வு (பகுப்பாய்வு, விளக்கம்) மீது கவனம் செலுத்தும் திட்டங்களிலும் பயன்படுத்தப்படுகின்றன. ஒரு காட்சியின் கருத்து கோட்பாட்டு மொழியியலில் பரவலாகிவிட்டது, அதே போல் தர்க்கத்திலும், குறிப்பாக சூழ்நிலை சொற்பொருளில், இதில் ஒரு லெக்சிகல் யூனிட்டின் பொருள் நேரடியாக காட்சியுடன் தொடர்புடையது.

2012 முதல், மனிதநேயத்திற்கான ரஷ்ய மாநில பல்கலைக்கழகத்தின் மொழியியல் நிறுவனம் முதுகலை திட்டத்தின் கீழ் முதுகலை பயிற்சி அளித்து வருகிறது. கணக்கீட்டு மொழியியல்(திசையில் அடிப்படை மற்றும் பயன்பாட்டு மொழியியல்) இந்த திட்டம் தொழில்முறை தயார் செய்ய வடிவமைக்கப்பட்டுள்ளது மொழியியலாளர்கள்மொழியியல் அடிப்படைகள் இரண்டிலும் தேர்ச்சி பெற்றவர்கள் நவீன முறைகள்ஆராய்ச்சி, நிபுணர்-பகுப்பாய்வு, பொறியியல் வேலை மற்றும் புதுமையான மொழி கணினி தொழில்நுட்பங்களின் வளர்ச்சியில் திறம்பட பங்கேற்க முடியும்.

முக்கிய ஆராய்ச்சி மற்றும் மேம்பாட்டுத் திட்டங்களின் உருவாக்குநர்கள் கல்விச் செயல்பாட்டில் பங்கேற்கின்றனர். வணிக அமைப்புகள்தானியங்கி உரை செயலாக்கத் துறையில், இது நவீன கணினி மொழியியலின் முக்கிய நீரோட்டத்துடன் மாஸ்டர் பயிற்சியின் இணைப்பை உறுதி செய்கிறது. சிறப்பு கவனம்ரஷ்ய மற்றும் சர்வதேச மாநாடுகளில் முதுகலை பங்கேற்பதற்காக செலுத்தப்படுகிறது.

ஆசிரியர்களில் மொழியியல் சிறப்புகள், உலகத் தரம் வாய்ந்த வல்லுநர்கள், பெரிய தானியங்கி மொழி செயலாக்க அமைப்புகளின் திட்ட மேலாளர்கள் பற்றிய அடிப்படை பாடப்புத்தகங்களின் ஆசிரியர்கள் உள்ளனர்: யா.ஜி. டெஸ்டெலெட்ஸ், ஐ.எம். போகஸ்லாவ்ஸ்கி, வி.ஐ. பெலிகோவ், வி.ஐ. Podlesskaya, V.P. செலிஜி, எல்.எல். அயோம்டின், ஏ.எஸ். ஸ்டாரோஸ்டின், எஸ்.ஏ. ஷரோவ், அத்துடன் கணக்கீட்டு மொழியியல் துறையில் உலகத் தலைவர்களாக இருக்கும் நிறுவனங்களின் பணியாளர்கள்: IBM (வாட்சன் அமைப்பு), யாண்டெக்ஸ், ABBYY (Lingvo, FineReader, Compreno அமைப்புகள்).

இந்த திட்டத்தில் முதுநிலை பயிற்சிக்கான அடிப்படை திட்ட அணுகுமுறை ஆகும். கணக்கீட்டு மொழியியல் துறையில் ஆராய்ச்சிப் பணிகளில் முதுகலை மாணவர்களின் ஈடுபாடு ரஷ்ய மாநில மனிதநேய பல்கலைக்கழகத்தின் அடிப்படையிலும், AOT (ABBYY, IBM, முதலியன) துறையில் திட்டங்களை உருவாக்கும் நிறுவனங்களின் அடிப்படையிலும் நடைபெறுகிறது. , நிச்சயமாக, எஜமானர்களுக்கும் அவர்களது சாத்தியமான முதலாளிகளுக்கும் ஒரு பெரிய பிளஸ் ஆகும். குறிப்பாக, இலக்கு மாஸ்டர்கள் மாஸ்டர் திட்டத்தில் அனுமதிக்கப்படுகிறார்கள், அதன் பயிற்சி எதிர்கால முதலாளிகளால் வழங்கப்படுகிறது.

நுழைவுத் தேர்வுகள்: "நவீன மொழியியலின் முறையான மாதிரிகள் மற்றும் முறைகள்." பரீட்சை நேரத்தைப் பற்றிய துல்லியமான தகவல்களை மனிதநேயத்திற்கான ரஷ்ய மாநில பல்கலைக்கழகத்தின் முதுகலை துறையின் இணையதளத்தில் பெறலாம்.

மாஜிஸ்திரேசியின் தலைவர்கள் - தலை. கணக்கீட்டு மொழியியலுக்கான கல்வி மற்றும் அறிவியல் மையம், ABBYY இல் மொழியியல் ஆராய்ச்சி இயக்குனர் விளாடிமிர் பாவ்லோவிச் செலிஜிமற்றும் Philology டாக்டர், பேராசிரியர் வேரா இசகோவ்னா பொட்லெஸ்கயா .

"நவீன மொழியியலின் முறையான மாதிரிகள் மற்றும் முறைகள்" என்ற துறைக்கான நுழைவுத் தேர்வு மற்றும் நேர்காணலின் திட்டம்.

நிரல் பற்றிய கருத்துகள்

  • எந்தவொரு நிரல் கேள்வியும் கேள்வியின் பகுதியுடன் தொடர்புடைய குறிப்பிட்ட மொழியியல் நிகழ்வுகளின் விளக்கங்கள் தொடர்பான பணிகளுடன் இருக்கலாம்: கட்டமைப்புகளின் கட்டுமானம், கட்டுப்பாடுகளின் விளக்கம், கட்டுமானத்திற்கான சாத்தியமான வழிமுறைகள் மற்றும்/அல்லது அடையாளம் காணுதல்.
  • நட்சத்திரக் குறியீடுகளால் குறிக்கப்பட்ட கேள்விகள் விருப்பமானவை (அவை டிக்கெட்டுகளில் எண் 3-ன் கீழ் தோன்றும்). தொடர்புடைய பொருள் பற்றிய அறிவு வேட்பாளர்களுக்கு ஒரு முக்கிய போனஸ், ஆனால் தேவையில்லை.
  • கோட்பாட்டு கேள்விகளுக்கு கூடுதலாக, தேர்வு டிக்கெட்டுகள் மொழிபெயர்ப்பு மற்றும் விவாதத்திற்காக ஆங்கிலத்தில் ஒரு சிறப்பு (மொழியியல்) உரையின் சிறிய பகுதியை வழங்கும். விண்ணப்பதாரர்கள் ஆங்கில அறிவியல் சொற்களஞ்சியம் மற்றும் அறிவியல் உரை பகுப்பாய்வு திறன் ஆகியவற்றில் திருப்திகரமான அளவிலான தேர்ச்சியை வெளிப்படுத்த வேண்டும். விண்ணப்பதாரருக்கு கடுமையான சிரமங்களை ஏற்படுத்தாத உரையின் எடுத்துக்காட்டு, கட்டுரையின் ஒரு பகுதி கீழே உள்ளது https://en.wikipedia.org/wiki/Anaphora_(linguistics):

மொழியியலில், அனஃபோரா (/əˈnæfərə/) என்பது ஒரு வெளிப்பாட்டின் பயன்பாடாகும், அதன் விளக்கம் சூழலில் மற்றொரு வெளிப்பாட்டைச் சார்ந்தது (அதன் முன்னோடி அல்லது பின்தொடர்). ஒரு குறுகிய அர்த்தத்தில், அனஃபோரா என்பது ஒரு முன்னோடி வெளிப்பாட்டைச் சார்ந்து இருக்கும் ஒரு வெளிப்பாட்டின் பயன்பாடாகும், இதனால் கேடஃபோராவுடன் வேறுபடுகிறது, இது ஒரு பிந்தைய வெளிப்பாட்டைச் சார்ந்திருக்கும் ஒரு வெளிப்பாட்டின் பயன்பாடாகும். அனபோரிக் (குறிப்பிடும்) சொல் அனஃபர் என்று அழைக்கப்படுகிறது. எடுத்துக்காட்டாக, சாலி வந்தான் என்ற வாக்கியத்தில், ஆனால் யாரும் அவளைப் பார்க்கவில்லை, அவள் ஒரு அனஃபர் என்ற பிரதிபெயர், சாலியின் முன்னோடியைக் குறிக்கிறது. அவள் வருவதற்கு முன், சாலி என்ற வாக்கியத்தில், யாரும் சாலியைப் பார்க்கவில்லை, அவள் என்ற பிரதிபெயரை பின்தொடர்ந்த சாலியைக் குறிக்கிறது, எனவே அவள் இப்போது ஒரு கேடஃபோர் (மற்றும் பரந்த, ஆனால் குறுகிய, உணர்வு அல்ல). வழக்கமாக, ஒரு அனபோரிக் வெளிப்பாடு என்பது ஒரு புரோஃபார்ம் அல்லது வேறு சில வகையான டிக்டிக் (சூழல் சார்ந்த) வெளிப்பாடு ஆகும். அனஃபோரா மற்றும் கேடஃபோரா இரண்டும் எண்டோஃபோராவின் இனங்கள், இது ஒரு உரையாடல் அல்லது உரையில் வேறு இடத்தில் குறிப்பிடப்பட்டுள்ளதைக் குறிக்கிறது.

அனஃபோரா என்பது வெவ்வேறு காரணங்களுக்காக மற்றும் வெவ்வேறு நிலைகளில் உள்ள ஒரு முக்கியமான கருத்து: முதலில், சொற்பொழிவு எவ்வாறு கட்டமைக்கப்படுகிறது மற்றும் பராமரிக்கப்படுகிறது என்பதை அனஃபோரா குறிக்கிறது; இரண்டாவதாக, அனஃபோரா வாக்கியத்தின் மட்டத்தில் வெவ்வேறு தொடரியல் கூறுகளை ஒன்றாக இணைக்கிறது; மூன்றாவதாக, கணக்கீட்டு மொழியியலில் இயற்கையான மொழி செயலாக்கத்திற்கு அனஃபோரா ஒரு சவாலை முன்வைக்கிறது, ஏனெனில் குறிப்பை அடையாளம் காண்பது கடினமாக இருக்கும்; மற்றும் நான்காவதாக, மொழி எவ்வாறு புரிந்து கொள்ளப்படுகிறது மற்றும் செயலாக்கப்படுகிறது என்பதைப் பற்றி அனஃபோரா சில விஷயங்களைக் கூறுகிறது, இது அறிவாற்றல் உளவியலில் ஆர்வமுள்ள மொழியியல் துறைகளுக்குப் பொருத்தமானது.

தத்துவார்த்த சிக்கல்கள்

மொழியியலின் பொதுவான சிக்கல்கள்

  • மொழியியலின் பொருள். மொழி மற்றும் பேச்சு. ஒத்திசைவு மற்றும் டயக்ரோனி.
  • மொழியின் நிலைகள். மொழி நிலைகளின் முறையான மாதிரிகள்.
  • தொடரியல் மற்றும் முன்னுதாரணங்கள். விநியோகத்தின் கருத்து.
  • மொழிகளுக்கிடையேயான ஒப்பீடுகளின் அடிப்படைகள்: அச்சுக்கலை, மரபியல் மற்றும் வட்டார மொழியியல்.
  • *கணித மொழியியல்: பொருள் மற்றும் ஆராய்ச்சி முறைகள்

ஃபோனடிக்ஸ்

  • ஒலிப்பு பாடம். உச்சரிப்பு மற்றும் ஒலி ஒலியியல்.
  • பிரிவு மற்றும் உயர்தர ஒலிப்பு. உரைநடை மற்றும் ஒலியமைப்பு.
  • ஒலியியலின் அடிப்படைக் கருத்துக்கள். ஒலியியல் அமைப்புகளின் வகைப்பாடு மற்றும் அவற்றின் ஒலிப்பு செயலாக்கங்கள்.
  • *கணினி கருவிகள் மற்றும் ஒலிப்பு ஆராய்ச்சி முறைகள்
  • * பேச்சு பகுப்பாய்வு மற்றும் தொகுப்பு.

உருவவியல்

  • உருவவியல் பொருள். உருவங்கள், மார்பிம்கள், அலோமார்ப்கள்.
  • ஊடுருவல் மற்றும் சொல் உருவாக்கம்.
  • இலக்கண அர்த்தங்கள்மற்றும் அவற்றை செயல்படுத்துவதற்கான வழிகள். இலக்கண வகைகள் மற்றும் இலக்கணங்கள். உருவவியல் மற்றும் தொடரியல் இலக்கண அர்த்தங்கள்.
  • சொல் வடிவம், தண்டு, லெம்மா மற்றும் முன்னுதாரணத்தின் கருத்துக்கள்.
  • பேச்சு பாகங்கள்; பேச்சின் பகுதிகளை கண்டறிவதற்கான அடிப்படை அணுகுமுறைகள்.
  • *பரிமாற்றம் மற்றும் சொல் உருவாக்கம் ஆகியவற்றை விவரிக்கும் முறையான மாதிரிகள்.
  • *தானியங்கி மொழி செயலாக்கப் பணிகளில் உருவவியல்: எழுத்துப்பிழை சரிபார்ப்பு, லெமடிசேஷன், பிஓஎஸ்-டேக்கிங்

சின்டாக்ஸ்

  • தொடரியல் பொருள். தொடரியல் உறவுகளை வெளிப்படுத்தும் வழிகள்.
  • ஒரு வாக்கியத்தின் தொடரியல் கட்டமைப்பைக் குறிக்கும் வழிகள். சார்பு மரங்கள் மற்றும் கூறுகளின் நன்மைகள் மற்றும் தீமைகள்.
  • நேரியல் வரிசையை விவரிப்பதற்கான வழிகள். திட்டத்திறன் இல்லாமை மற்றும் கூறுகளின் முறிவு. மாற்றத்தின் கருத்து; நேரியல் வரிசையுடன் தொடர்புடைய மாற்றங்கள்.
  • தொடரியல் மற்றும் சொற்பொருளுக்கு இடையிலான உறவு: வேலன்ஸ்கள், கட்டுப்பாட்டு மாதிரிகள், செயல்கள் மற்றும் சர்கான்ஸ்டன்ட்கள்.
  • டையடிசிஸ் மற்றும் இணை. செயல் வழித்தோன்றல்.
  • பேச்சின் தொடர்பு அமைப்பு. தீம் மற்றும் ரீம், கொடுக்கப்பட்ட மற்றும் புதிய, மாறாக.
  • *முக்கிய தொடரியல் கோட்பாடுகள்: MST, ஜெனரேடிவிசம், செயல்பாட்டு இலக்கணம், HPSG
  • * தொடரியல் கணித மாதிரிகள்: சாம்ஸ்கியின் படி முறையான மொழிகளின் வகைப்பாடு, அங்கீகார வழிமுறைகள் மற்றும் அவற்றின் சிக்கலானது.

சொற்பொருள்

  • பொருளியல் பொருள். உலகின் அப்பாவி மற்றும் அறிவியல் மொழியியல் படங்கள். Sapir-Worf கருதுகோள்.
  • மொழி மற்றும் பேச்சில் பொருள்: பொருள் மற்றும் குறிப்பு. குறிப்பு வகை (குறிப்பு நிலை).
  • லெக்சிகல் சொற்பொருள். ஒரு வார்த்தையின் சொற்பொருளை விவரிக்கும் வழிகள்.
  • இலக்கண சொற்பொருள். ரஷ்ய மொழியின் உதாரணத்தைப் பயன்படுத்தி முக்கிய வகைகள்.
  • வாக்கியத்தின் சொற்பொருள். முன்மொழிவு கூறு. டீக்ஸிஸ் மற்றும் அனஃபோரா. அளவீடுகள் மற்றும் இணைப்புகள். மாடலிட்டி.
  • லெக்சிகல் அர்த்தங்களின் படிநிலை மற்றும் முறைமை. பாலிசெமி மற்றும் ஹோமோனிமி. பாலிசெமண்டிக் வார்த்தையின் சொற்பொருள் அமைப்பு. மாறாத மற்றும் முன்மாதிரியின் கருத்துக்கள்.
  • சொல்லகராதியில் முன்னுதாரண மற்றும் தொடரியல் உறவுகள். லெக்சிக்கல் செயல்பாடுகள்.
  • விளக்கம். விளக்கத்தின் மொழி. மாஸ்கோ சொற்பொருள் பள்ளி
  • சொற்பொருள் மற்றும் தர்க்கம். அறிக்கையின் உண்மை மதிப்பு.
  • பேச்சு செயல்களின் கோட்பாடு. உச்சரிப்பு மற்றும் அதன் மாயையான சக்தி. நிகழ்ச்சிகள். பேச்சு செயல்களின் வகைப்பாடு.
  • சொற்களஞ்சியம்: சரக்கு மற்றும் சொற்றொடர் அலகுகளை விவரிக்கும் முறைகள்.
  • *முறையான சொற்பொருளின் மாதிரிகள் மற்றும் முறைகள்.
  • *நவீன கணக்கீட்டு மொழியியலில் சொற்பொருளின் மாதிரிகள்.
  • *பகிர்வு மற்றும் செயல்பாட்டு சொற்பொருள்.
  • * கட்டுமான இலக்கணத்தின் அடிப்படை யோசனைகள்.

அச்சுக்கலை

  • மொழிகளின் பாரம்பரிய அச்சுக்கலை வகைப்பாடுகள்.
  • பெயர்ச்சொல் மற்றும் வினைச்சொல்லின் இலக்கண வகைகளின் வகைப்பாடு.
  • அச்சுக்கலை எளிய வாக்கியம். கட்டுமானங்களின் முக்கிய வகைகள்: குற்றச்சாட்டு, தூண்டுதல், செயலில்.
  • சொல் வரிசை மற்றும் கிரீன்பெர்க் தொடர்புகளின் வகை. இடது மற்றும் வலது கிளை மொழிகள்.

லெக்சிகோகிராபி

  • சொல்லகராதி கலாச்சாரத்தின் ஒரு சரக்கு; சொல்லகராதியின் சமூக மாறுபாடு, லெக்சிக்கல் பயன்பாடு, விதிமுறை, குறியீடாக்கம்.
  • அகராதிகளின் வகைப்பாடு (ரஷ்ய பொருளில்). பல்வேறு வகையான அகராதிகளில் சொல்லகராதியின் பிரதிபலிப்பு.
  • ரஷ்ய மொழியைப் பயன்படுத்தி இருமொழி அகராதி.
  • விளக்கமான மற்றும் பரிந்துரைக்கப்பட்ட அகராதி. தொழில்முறை மொழியியல் அகராதிகள்.
  • முக்கிய ரஷ்யர்களின் பிரத்தியேகங்கள் விளக்க அகராதிகள். அகராதி உள்ளீட்டின் அமைப்பு. விளக்கம் மற்றும் கலைக்களஞ்சிய தகவல்.
  • சொல்லகராதி மற்றும் இலக்கணம். மாஸ்கோ சொற்பொருள் பள்ளியில் மொழியின் ஒருங்கிணைந்த மாதிரியின் யோசனை.
  • * அகராதி ஆசிரியரின் முறை.
  • *சொற்பொழிலில் கார்பஸ் முறைகள்.

உரை மற்றும் சொற்பொழிவின் மொழியியல்

  • உரை மற்றும் சொற்பொழிவின் கருத்து.
  • இடைச்சொல் தொடர்பு வழிமுறைகள். அவற்றின் மொழியியல் செயலாக்கத்தின் முக்கிய வகைகள்.
  • வாக்கியம் மொழியின் ஒரு அலகு மற்றும் உரையின் ஒரு உறுப்பு.
  • சூப்பர்ஃப்ரேசல் ஒற்றுமைகள், அவற்றின் உருவாக்கம் மற்றும் தனிமைப்படுத்தலின் கொள்கைகள், அடிப்படை பண்புகள்.
  • உரை வகைப்பாட்டின் முக்கிய வகைகள் (வகை, நடை, பதிவு, பொருள் பகுதி போன்றவை)
  • *தானியங்கி வகை வகைப்பாடு முறைகள்.

சமூகவியல்

  • சமூக மொழியியலின் பொருள் மற்றும் எல்லைகளின் சிக்கல், அதன் இடைநிலை இயல்பு. சமூகவியல் மற்றும் மக்கள்தொகையின் அடிப்படைக் கருத்துக்கள். மொழியியல் கட்டமைப்பு மற்றும் சமூக மொழியியல் நிலைகள். சமூக மொழியியலின் அடிப்படை கருத்துக்கள் மற்றும் திசைகள்.
  • மொழி தொடர்புகள். இருமொழி மற்றும் டிகுளோசியா. மொழியின் வரலாற்றில் மாறுபட்ட மற்றும் குவிந்த செயல்முறைகள்.
  • மொழியின் சமூக வேறுபாடு. மொழியின் இருப்பு வடிவங்கள். இலக்கிய மொழி: பயன்பாடு-நெறி-குறியீடு. மொழியின் செயல்பாட்டு பகுதிகள்.
  • மொழி சமூகமயமாக்கல். சமூக மற்றும் மொழியியல் அடையாளத்தின் படிநிலை இயல்பு. ஒரு நபரின் மொழியியல் நடத்தை மற்றும் அவரது தொடர்பு திறன்.
  • சமூகவியல் ஆராய்ச்சியின் முறைகள்.

கணினி மொழியியல்

  • கணக்கீட்டு மொழியியலின் பணிகள் மற்றும் முறைகள்.
  • கார்பஸ் மொழியியல். வழக்கின் முக்கிய பண்புகள்.
  • அறிவு பிரதிநிதித்துவம். எம்.மின்ஸ்கியின் பிரேம்களின் கோட்பாட்டின் அடிப்படைக் கருத்துக்கள். ஃபிரேம்நெட் அமைப்பு.
  • சொற்களஞ்சியம் மற்றும் ஆன்டாலஜிகள். வேர்ட்நெட்.
  • புள்ளிவிவர உரை பகுப்பாய்வின் அடிப்படைகள். அதிர்வெண் அகராதிகள். சேகரிப்பு பகுப்பாய்வு.
  • * இயந்திர கற்றல் கருத்து.

இலக்கியம்

கல்வி (அடிப்படை நிலை)

பரனோவ் ஏ.என்.பயன்பாட்டு மொழியியல் அறிமுகம். எம்.: தலையங்கம் URRS, 2001.

பரனோவ் ஏ.என்., டோப்ரோவோல்ஸ்கி டி.ஓ.சொற்றொடரின் அடிப்படைகள் ( குறுகிய பாடநெறி) பயிற்சி. 2வது பதிப்பு. மாஸ்கோ: பிளின்டா, 2014.

பெலிகோவ் வி.ஏ., கிரிசின் எல்.பி.சமூக மொழியியல். எம்., மனிதநேயத்திற்கான ரஷ்ய மாநில பல்கலைக்கழகம், 2001.

பர்லாக் எஸ்.ஏ., ஸ்டாரோஸ்டின் எஸ்.ஏ.ஒப்பீட்டு வரலாற்று மொழியியல். எம்.: அகாடமி. 2005

வக்டின் என்.பி., கோலோவ்கோ ஈ.வி.மொழியின் சமூகவியல் மற்றும் சமூகவியல். செயின்ட் பீட்டர்ஸ்பர்க், 2004.

Knyazev S.V., Pozharitskaya எஸ்.கே.நவீன ரஷ்ய இலக்கிய மொழி: ஒலிப்பு, கிராபிக்ஸ், எழுத்துப்பிழை, எழுத்துப்பிழை. 2வது பதிப்பு. எம்., 2010

கோபோசேவா ஐ.எம்.மொழியியல் சொற்பொருள். எம்.: தலையங்கம் யுஆர்எஸ்எஸ். 2004.

கோட்சாசோவ் எஸ்.வி., கிரிவ்னோவா ஓ.எஃப்.பொது ஒலிப்பு. எம்.: RSUH, 2001.

Krongauz எம்.ஏ.சொற்பொருள். எம்.: RSUH. 2001.

Krongauz எம்.ஏ.சொற்பொருள்: பணிகள், பணிகள், உரைகள். எம்.: அகாடமி. 2006..

மஸ்லோவ் யு.எஸ்.மொழியியல் அறிமுகம். எட். 6வது, அழிக்கப்பட்டது. எம்.: அகாடமி, பில். போலி. செயின்ட் பீட்டர்ஸ்பர்க் மாநில பல்கலைக்கழகம்,

பிளங்யான் வி.ஏ.பொது உருவவியல்: பொருள் அறிமுகம். எட். 2வது. எம்.: எடிட்டோரியல் யுஆர்எஸ்எஸ், 2003.

டெஸ்டெலெட்ஸ் யா.ஜி.பொது தொடரியல் அறிமுகம். எம்., 2001.

ஷைகேவிச் ஏ.யா.மொழியியல் அறிமுகம். எம்.: அகாடமி. 2005.

அறிவியல் மற்றும் குறிப்பு

அப்ரேசியன் யு.டி.தேர்ந்தெடுக்கப்பட்ட படைப்புகள், தொகுதி I. லெக்சிகல் சொற்பொருள்: 2வது பதிப்பு., ஸ்பானிஷ். மற்றும் கூடுதல் எம்.: பள்ளி "ரஷ்ய கலாச்சாரத்தின் மொழிகள்", 1995.

அப்ரேசியன் யு.டி.தேர்ந்தெடுக்கப்பட்ட படைப்புகள், தொகுதி II. மொழி மற்றும் அமைப்பு அகராதியின் ஒருங்கிணைந்த விளக்கம். எம்.: பள்ளி "ரஷ்ய கலாச்சாரத்தின் மொழிகள்", 1995.

அப்ரேசியன் யு.டி.(எட்.) ரஷ்ய மொழியின் ஒத்த சொற்களின் புதிய விளக்க அகராதி. மாஸ்கோ - வியன்னா: "ரஷ்ய கலாச்சாரத்தின் மொழிகள்", வீனர் ஸ்லாவிஸ்டிஷர் அல்மனாச், சோண்டர்பேண்ட் 60, 2004.

அப்ரேசியன் யு.டி.(எட்.) உலகின் மொழியியல் படம் மற்றும் முறையான அகராதி (ed. Yu. D. Apresyan). எம்.: "ஸ்லாவிக் கலாச்சாரங்களின் மொழிகள்", 2006, முன்னுரை மற்றும் அத்தியாயம். 1, ப.26 -- 74.

புலிஜினா டி.வி., ஷ்மேலெவ் ஏ.டி.உலகின் மொழியியல் கருத்தாக்கம் (ரஷ்ய இலக்கணத்தின் அடிப்படையில்). எம்.: பள்ளி "ரஷ்ய கலாச்சாரத்தின் மொழிகள்", 1997.

வெயின்ரிச் டபிள்யூ.மொழி தொடர்புகள். கீவ், 1983.

வெஜ்பிட்ஸ்காயா ஏ.சொற்பொருள் உலகளாவிய மற்றும் மொழிகளின் விளக்கம். எம்.: பள்ளி "ரஷ்ய கலாச்சாரத்தின் மொழிகள்". 1999.

கல்பெரின் ஐ.ஆர்.மொழியியல் ஆராய்ச்சியின் ஒரு பொருளாக உரை. 6வது பதிப்பு. எம்.: LKI, 2008 ("20 ஆம் நூற்றாண்டின் மொழியியல் பாரம்பரியம்")

ஜலிஸ்னியாக் ஏ.ஏ.நவீன ரஷ்ய மொழி மற்றும் பொது மொழியியல் ஆகியவற்றில் தேர்ந்தெடுக்கப்பட்ட படைப்புகளின் பயன்பாட்டுடன் "ரஷ்ய பெயரளவு ஊடுருவல்". எம்.: மொழிகள் ஸ்லாவிக் கலாச்சாரம், 2002.

ஜலிஸ்னியாக் ஏ.ஏ., படுச்சேவா ஈ.வி.தொடர்புடைய உட்பிரிவுகளின் அச்சுக்கலை நோக்கி. / செமியோடிக்ஸ் மற்றும் கணினி அறிவியல், தொகுதி. 35. எம்., 1997, பக். 59-107.

இவனோவ் வியாச். சூரியன்..மூன்றாம் மில்லினியத்தின் மொழியியல். எதிர்காலத்திற்கான கேள்விகள். எம்., 2004. பி. 89-100 (11. உலகில் மொழி நிலைமை மற்றும் எதிர்காலத்திற்கான முன்னறிவிப்பு).

கிப்ரிக் ஏ.இ.மொழியியலின் பொதுவான மற்றும் பயன்பாட்டு சிக்கல்கள் பற்றிய கட்டுரைகள். எம்.: மாஸ்கோ ஸ்டேட் யுனிவர்சிட்டி பப்ளிஷிங் ஹவுஸ், 1992.

கிப்ரிக் ஏ.இ.மொழி மாறிலிகள் மற்றும் மாறிகள். செயின்ட் பீட்டர்ஸ்பர்க்: அலேதியா, 2003.

லபோவ் யு.மொழி மாற்றங்களின் பொறிமுறையில் // மொழியியலில் புதியது. இதழ் 7. எம்., 1975. பி.320-335.

லியோன்ஸ் ஜே.மொழியியல் சொற்பொருள்: அறிமுகம். எம்.: ஸ்லாவிக் கலாச்சாரத்தின் மொழிகள். 2003.

லியோன்ஸ் ஜான்.மொழி மற்றும் மொழியியல். அறிமுக பாடநெறி. எம்: யுஆர்எஸ்எஸ், 2004

லகோஃப் ஜே.பெண்கள், தீ மற்றும் ஆபத்தான விஷயங்கள்: மொழியின் வகைகள் சிந்தனை பற்றி நமக்கு என்ன சொல்கின்றன. எம்.: ஸ்லாவிக் கலாச்சாரத்தின் மொழிகள். 2004.

லகோஃப் ஜே, ஜான்சன் எம். நாம் வாழும் உருவகங்கள். பெர். ஆங்கிலத்தில் இருந்து பதிப்பு 2. எம்.: யுஆர்எஸ்எஸ். 2008.

மொழியியல் கலைக்களஞ்சிய அகராதி / எட். மற்றும். யார்ட்சேவா. எம்.: அறிவியல் பதிப்பகம் "பிக் ரஷியன் என்சைக்ளோபீடியா", 2002.

மெல்சுக் ஐ.ஏ.பொது உருவவியல் பாடநெறி. Tt. I-IV. மாஸ்கோ-வியன்னா: "ஸ்லாவிக் கலாச்சாரத்தின் மொழிகள்", வீனர் ஸ்லாவிஸ்டிஷர் அல்மனாச், சோண்டர்பேண்ட் 38/1-38/4, 1997-2001.

மெல்சுக் ஐ. ஏ.மொழியியல் மாதிரிகள் கோட்பாட்டில் அனுபவம் "அர்த்தம் ↔ உரை". எம்.: பள்ளி "ரஷ்ய கலாச்சாரத்தின் மொழிகள்", 1999.

ஃபெடோரோவா எல்.எல்.செமியோடிக்ஸ். எம்., 2004.

பிலிப்போவ் கே. ஏ.உரையின் மொழியியல்: விரிவுரைகளின் பாடநெறி - 2வது பதிப்பு., ஸ்பானிஷ். மற்றும் கூடுதல் எட். செயின்ட் பீட்டர்ஸ்பர்க் பல்கலைக்கழகம், 2007.

ஹாஸ்பெல்மாத், எம்., மற்றும் பலர். (பதிப்பு.). மொழி கட்டமைப்புகளின் உலக அட்லஸ். ஆக்ஸ்போர்டு, 2005.

உலர்த்தி, எம்.எஸ். மற்றும் ஹாஸ்பெல்மாத், எம்.(பதிப்பு.) தி வேர்ல்ட் அட்லஸ் ஆஃப் லாங்குவேஜ் ஸ்ட்ரக்சர்ஸ் ஆன்லைன். லீப்ஜிக்: மேக்ஸ் பிளாங்க் இன்ஸ்டிடியூட் ஃபார் எவல்யூஷனரி ஆந்த்ரோபாலஜி, 2013. (http://wals.info)

கிராஃப்ட் டபிள்யூ.அச்சுக்கலை மற்றும் உலகளாவிய. கேம்பிரிட்ஜ்: கேம்பிரிட்ஜ் யுனிவர்சிட்டி பிரஸ், 2003. ஷோபன், டி. (பதிப்பு). மொழி அச்சுக்கலை மற்றும் தொடரியல் விளக்கம். 2வது பதிப்பு. கேம்பிரிட்ஜ், 2007.

V. I. பெலிகோவ். அகராதிகளைப் பற்றி “நவீன ரஷ்ய இலக்கிய மொழியின் விதிமுறைகளைக் கொண்டுள்ளது மாநில மொழி இரஷ்ய கூட்டமைப்பு" 2010 // போர்டல் Gramota.Ru (http://gramota.ru/biblio/research/slovari-norm)

கணினி மொழியியல் மற்றும் அறிவுசார் தொழில்நுட்பங்கள்: வருடாந்திர சர்வதேச மாநாட்டின் பொருட்கள் அடிப்படையில் "உரையாடல்". தொகுதி. 1-11. - எம்.: பப்ளிஷிங் ஹவுஸ் நௌகா, மனிதநேயத்திற்கான ரஷ்ய மாநில பல்கலைக்கழகத்தில் இருந்து, 2002-2012. (கணக்கீட்டு மொழியியல் பற்றிய கட்டுரைகள், http://www.dialog-21.ru).

ரஷ்ய மொழியின் தேசிய கார்பஸ்: 2006-2008. புதிய முடிவுகள் மற்றும் வாய்ப்புகள். / பிரதிநிதி. எட். வி. ஏ. பிளங்க்யான். - செயின்ட் பீட்டர்ஸ்பர்க்: நெஸ்டர்-ஹிஸ்டரி, 2009.

வெளிநாட்டு மொழியியலில் புதியது. தொகுதி. XXIV, கணக்கீட்டு மொழியியல் / Comp. பி.யு.கோரோடெட்ஸ்கி. எம்.: முன்னேற்றம், 1989.

ஷிம்சுக் ஈ.ஜி. ரஷ்ய அகராதி: பாடநூல். எம்.: அகாடமி, 2009.

ரஷ்ய மொழியின் தேசிய கார்பஸ்: 2003-2005. கட்டுரைகளின் தொகுப்பு. எம்.: இன்ட்ரிக், 2005.

தொடர்புகளுக்கு:

மனிதநேயத்திற்கான ரஷ்ய மாநில பல்கலைக்கழகத்தின் மொழியியல் நிறுவனத்தின் கணக்கீட்டு மொழியியல் கல்வி மற்றும் அறிவியல் மையம்

பாடப் பணி

"தகவல்" துறையில்

தலைப்பில்: "கணக்கீட்டு மொழியியல்"


அறிமுகம்

2. கணக்கீட்டு மொழியியலுக்கான நவீன இடைமுகங்கள்

முடிவுரை

இலக்கியம்


அறிமுகம்

வாழ்க்கையில் நவீன சமுதாயம்தானியங்கி தகவல் தொழில்நுட்பங்கள் முக்கிய பங்கு வகிக்கின்றன. காலப்போக்கில், அவற்றின் முக்கியத்துவம் தொடர்ந்து அதிகரிக்கிறது. ஆனால் தகவல் தொழில்நுட்பத்தின் வளர்ச்சி மிகவும் சீரற்றது: தற்போதைய நிலை என்றால் கணினி தொழில்நுட்பம்தகவல்தொடர்பு வழிமுறைகள் ஆச்சரியமானவை, ஆனால் தகவல்களின் சொற்பொருள் செயலாக்கத் துறையில், வெற்றிகள் மிகவும் எளிமையானவை. இந்த வெற்றிகள், முதலில், மனித சிந்தனையின் செயல்முறைகள், மக்களிடையே வாய்மொழி தகவல்தொடர்பு செயல்முறைகள் மற்றும் கணினியில் இந்த செயல்முறைகளை மாதிரியாக்கும் திறன் ஆகியவற்றின் ஆய்வில் உள்ள சாதனைகளைப் பொறுத்தது.

நம்பிக்கைக்குரிய தகவல் தொழில்நுட்பங்களை உருவாக்கும் போது, ​​​​இயற்கை மொழிகளில் வழங்கப்படும் உரைத் தகவல்களை தானாக செயலாக்குவதில் சிக்கல்கள் முன்னுக்கு வருகின்றன. ஒரு நபரின் சிந்தனை அவரது மொழியுடன் நெருக்கமாக இணைக்கப்பட்டுள்ளது என்பதன் மூலம் இது தீர்மானிக்கப்படுகிறது. மேலும், இயற்கை மொழி சிந்தனைக்கான ஒரு கருவியாகும். இது மக்களிடையே தகவல்தொடர்புக்கான உலகளாவிய வழிமுறையாகும் - கருத்து, குவிப்பு, சேமிப்பு, செயலாக்கம் மற்றும் தகவல் பரிமாற்றத்திற்கான ஒரு வழிமுறையாகும். கணினி மொழியியல் அறிவியல் தானியங்கி தகவல் செயலாக்க அமைப்புகளில் இயற்கை மொழியைப் பயன்படுத்துவதில் உள்ள சிக்கல்களைக் கையாள்கிறது. இந்த விஞ்ஞானம் ஒப்பீட்டளவில் சமீபத்தில் எழுந்தது - கடந்த நூற்றாண்டின் ஐம்பதுகள் மற்றும் அறுபதுகளின் தொடக்கத்தில். கடந்த அரை நூற்றாண்டில், கணினி மொழியியல் துறையில் குறிப்பிடத்தக்க அறிவியல் மற்றும் நடைமுறை முடிவுகள் பெறப்பட்டுள்ளன: ஒரு இயற்கை மொழியிலிருந்து மற்றொன்றுக்கு நூல்களை இயந்திர மொழிபெயர்ப்பதற்கான அமைப்புகள், உரைகளில் உள்ள தகவல்களை தானியங்கு முறையில் மீட்டெடுப்பதற்கான அமைப்புகள், தானியங்கி பகுப்பாய்வு மற்றும் தொகுப்புக்கான அமைப்புகள் உருவாக்கப்பட்டது வாய்வழி பேச்சுமற்றும் பலர். இந்த வேலைமொழியியல் ஆராய்ச்சியை மேற்கொள்ளும்போது கணினி மொழியியலைப் பயன்படுத்தி உகந்த கணினி இடைமுகத்தை உருவாக்குவதற்கு அர்ப்பணிக்கப்பட்டுள்ளது.


1. மொழியியல் ஆராய்ச்சியில் கணக்கீட்டு மொழியியலின் இடம் மற்றும் பங்கு

IN நவீன உலகம்பல்வேறு மொழியியல் ஆய்வுகளில் கணக்கீட்டு மொழியியல் அதிகளவில் பயன்படுத்தப்படுகிறது.

கணக்கீட்டு மொழியியல் என்பது இயற்கையான மொழியில் வழங்கப்பட்ட தகவல்களை தானியங்கு செயலாக்கத்தின் சிக்கல்களைத் தீர்ப்பதோடு தொடர்புடைய அறிவுத் துறையாகும். கணினி மொழியியலின் மைய அறிவியல் சிக்கல்கள், உரைகளின் பொருளைப் புரிந்துகொள்ளும் செயல்முறையை மாதிரியாக்குவது (உரையிலிருந்து அதன் அர்த்தத்தின் முறைப்படுத்தப்பட்ட பிரதிநிதித்துவத்திற்கு மாறுதல்) மற்றும் பேச்சுத் தொகுப்பின் சிக்கல் (இயற்கையில் உள்ள உரைகளுக்கு முறைப்படுத்தப்பட்ட அர்த்தத்திலிருந்து மாறுதல் மொழி). பல பயன்பாட்டு சிக்கல்களைத் தீர்க்கும்போது இந்த சிக்கல்கள் எழுகின்றன, குறிப்பாக, கணினியில் உரைகளை உள்ளிடும்போது பிழைகளைத் தானாகக் கண்டறிதல் மற்றும் சரிசெய்தல், தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி பேச்சின் தொகுப்பு, ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் தானியங்கி மொழிபெயர்ப்பு, தொடர்பு இயற்கை மொழியில் உள்ள கணினி, உரை ஆவணங்களின் தானியங்கு வகைப்பாடு மற்றும் அட்டவணைப்படுத்தல், அவற்றின் தானியங்கி சுருக்கம், முழு உரை தரவுத்தளங்களில் ஆவணங்களைத் தேடுதல்.

கணக்கீட்டு மொழியியலில் உருவாக்கப்பட்ட மற்றும் பயன்படுத்தப்படும் மொழியியல் கருவிகளை இரண்டு பகுதிகளாகப் பிரிக்கலாம்: அறிவிப்பு மற்றும் நடைமுறை. அறிவிப்புப் பகுதியில் மொழி மற்றும் பேச்சு அலகுகளின் அகராதிகள், உரைகள் மற்றும் பல்வேறு வகையான இலக்கண அட்டவணைகள் உள்ளன, நடைமுறைப் பகுதியில் மொழி மற்றும் பேச்சு அலகுகள், உரைகள் மற்றும் இலக்கண அட்டவணைகள் ஆகியவற்றைக் கையாளும் வழிமுறைகள் அடங்கும். கணினி இடைமுகம் என்பது கணக்கீட்டு மொழியியலின் செயல்முறைப் பகுதியைக் குறிக்கிறது.

கணினி மொழியியலின் பயன்பாட்டு சிக்கல்களைத் தீர்ப்பதில் வெற்றி, முதலில், கணினி நினைவகத்தில் அறிவிப்பு வழிமுறைகளின் பிரதிநிதித்துவத்தின் முழுமை மற்றும் துல்லியம் மற்றும் நடைமுறை வழிமுறைகளின் தரம் ஆகியவற்றைப் பொறுத்தது. உலகின் அனைத்து வளர்ந்த நாடுகளிலும் (ரஷ்யா, அமெரிக்கா, இங்கிலாந்து, பிரான்ஸ், ஜெர்மனி, ஜப்பான், முதலியன) கணக்கீட்டு மொழியியல் துறையில் பணிகள் மேற்கொள்ளப்பட்டாலும், இன்றுவரை, இந்த சிக்கல்களைத் தீர்ப்பதற்கான தேவையான அளவு இன்னும் அடையப்படவில்லை. )

ஆயினும்கூட, கணக்கீட்டு மொழியியல் துறையில் தீவிர அறிவியல் மற்றும் நடைமுறை சாதனைகளைக் குறிப்பிடலாம். இவ்வாறு, பல நாடுகளில் (ரஷ்யா, அமெரிக்கா, ஜப்பான், முதலியன) சோதனை மற்றும் தொழில்துறை அமைப்புகள்ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் இயந்திர மொழிபெயர்ப்பு, இயற்கையான மொழியில் கணினிகளுடன் தொடர்புகொள்வதற்கான பல சோதனை அமைப்புகள் கட்டப்பட்டுள்ளன, டெர்மினாலாஜிக்கல் தரவு வங்கிகள், சொற்களஞ்சியம், இருமொழி மற்றும் பன்மொழி இயந்திர அகராதிகளை (ரஷ்யா, அமெரிக்கா, ஜெர்மனி, பிரான்ஸ்) உருவாக்கும் பணி நடந்து வருகிறது. , முதலியன), அமைப்புகள் தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி பேச்சின் தொகுப்பு (ரஷ்யா, அமெரிக்கா, ஜப்பான் போன்றவை) உருவாக்கப்படுகின்றன, இயற்கை மொழி மாதிரிகளை உருவாக்கும் துறையில் ஆராய்ச்சி நடந்து வருகிறது.

பயன்பாட்டு கணக்கீட்டு மொழியியலின் ஒரு முக்கியமான வழிமுறை சிக்கல், தானியங்கி உரை தகவல் செயலாக்க அமைப்புகளின் அறிவிப்பு மற்றும் செயல்முறை கூறுகளுக்கு இடையே தேவையான உறவின் சரியான மதிப்பீடாகும். எது விரும்பப்பட வேண்டும்: வளமான இலக்கண மற்றும் சொற்பொருள் தகவல்களுடன் ஒப்பீட்டளவில் சிறிய சொற்களஞ்சிய அமைப்புகளை அடிப்படையாகக் கொண்ட சக்திவாய்ந்த கணக்கீட்டு நடைமுறைகள் அல்லது ஒப்பீட்டளவில் எளிமையான கணினி இடைமுகங்களைக் கொண்ட சக்திவாய்ந்த அறிவிப்பு கூறு? பெரும்பாலான விஞ்ஞானிகள் இரண்டாவது வழி விரும்பத்தக்கது என்று நம்புகிறார்கள். இது நடைமுறை இலக்குகளை விரைவாக அடைய வழிவகுக்கும், ஏனெனில் குறைவான முட்டுக்கட்டைகள் மற்றும் கடக்க கடினமான தடைகள் இருக்கும், மேலும் இங்கு ஆராய்ச்சி மற்றும் மேம்பாட்டை தானியக்கமாக்குவதற்கு கணினிகளை பெரிய அளவில் பயன்படுத்த முடியும்.

தானியங்கி உரை தகவல் செயலாக்க அமைப்புகளின் அறிவிப்பு கூறுகளை உருவாக்குவதற்கான முயற்சிகளை அணிதிரட்ட வேண்டிய அவசியம், கணினி மொழியியல் வளர்ச்சியில் அரை நூற்றாண்டு அனுபவத்தால் உறுதிப்படுத்தப்பட்டுள்ளது. எல்லாவற்றிற்கும் மேலாக, இங்கே, இந்த அறிவியலின் மறுக்க முடியாத வெற்றிகள் இருந்தபோதிலும், அல்காரிதம் நடைமுறைகளுக்கான ஆர்வம் எதிர்பார்த்த வெற்றியைக் கொண்டுவரவில்லை. நடைமுறை வழிமுறைகளின் திறன்களில் சில ஏமாற்றம் கூட இருந்தது.

மேற்கூறியவற்றின் வெளிச்சத்தில், கணினி மொழியியலின் வளர்ச்சியின் அத்தகைய பாதையை உருவாக்குவது உறுதியளிக்கிறது, முக்கிய முயற்சிகள் மொழி மற்றும் பேச்சு அலகுகளின் சக்திவாய்ந்த அகராதிகளை உருவாக்குதல், அவற்றின் சொற்பொருள்-தொடரியல் கட்டமைப்பை ஆய்வு செய்தல் மற்றும் உருவவியல் அடிப்படை நடைமுறைகளை உருவாக்குதல், சொற்பொருள்-தொடக்கவியல் மற்றும் கருத்தியல் பகுப்பாய்வு மற்றும் உரைகளின் தொகுப்பு. இது எதிர்காலத்தில் பரவலான பயன்பாட்டு சிக்கல்களைத் தீர்க்க அனுமதிக்கும்.

கணினி மொழியியல், முதலில், தகவல்களைச் சேகரித்தல், குவித்தல், செயலாக்குதல் மற்றும் மீட்டெடுப்பதற்கான செயல்முறைகளுக்கான மொழியியல் ஆதரவின் பணிகளை எதிர்கொள்கிறது. அவற்றில் மிக முக்கியமானவை:

1. இயந்திர அகராதிகளின் தொகுத்தல் மற்றும் மொழியியல் செயலாக்கத்தின் ஆட்டோமேஷன்;

2. கணினியில் உரைகளை உள்ளிடும்போது பிழைகளைக் கண்டறிந்து திருத்தும் செயல்முறைகளின் ஆட்டோமேஷன்;

3. ஆவணங்கள் மற்றும் தகவல் கோரிக்கைகளின் தானியங்கி அட்டவணைப்படுத்தல்;

4. ஆவணங்களின் தானியங்கு வகைப்பாடு மற்றும் சுருக்கம்;

5. ஒருமொழி மற்றும் பன்மொழி தரவுத்தளங்களில் தகவல் மீட்டெடுப்பு செயல்முறைகளுக்கான மொழியியல் ஆதரவு;

6. ஒரு இயற்கை மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் இயந்திர மொழிபெயர்ப்பு;

7. தானியங்கி அறிவார்ந்த தகவல் அமைப்புகளுடன் (குறிப்பாக, நிபுணர் அமைப்புகள்) இயற்கையான மொழியில் அல்லது இயற்கைக்கு நெருக்கமான மொழியில் பயனர் தொடர்புகளை உறுதி செய்யும் மொழியியல் செயலிகளின் கட்டுமானம்;

8. முறைசாரா நூல்களிலிருந்து உண்மைத் தகவல்களைப் பிரித்தெடுத்தல்.

ஆராய்ச்சியின் தலைப்புக்கு மிகவும் பொருத்தமான சிக்கல்களில் விரிவாக வாழ்வோம்.

தகவல் மையங்களின் நடைமுறை நடவடிக்கைகளில், தானாக கண்டறிதல் மற்றும் உரைகளில் உள்ள பிழைகளை கணினியில் உள்ளிடும்போது அவற்றை சரிசெய்தல் ஆகியவற்றின் சிக்கலை தீர்க்க வேண்டிய அவசியம் உள்ளது. இந்த சிக்கலான பணியை நிபந்தனையுடன் மூன்று பணிகளாகப் பிரிக்கலாம் - ஆர்த்தோகிராஃபிக், தொடரியல் மற்றும் சொற்பொருள் கட்டுப்பாட்டின் பணிகள். அவற்றில் முதன்மையானது, சொல் தண்டுகளின் மிகவும் சக்திவாய்ந்த குறிப்பு இயந்திர அகராதியைப் பயன்படுத்தும் உருவவியல் பகுப்பாய்வு செயல்முறையைப் பயன்படுத்தி தீர்க்கப்படலாம். எழுத்துப்பிழைக் கட்டுப்பாட்டின் செயல்பாட்டில், உரையின் சொற்கள் உருவவியல் பகுப்பாய்விற்கு உட்பட்டவை, மேலும் அவற்றின் அடிப்படைகள் குறிப்பு அகராதியின் அடிப்படைகளுடன் அடையாளம் காணப்பட்டால், அவை சரியானதாகக் கருதப்படுகின்றன; அவை அடையாளம் காணப்படவில்லை என்றால், அவை, ஒரு நுண்ணிய சூழலுடன் சேர்ந்து, ஒரு நபருக்கு பார்வைக்கு வழங்கப்படுகின்றன. ஒரு நபர் சிதைந்த சொற்களைக் கண்டறிந்து திருத்துகிறார், மேலும் தொடர்புடைய மென்பொருள் அமைப்பு இந்த திருத்தங்களை திருத்தப்பட்ட உரையாக மாற்றுகிறது.

எழுத்துப்பிழைகளைக் கண்டறிவதற்காக உரைகளின் தொடரியல் கட்டுப்பாட்டின் பணி எழுத்துக் கட்டுப்பாட்டின் பணியை விட மிகவும் கடினம். முதலாவதாக, அதன் கலவையில் எழுத்துப்பிழைக் கட்டுப்பாட்டை அதன் கட்டாய அங்கமாக உள்ளடக்கியிருப்பதால், இரண்டாவதாக, முறைசாரா நூல்களின் தொடரியல் பகுப்பாய்வின் சிக்கல் இன்னும் முழுமையாக தீர்க்கப்படவில்லை. இருப்பினும், உரைகளின் பகுதி தொடரியல் கட்டுப்பாடு மிகவும் சாத்தியம். இங்கே நீங்கள் இரண்டு வழிகளில் செல்லலாம்: குறிப்பு தொடரியல் கட்டமைப்புகளின் மிகவும் பிரதிநிதித்துவ இயந்திர அகராதிகளைத் தொகுக்கவும் மற்றும் பகுப்பாய்வு செய்யப்பட்ட உரையின் தொடரியல் கட்டமைப்புகளை அவற்றுடன் ஒப்பிடவும்; அல்லது உரை கூறுகளின் இலக்கண நிலைத்தன்மையை சரிபார்க்க சிக்கலான விதிகளை உருவாக்கவும். முதல் பாதை எங்களுக்கு மிகவும் நம்பிக்கைக்குரியதாகத் தோன்றுகிறது, இருப்பினும் இது இரண்டாவது பாதையின் கூறுகளைப் பயன்படுத்துவதற்கான வாய்ப்பை விலக்கவில்லை. உரைகளின் தொடரியல் அமைப்பு வார்த்தைகளின் இலக்கண வகுப்புகளின் அடிப்படையில் விவரிக்கப்பட வேண்டும் (இன்னும் துல்லியமாக, சொற்களுக்கான இலக்கண தகவல்களின் தொகுப்புகளின் வரிசைகளின் வடிவத்தில்).

சொற்பொருள் பிழைகளைக் கண்டறிவதற்காக நூல்களின் சொற்பொருள் கட்டுப்பாட்டின் பணி செயற்கை நுண்ணறிவு பணிகளின் வகுப்பாக வகைப்படுத்தப்பட வேண்டும். மனித சிந்தனையின் செயல்முறைகளை மாதிரியாக்குவதன் அடிப்படையில் மட்டுமே இது முழுமையாக தீர்க்கப்பட முடியும். இந்த வழக்கில், அறிவு கையாளுதலுக்கான சக்திவாய்ந்த கலைக்களஞ்சிய அறிவுத் தளங்கள் மற்றும் மென்பொருள் கருவிகளை உருவாக்குவது அவசியமாக இருக்கும். இருப்பினும், வரையறுக்கப்பட்ட பாடப் பகுதிகள் மற்றும் முறைப்படுத்தப்பட்ட தகவல்களுக்கு, இந்த பணி முற்றிலும் தீர்க்கக்கூடியது. இது உரைகளின் சொற்பொருள்-தொடக்கக் கட்டுப்பாட்டின் சிக்கலாக முன்வைக்கப்பட்டு தீர்க்கப்பட வேண்டும்.

ஆவணங்கள் மற்றும் வினவல்களின் அட்டவணைப்படுத்தலை தானியங்குபடுத்துவதில் உள்ள சிக்கல் தானியங்கு உரை தகவல் மீட்டெடுப்பு அமைப்புகளுக்கு பாரம்பரியமானது. முதலில், அட்டவணைப்படுத்தல் என்பது அவற்றின் கருப்பொருள் உள்ளடக்கத்தை பிரதிபலிக்கும் ஆவணங்கள் மற்றும் வினவல்களுக்கு வகைப்படுத்தல் குறியீடுகளை ஒதுக்கும் செயல்முறையாக புரிந்து கொள்ளப்பட்டது. பின்னர், இந்த கருத்து மாற்றப்பட்டது மற்றும் "அட்டவணை" என்ற சொல் ஆவணங்கள் மற்றும் வினவல்களின் விளக்கங்களை இயற்கை மொழியிலிருந்து முறைப்படுத்தப்பட்ட மொழியில், குறிப்பாக, "தேடல் படங்கள்" மொழியில் மொழிபெயர்க்கும் செயல்முறையைக் குறிக்கத் தொடங்கியது. ஆவணங்களின் தேடல் படங்கள், ஒரு விதியாக, அவற்றின் கருப்பொருள் உள்ளடக்கத்தை பிரதிபலிக்கும் முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்களின் பட்டியல்களின் வடிவத்தில் வரையப்படத் தொடங்கின, மேலும் வினவல்களின் படங்களைத் தேடுங்கள் - முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்கள் ஒன்றோடொன்று இணைக்கப்பட்ட தருக்க கட்டமைப்புகளின் வடிவத்தில். தருக்க மற்றும் தொடரியல் ஆபரேட்டர்கள் மூலம்.

ஆவணங்களை அவற்றின் சுருக்கங்களின் (ஏதேனும் இருந்தால்) அடிப்படையில் தானாக அட்டவணைப்படுத்துவது வசதியானது, ஏனெனில் சுருக்கங்கள் ஆவணங்களின் முக்கிய உள்ளடக்கத்தை செறிவூட்டப்பட்ட வடிவத்தில் பிரதிபலிக்கின்றன. அட்டவணைப்படுத்தல் சொற்களஞ்சியம் கட்டுப்பாட்டுடன் அல்லது இல்லாமல் மேற்கொள்ளப்படலாம். முதல் வழக்கில், ஆவணத்தின் தலைப்பின் உரை மற்றும் அதன் சுருக்கம், குறிப்பு இயந்திர அகராதியின் முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்கள் தேடப்பட்டு, அகராதியில் உள்ளவை மட்டுமே AML இல் சேர்க்கப்பட்டுள்ளன. இரண்டாவது வழக்கில், முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்கள் உரையிலிருந்து தனிமைப்படுத்தப்பட்டு POD இல் சேர்க்கப்படும், அவை எந்த குறிப்பு அகராதியிலும் இல்லை. மூன்றாவது விருப்பமும் செயல்படுத்தப்பட்டது, அங்கு, இயந்திர சொற்களஞ்சியத்தின் விதிமுறைகளுடன், AML ஆவணத்தின் தலைப்பு மற்றும் முதல் வாக்கியத்திலிருந்து பிரித்தெடுக்கப்பட்ட சொற்களையும் உள்ளடக்கியது. தலைப்புகள் மற்றும் ஆவணங்களின் சுருக்கங்களைப் பயன்படுத்தி தானாக தொகுக்கப்பட்ட PODகள் கைமுறையாக தொகுக்கப்பட்ட PODகளை விட அதிக தேடல் முழுமையை வழங்குவதாக சோதனைகள் காட்டுகின்றன. கையேடு குறியீட்டு முறையை விட தானியங்கி அட்டவணைப்படுத்தல் அமைப்பு ஆவணங்களின் உள்ளடக்கத்தின் பல்வேறு அம்சங்களை முழுமையாக பிரதிபலிக்கிறது என்பதன் மூலம் இது விளக்கப்படுகிறது.

வினவல்களின் தானியங்கி அட்டவணைப்படுத்தல் ஆவணங்களின் தானியங்கி அட்டவணைப்படுத்தல் போன்ற சிக்கல்களை ஏற்படுத்துகிறது. இங்கே நீங்கள் உரையிலிருந்து முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்களைப் பிரித்தெடுக்க வேண்டும் மற்றும் வினவல் உரையில் சேர்க்கப்பட்டுள்ள சொற்களை இயல்பாக்க வேண்டும். முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்கள் மற்றும் சூழ்நிலை ஆபரேட்டர்களுக்கு இடையே உள்ள தர்க்கரீதியான இணைப்புகளை கைமுறையாக அல்லது தானியங்கு செயல்முறையைப் பயன்படுத்தி உள்ளிடலாம். வினவலின் தானியங்கி அட்டவணைப்படுத்தல் செயல்முறையின் ஒரு முக்கிய அங்கம், அதன் முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்களை அவற்றின் ஒத்த சொற்கள் மற்றும் ஹைப்போனிம்களுடன் சேர்ப்பது ஆகும் (சில நேரங்களில் ஹைபரோனிம்கள் மற்றும் அசல் வினவல் சொற்களுடன் தொடர்புடைய பிற சொற்களும்). இது ஒரு இயந்திர சொற்களஞ்சியத்தைப் பயன்படுத்தி தானாகவே அல்லது ஊடாடும் வகையில் செய்யப்படலாம்.

தானியங்கி அட்டவணையிடல் பணி தொடர்பாக ஆவணத் தகவலுக்கான தேடலை தானியங்குபடுத்துவதில் உள்ள சிக்கலை நாங்கள் ஏற்கனவே ஓரளவு கருத்தில் கொண்டுள்ளோம். இந்த நோக்கத்திற்காக அனைத்து வகையான மாற்றீடுகளின் பயன்பாடு (நூல் விளக்கங்கள், ஆவணங்களின் தேடல் படங்கள் மற்றும் அவற்றின் சுருக்கங்களின் உரைகள்) தேடலின் போது தகவல்களை இழக்க வழிவகுக்கும் என்பதால், அவற்றின் முழு உரைகளையும் பயன்படுத்தி ஆவணங்களைத் தேடுவதே இங்கு மிகவும் நம்பிக்கைக்குரியது. முதன்மை ஆவணங்களுக்கு மாற்றாக நூலியல் விளக்கங்கள் பயன்படுத்தப்படும்போது மிகப்பெரிய இழப்புகள் ஏற்படுகின்றன, மேலும் சுருக்கங்கள் பயன்படுத்தப்படும்போது மிகச்சிறிய இழப்புகள் ஏற்படுகின்றன.

தகவல் மீட்டெடுப்பின் தரத்தின் முக்கிய பண்புகள் அதன் முழுமை மற்றும் துல்லியம் ஆகும். மொழி மற்றும் பேச்சு அலகுகள் (சொற்கள் மற்றும் சொற்றொடர்கள்) மற்றும் துல்லியம் - அவற்றின் தொடரியல் இணைப்புகளை கணக்கில் எடுத்துக்கொள்வதன் மூலம் அதிகபட்ச முன்னுதாரண இணைப்புகளை எடுத்துக்கொள்வதன் மூலம் தேடலின் முழுமையை உறுதிப்படுத்த முடியும். தேடலின் முழுமையும் துல்லியமும் நேர்மாறாக தொடர்புடையவை என்று ஒரு கருத்து உள்ளது: இந்த குணாதிசயங்களில் ஒன்றை மேம்படுத்துவதற்கான நடவடிக்கைகள் மற்றொன்றில் மோசமடைய வழிவகுக்கும். ஆனால் இது நிலையான தேடல் தர்க்கத்திற்கு மட்டுமே பொருந்தும். இந்த தர்க்கம் மேம்படுத்தப்பட்டால், இரண்டு பண்புகளையும் ஒரே நேரத்தில் மேம்படுத்தலாம்.

பயனர் மற்றும் தகவல் மீட்டெடுப்பு அமைப்பு (IRS) ஆகியவற்றுக்கு இடையேயான ஊடாடும் தகவல்தொடர்பு செயல்முறையாக முழு-உரை தரவுத்தளங்களில் தகவலைத் தேடும் செயல்முறையை உருவாக்குவது நல்லது. கோரிக்கை, மற்றும் அவருக்கு பொருத்தமானவற்றைத் தேர்ந்தெடுக்கிறது. இறுதி தேடல் முடிவுகள் இவ்வாறு தோன்றலாம் முழு நூல்கள்ஆவணங்கள் மற்றும் அதன் துண்டுகள்.

முந்தைய விவாதங்களிலிருந்து காணக்கூடியது போல, தானாகவே தகவல்களைத் தேடும் போது, ​​உரைகளில் நிகழும் அதே அர்த்தத்தின் பல்வேறு வடிவங்களின் பிரதிநிதித்துவத்தின் காரணமாக பயனருக்கும் தகவல் அமைப்புக்கும் இடையே எழும் மொழித் தடையை கடக்க வேண்டியது அவசியம். பன்மொழி தரவுத்தளங்களில் தேடுதல் மேற்கொள்ளப்பட வேண்டும் என்றால் இந்த தடை இன்னும் குறிப்பிடத்தக்கதாகிறது. ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு ஆவண நூல்களை இயந்திர மொழிபெயர்ப்பதே இங்குள்ள சிக்கலுக்கு ஒரு தீவிரமான தீர்வு. இது முன்கூட்டியே, தேடுபொறியில் ஆவணங்களை ஏற்றுவதற்கு முன் அல்லது தகவலைத் தேடும் போது செய்யப்படலாம். பிந்தைய வழக்கில், பயனரின் கோரிக்கையானது தேடல் நடத்தப்படும் ஆவண வரிசையின் மொழியில் மொழிபெயர்க்கப்பட வேண்டும், மேலும் தேடல் முடிவுகள் கோரிக்கையின் மொழியில் மொழிபெயர்க்கப்பட வேண்டும். இந்த வகையான தேடுபொறிகள் ஏற்கனவே இணையத்தில் இயங்குகின்றன. VINITI RAS ஆனது ஒரு சிரிலிக் உலாவி அமைப்பையும் உருவாக்கியுள்ளது, இது ரஷ்ய மொழி உரைகளில் உள்ள தகவலை ஆங்கிலத்தில் வினவல்களைப் பயன்படுத்தி பயனர் மொழியிலும் தேடல் முடிவுகளுடன் தேட அனுமதிக்கிறது.

கணினி மொழியியலின் முக்கியமான மற்றும் நம்பிக்கைக்குரிய பணியானது, இயற்கையான மொழியில் அல்லது இயற்கைக்கு நெருக்கமான மொழியில் அறிவார்ந்த தானியங்கி தகவல் அமைப்புகளுடன் (குறிப்பாக, நிபுணர் அமைப்புகள்) பயனர் தொடர்புகளை உறுதி செய்யும் மொழியியல் செயலிகளை உருவாக்குவதாகும். நவீன அறிவார்ந்த அமைப்புகளில் தகவல் முறைப்படுத்தப்பட்ட வடிவத்தில் சேமிக்கப்படுவதால், ஒரு நபருக்கும் கணினிக்கும் இடையில் இடைத்தரகர்களாக செயல்படும் மொழியியல் செயலிகள் பின்வரும் முக்கிய பணிகளைத் தீர்க்க வேண்டும்: 1) உள்ளீட்டு தகவல் கோரிக்கைகள் மற்றும் செய்திகளின் உரையிலிருந்து இயற்கையான முறையில் மாற்றும் பணி ஒரு முறைப்படுத்தப்பட்ட மொழியில் அவற்றின் பொருளைக் குறிக்கும் மொழி (ஒரு கணினியில் தகவலை உள்ளிடும்போது); 2) வெளியீட்டுச் செய்திகளின் பொருளின் முறையான பிரதிநிதித்துவத்திலிருந்து இயற்கையான மொழியில் அதன் பிரதிநிதித்துவத்திற்கு (ஒரு நபருக்கு தகவலை வழங்கும்போது) மாற்றும் பணி. முதல் பணியானது உள்ளீட்டு வினவல்கள் மற்றும் செய்திகளின் உருவவியல், தொடரியல் மற்றும் கருத்தியல் பகுப்பாய்வு மூலம் தீர்க்கப்பட வேண்டும், இரண்டாவது - வெளியீட்டு செய்திகளின் கருத்தியல், தொடரியல் மற்றும் உருவவியல் தொகுப்பு மூலம்.

தகவல் கோரிக்கைகள் மற்றும் செய்திகளின் கருத்தியல் பகுப்பாய்வு அவற்றின் கருத்தியல் கட்டமைப்பை (கருத்துகளின் பெயர்களின் எல்லைகள் மற்றும் உரையில் உள்ள கருத்துக்களுக்கு இடையிலான உறவுகள்) அடையாளம் கண்டு, இந்த கட்டமைப்பை முறைப்படுத்தப்பட்ட மொழியில் மொழிபெயர்ப்பதைக் கொண்டுள்ளது. கோரிக்கைகள் மற்றும் செய்திகளின் உருவவியல் மற்றும் தொடரியல் பகுப்பாய்வுக்குப் பிறகு இது மேற்கொள்ளப்படுகிறது. செய்திகளின் கருத்தியல் தொகுப்பு முறைப்படுத்தப்பட்ட மொழியில் அவற்றின் கட்டமைப்பின் கூறுகளின் பிரதிநிதித்துவத்திலிருந்து வாய்மொழி (வாய்மொழி) பிரதிநிதித்துவத்திற்கு மாறுவதைக் கொண்டுள்ளது. இதற்குப் பிறகு, செய்திகளுக்கு தேவையான தொடரியல் மற்றும் உருவ வடிவம் கொடுக்கப்படுகிறது.

ஒரு இயற்கை மொழியிலிருந்து மற்றொன்றுக்கு நூல்களை இயந்திர மொழிபெயர்ப்பதற்கு, கருத்துகளின் பெயர்களுக்கு இடையில் மொழிபெயர்ப்பு கடிதங்களின் அகராதிகளை வைத்திருப்பது அவசியம். இத்தகைய மொழிபெயர்ப்பு கடிதங்களைப் பற்றிய அறிவு பல தலைமுறை மக்களால் திரட்டப்பட்டது மற்றும் சிறப்பு வெளியீடுகள் - இருமொழி அல்லது பன்மொழி அகராதிகள் வடிவில் தொகுக்கப்பட்டது. சில அறிவு உள்ள நிபுணர்களுக்கு வெளிநாட்டு மொழிகள், இந்த அகராதிகள் நூல்களை மொழிபெயர்ப்பதில் மதிப்புமிக்க உதவிகளாக செயல்பட்டன.

பாரம்பரிய இருமொழி மற்றும் பன்மொழி பொது-நோக்கு அகராதிகளில், மொழிபெயர்ப்புச் சமமானவை முதன்மையாக தனிப்பட்ட சொற்களுக்கும், சொற்றொடர்களுக்கும் - மிகக் குறைவாகவே குறிப்பிடப்படுகின்றன. சொற்றொடருக்கான மொழிபெயர்ப்புச் சமமான குறிப்பானது சிறப்புச் சொற்களஞ்சிய அகராதிகளுக்கு மிகவும் பொதுவானதாக இருந்தது. எனவே, பல சொற்களைக் கொண்ட நூல்களின் பகுதிகளை மொழிபெயர்க்கும்போது, ​​மாணவர்கள் பெரும்பாலும் சிரமங்களை எதிர்கொண்டனர்.

"பள்ளி" தலைப்புகளில் பல ஜோடி ஆங்கிலம் மற்றும் ரஷ்ய சொற்றொடர்களுக்கு இடையேயான மொழிபெயர்ப்பு கடிதங்கள் கீழே உள்ளன.

1) வௌவால் இறக்கைகளுடன் சுண்டெலி போல் தெரிகிறது - வௌவால்இறக்கைகள் கொண்ட எலி போல் தெரிகிறது.

2) குழந்தைகள் கடற்கரையில் மணலில் விளையாட விரும்புகிறார்கள் - குழந்தைகள் கடற்கரையில் மணலில் விளையாட விரும்புகிறார்கள்.

3) ஒரு துளி மழை என் கையில் விழுந்தது - ஒரு துளி மழை என் கையில் விழுந்தது.

4) உலர்ந்த மரம் எளிதில் எரிகிறது - உலர்ந்த மரம் நன்றாக எரிகிறது.

5) அவர் என்னைக் கேட்காதது போல் நடித்தார் - அவர் என்னைக் கேட்காதது போல் நடித்தார்.

இங்கே ஆங்கில சொற்றொடர்கள்மொழியியல் வெளிப்பாடுகள் அல்ல. எவ்வாறாயினும், ரஷ்ய மொழியில் அவற்றின் மொழிபெயர்ப்பு ஒரு எளிய வார்த்தைக்கு வார்த்தை மொழிபெயர்ப்பாக மட்டுமே கருதப்படும், ஏனெனில் அவற்றில் சேர்க்கப்பட்டுள்ள அனைத்து சொற்களும் தெளிவற்றவை. எனவே, கணினி மொழியியல் சாதனைகள் மட்டுமே இங்கு மாணவர்களுக்கு உதவும்.

நோவோசெலோவா இரினா

ஏன் அனைத்து இயந்திர மொழிபெயர்ப்புகளும் சரியானதாக இல்லை? மொழிபெயர்ப்பின் தரத்தை எது தீர்மானிக்கிறது? ஏற்கனவே உள்ள கணினி அகராதிகளைப் பயன்படுத்தவும் விரிவுபடுத்தவும் ஆசிரியருக்கு போதுமான அறிவு இருக்கிறதா? இந்த கேள்விகளுக்கான பதில்களை ஆசிரியர் தனது படைப்பில் வழங்க முயன்றார். தலைப்பைப் பற்றிய அறிக்கை இணைக்கப்பட்ட கோப்பில் உள்ளது, திட்டச் செயல்பாட்டின் தயாரிப்பு பள்ளி போர்ட்டலில் உள்ளது

பதிவிறக்க Tamil:

முன்னோட்ட:

திற

சர்வதேச

ஆராய்ச்சி

மாநாடு

உயர்நிலைப் பள்ளி மாணவர்கள் மற்றும் மாணவர்கள்

"கல்வி. அறிவியல். தொழில்"

பிரிவு "வெளிநாட்டு மொழியியல்"

"கணக்கீட்டு மொழியியல்"

நோவோசெலோவா இரினா நிகழ்த்தினார்

முனிசிபல் கல்வி நிறுவனம் உடற்பயிற்சி கூடம் எண். 39 "கிளாசிக்கல்"

10 "பி" வகுப்பு

அறிவியல் மேற்பார்வையாளர்கள்:

சிக்ரினியோவா டாட்டியானா டிமிட்ரிவ்னா,

ஆசிரியர் ஆங்கிலத்தில்மிக உயர்ந்த வகை

ஒசிபோவா ஸ்வெட்லானா லியோனிடோவ்னா,

மிக உயர்ந்த வகை கணினி அறிவியல் ஆசிரியர்

ஓட்ராட்னி

2011

  1. ICT இல் ஆங்கில வார்த்தைகள்

இணையதளத்தில் பாருங்கள்

  1. என் பரிசோதனை

பணிகளில் ஒன்று, ஒரு பரிசோதனையை நடத்துவதாகும், இது ஆங்கிலத்திலிருந்து ரஷ்ய மொழியில் மிகவும் துல்லியமான மற்றும் தோராயமான மொழிபெயர்ப்புக்கு பல்வேறு கணினி மொழியியல் அகராதிகளின் திறன்களை ஒப்பிடுவதை உள்ளடக்கியது.

பின்வரும் தளங்கள் சோதிக்கப்பட்டன:

  1. http://translate.eu/
  2. http://translate.google.ru/#ru
  3. http://www.langinfo.ru/index.php?div=6
  4. http://www2.worldlingo.com/ru/products_services/worldlingo_translator.html

சோதனையின் தூய்மைக்காக, ஸ்டைலிஸ்டிக் மொழிபெயர்ப்பின் சிக்கலான பல்வேறு அளவுகளைக் கொண்ட வாக்கியங்களைத் தேர்ந்தெடுத்தேன். உள்ளீட்டு சொற்றொடர்கள் பின்வருமாறு:

1. 20 ஆண்டுகளுக்கு முன்பு இருந்ததை விட இன்றைய இளைஞர்கள் சுயநலவாதிகள் என்று ஒரு புதிய அறிக்கை கூறுகிறது

(புதிய அறிக்கை கூறுகிறது நவீன இளைஞர்கள் 20 ஆண்டுகளுக்கு முன்பு இருந்ததை விட சுயநலம் அதிகம்)

2. இந்த அதிகரித்த சுயநலத்திற்கு வீடியோ கேம்களும் இணையமும் மிகப்பெரிய காரணம் என்று அவர் நம்புகிறார்.

(வீடியோ கேம்களும் இணையமும் இந்த அதிகரித்து வரும் சுயநலத்திற்கு மிக முக்கியமான காரணங்கள் என்று அவர் நம்புகிறார்)

3. அவர்கள் மற்றவர்களை விட சிறப்பாக இருக்க விரும்புகிறார்கள்

(அவர்கள் மற்றவர்களை விட சிறப்பாக இருக்க விரும்புகிறார்கள்)

4. 2000 ஆம் ஆண்டிலிருந்து பெரிய அதிகரிப்பு தொடங்கியது, அப்போதுதான் வன்முறை வீடியோ கேம்கள் மிகவும் பிரபலமாகின.

(வன்முறை வீடியோ கேம்கள் உண்மையில் பிரபலமடைந்தபோது 2000 ஆம் ஆண்டு தொடங்கி அவர் ஒரு பெரிய அதிகரிப்பைக் கண்டார்)

ஆன்லைன் மொழிபெயர்ப்பாளர் தளங்களில் இந்த வாக்கியங்களை மொழிபெயர்த்ததால், பின்வரும் முடிவுகளைப் பெற்றேன்:

  1. http://translate.eu/

பாடப் பணி

"தகவல்" துறையில்

தலைப்பில்: "கணக்கீட்டு மொழியியல்"


அறிமுகம்

1. மொழியியல் ஆராய்ச்சியில் கணக்கீட்டு மொழியியலின் இடம் மற்றும் பங்கு

2. கணக்கீட்டு மொழியியலுக்கான நவீன இடைமுகங்கள்

முடிவுரை

இலக்கியம்


அறிமுகம்

நவீன சமூகத்தின் வாழ்க்கையில் தானியங்கி தகவல் தொழில்நுட்பங்கள் முக்கிய பங்கு வகிக்கின்றன. காலப்போக்கில், அவற்றின் முக்கியத்துவம் தொடர்ந்து அதிகரிக்கிறது. ஆனால் தகவல் தொழில்நுட்பத்தின் வளர்ச்சி மிகவும் சீரற்றது: கணினி தொழில்நுட்பம் மற்றும் தகவல்தொடர்புகளின் நவீன நிலை ஆச்சரியமாக இருந்தால், தகவலின் சொற்பொருள் செயலாக்கத் துறையில், வெற்றிகள் மிகவும் மிதமானவை. இந்த வெற்றிகள், முதலில், மனித சிந்தனையின் செயல்முறைகள், மக்களிடையே வாய்மொழி தகவல்தொடர்பு செயல்முறைகள் மற்றும் கணினியில் இந்த செயல்முறைகளை மாதிரியாக்கும் திறன் ஆகியவற்றின் ஆய்வில் உள்ள சாதனைகளைப் பொறுத்தது.

நம்பிக்கைக்குரிய தகவல் தொழில்நுட்பங்களை உருவாக்கும் போது, ​​​​இயற்கை மொழிகளில் வழங்கப்படும் உரைத் தகவல்களை தானாக செயலாக்குவதில் சிக்கல்கள் முன்னுக்கு வருகின்றன. ஒரு நபரின் சிந்தனை அவரது மொழியுடன் நெருக்கமாக இணைக்கப்பட்டுள்ளது என்பதன் மூலம் இது தீர்மானிக்கப்படுகிறது. மேலும், இயற்கை மொழி சிந்தனைக்கான ஒரு கருவியாகும். இது மக்களிடையே தகவல்தொடர்புக்கான உலகளாவிய வழிமுறையாகும் - கருத்து, குவிப்பு, சேமிப்பு, செயலாக்கம் மற்றும் தகவல் பரிமாற்றத்திற்கான ஒரு வழிமுறையாகும். கணினி மொழியியல் அறிவியல் தானியங்கி தகவல் செயலாக்க அமைப்புகளில் இயற்கை மொழியைப் பயன்படுத்துவதில் உள்ள சிக்கல்களைக் கையாள்கிறது. இந்த விஞ்ஞானம் ஒப்பீட்டளவில் சமீபத்தில் எழுந்தது - கடந்த நூற்றாண்டின் ஐம்பதுகள் மற்றும் அறுபதுகளின் தொடக்கத்தில். கடந்த அரை நூற்றாண்டில், கணினி மொழியியல் துறையில் குறிப்பிடத்தக்க அறிவியல் மற்றும் நடைமுறை முடிவுகள் பெறப்பட்டுள்ளன: ஒரு இயற்கை மொழியிலிருந்து மற்றொன்றுக்கு நூல்களை இயந்திர மொழிபெயர்ப்பதற்கான அமைப்புகள், உரைகளில் தானியங்கு தகவல்களை மீட்டெடுப்பதற்கான அமைப்புகள், தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி தொகுப்புக்கான அமைப்புகள். பேச்சு, மற்றும் பல உருவாக்கப்பட்டுள்ளன. மொழியியல் ஆராய்ச்சியின் போது கணினி மொழியியலைப் பயன்படுத்தி உகந்த கணினி இடைமுகத்தை உருவாக்குவதற்கு இந்த வேலை அர்ப்பணிக்கப்பட்டுள்ளது.


நவீன உலகில், பல்வேறு மொழியியல் ஆய்வுகளை நடத்துவதற்கு கணக்கீட்டு மொழியியல் அதிகளவில் பயன்படுத்தப்படுகிறது.

கணக்கீட்டு மொழியியல் என்பது இயற்கையான மொழியில் வழங்கப்பட்ட தகவல்களை தானியங்கு செயலாக்கத்தின் சிக்கல்களைத் தீர்ப்பதோடு தொடர்புடைய அறிவுத் துறையாகும். கணினி மொழியியலின் மைய அறிவியல் சிக்கல்கள், உரைகளின் பொருளைப் புரிந்துகொள்ளும் செயல்முறையை மாதிரியாக்குவது (உரையிலிருந்து அதன் அர்த்தத்தின் முறைப்படுத்தப்பட்ட பிரதிநிதித்துவத்திற்கு மாறுதல்) மற்றும் பேச்சுத் தொகுப்பின் சிக்கல் (இயற்கையில் உள்ள உரைகளுக்கு முறைப்படுத்தப்பட்ட அர்த்தத்திலிருந்து மாறுதல் மொழி). பல பயன்பாட்டு சிக்கல்களைத் தீர்க்கும்போது இந்த சிக்கல்கள் எழுகின்றன, குறிப்பாக, கணினியில் உரைகளை உள்ளிடும்போது பிழைகளைத் தானாகக் கண்டறிதல் மற்றும் சரிசெய்தல், தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி பேச்சின் தொகுப்பு, ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் தானியங்கி மொழிபெயர்ப்பு, தொடர்பு இயற்கை மொழியில் உள்ள கணினி, உரை ஆவணங்களின் தானியங்கு வகைப்பாடு மற்றும் அட்டவணைப்படுத்தல், அவற்றின் தானியங்கி சுருக்கம், முழு உரை தரவுத்தளங்களில் ஆவணங்களைத் தேடுதல்.

கணக்கீட்டு மொழியியலில் உருவாக்கப்பட்ட மற்றும் பயன்படுத்தப்படும் மொழியியல் கருவிகளை இரண்டு பகுதிகளாகப் பிரிக்கலாம்: அறிவிப்பு மற்றும் நடைமுறை. அறிவிப்புப் பகுதியில் மொழி மற்றும் பேச்சு அலகுகளின் அகராதிகள், உரைகள் மற்றும் பல்வேறு வகையான இலக்கண அட்டவணைகள் உள்ளன, நடைமுறைப் பகுதியில் மொழி மற்றும் பேச்சு அலகுகள், உரைகள் மற்றும் இலக்கண அட்டவணைகள் ஆகியவற்றைக் கையாளும் வழிமுறைகள் அடங்கும். கணினி இடைமுகம் என்பது கணக்கீட்டு மொழியியலின் செயல்முறைப் பகுதியைக் குறிக்கிறது.

கணினி மொழியியலின் பயன்பாட்டு சிக்கல்களைத் தீர்ப்பதில் வெற்றி, முதலில், கணினி நினைவகத்தில் அறிவிப்பு வழிமுறைகளின் பிரதிநிதித்துவத்தின் முழுமை மற்றும் துல்லியம் மற்றும் நடைமுறை வழிமுறைகளின் தரம் ஆகியவற்றைப் பொறுத்தது. உலகின் அனைத்து வளர்ந்த நாடுகளிலும் (ரஷ்யா, அமெரிக்கா, இங்கிலாந்து, பிரான்ஸ், ஜெர்மனி, ஜப்பான், முதலியன) கணக்கீட்டு மொழியியல் துறையில் பணிகள் மேற்கொள்ளப்பட்டாலும், இன்றுவரை, இந்த சிக்கல்களைத் தீர்ப்பதற்கான தேவையான அளவு இன்னும் அடையப்படவில்லை. )

ஆயினும்கூட, கணக்கீட்டு மொழியியல் துறையில் தீவிர அறிவியல் மற்றும் நடைமுறை சாதனைகளைக் குறிப்பிடலாம். இவ்வாறு, பல நாடுகளில் (ரஷ்யா, அமெரிக்கா, ஜப்பான், முதலியன) ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களை இயந்திர மொழிபெயர்ப்பிற்கான சோதனை மற்றும் தொழில்துறை அமைப்புகள் உருவாக்கப்பட்டுள்ளன, இயற்கை மொழியில் கணினிகளுடன் தொடர்புகொள்வதற்கான பல சோதனை அமைப்புகள் கட்டமைக்கப்பட்டுள்ளன. , டெர்மினாலாஜிக்கல் தரவு வங்கிகள், சொற்களஞ்சியம், இருமொழி மற்றும் பன்மொழி இயந்திர அகராதிகளை (ரஷ்யா, அமெரிக்கா, ஜெர்மனி, பிரான்ஸ், முதலியன) உருவாக்கும் பணி நடந்து வருகிறது, தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி பேச்சின் தொகுப்புக்கான அமைப்புகள் கட்டமைக்கப்படுகின்றன (ரஷ்யா, அமெரிக்கா, ஜப்பான் போன்றவை. .), இயற்கை மொழி மாதிரிகளை உருவாக்கும் துறையில் ஆராய்ச்சி நடத்தப்படுகிறது.

பயன்பாட்டு கணக்கீட்டு மொழியியலின் ஒரு முக்கியமான வழிமுறை சிக்கல், தானியங்கி உரை தகவல் செயலாக்க அமைப்புகளின் அறிவிப்பு மற்றும் செயல்முறை கூறுகளுக்கு இடையே தேவையான உறவின் சரியான மதிப்பீடாகும். எது விரும்பப்பட வேண்டும்: வளமான இலக்கண மற்றும் சொற்பொருள் தகவல்களுடன் ஒப்பீட்டளவில் சிறிய சொற்களஞ்சிய அமைப்புகளை அடிப்படையாகக் கொண்ட சக்திவாய்ந்த கணக்கீட்டு நடைமுறைகள் அல்லது ஒப்பீட்டளவில் எளிமையான கணினி இடைமுகங்களைக் கொண்ட சக்திவாய்ந்த அறிவிப்பு கூறு? பெரும்பாலான விஞ்ஞானிகள் இரண்டாவது வழி விரும்பத்தக்கது என்று நம்புகிறார்கள். இது நடைமுறை இலக்குகளை விரைவாக அடைய வழிவகுக்கும், ஏனெனில் குறைவான முட்டுக்கட்டைகள் மற்றும் கடக்க கடினமான தடைகள் இருக்கும், மேலும் இங்கு ஆராய்ச்சி மற்றும் மேம்பாட்டை தானியக்கமாக்குவதற்கு கணினிகளை பெரிய அளவில் பயன்படுத்த முடியும்.

தானியங்கி உரை தகவல் செயலாக்க அமைப்புகளின் அறிவிப்பு கூறுகளை உருவாக்குவதற்கான முயற்சிகளை அணிதிரட்ட வேண்டிய அவசியம், கணினி மொழியியல் வளர்ச்சியில் அரை நூற்றாண்டு அனுபவத்தால் உறுதிப்படுத்தப்பட்டுள்ளது. எல்லாவற்றிற்கும் மேலாக, இங்கே, இந்த அறிவியலின் மறுக்க முடியாத வெற்றிகள் இருந்தபோதிலும், அல்காரிதம் நடைமுறைகளுக்கான ஆர்வம் எதிர்பார்த்த வெற்றியைக் கொண்டுவரவில்லை. நடைமுறை வழிமுறைகளின் திறன்களில் சில ஏமாற்றம் கூட இருந்தது.

மேற்கூறியவற்றின் வெளிச்சத்தில், கணினி மொழியியலின் வளர்ச்சியின் அத்தகைய பாதையை உருவாக்குவது உறுதியளிக்கிறது, முக்கிய முயற்சிகள் மொழி மற்றும் பேச்சு அலகுகளின் சக்திவாய்ந்த அகராதிகளை உருவாக்குதல், அவற்றின் சொற்பொருள்-தொடரியல் கட்டமைப்பை ஆய்வு செய்தல் மற்றும் உருவவியல் அடிப்படை நடைமுறைகளை உருவாக்குதல், சொற்பொருள்-தொடக்கவியல் மற்றும் கருத்தியல் பகுப்பாய்வு மற்றும் உரைகளின் தொகுப்பு. இது எதிர்காலத்தில் பரவலான பயன்பாட்டு சிக்கல்களைத் தீர்க்க அனுமதிக்கும்.

கணினி மொழியியல், முதலில், தகவல்களைச் சேகரித்தல், குவித்தல், செயலாக்குதல் மற்றும் மீட்டெடுப்பதற்கான செயல்முறைகளுக்கான மொழியியல் ஆதரவின் பணிகளை எதிர்கொள்கிறது. அவற்றில் மிக முக்கியமானவை:

1. இயந்திர அகராதிகளின் தொகுத்தல் மற்றும் மொழியியல் செயலாக்கத்தின் ஆட்டோமேஷன்;

2. கணினியில் உரைகளை உள்ளிடும்போது பிழைகளைக் கண்டறிந்து திருத்தும் செயல்முறைகளின் ஆட்டோமேஷன்;

3. ஆவணங்கள் மற்றும் தகவல் கோரிக்கைகளின் தானியங்கி அட்டவணைப்படுத்தல்;

4. ஆவணங்களின் தானியங்கு வகைப்பாடு மற்றும் சுருக்கம்;

5. ஒருமொழி மற்றும் பன்மொழி தரவுத்தளங்களில் தகவல் மீட்டெடுப்பு செயல்முறைகளுக்கான மொழியியல் ஆதரவு;

6. ஒரு இயற்கை மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் இயந்திர மொழிபெயர்ப்பு;

7. தானியங்கி அறிவார்ந்த தகவல் அமைப்புகளுடன் (குறிப்பாக, நிபுணர் அமைப்புகள்) இயற்கையான மொழியில் அல்லது இயற்கைக்கு நெருக்கமான மொழியில் பயனர் தொடர்புகளை உறுதி செய்யும் மொழியியல் செயலிகளின் கட்டுமானம்;

8. முறைசாரா நூல்களிலிருந்து உண்மைத் தகவல்களைப் பிரித்தெடுத்தல்.

ஆராய்ச்சியின் தலைப்புக்கு மிகவும் பொருத்தமான சிக்கல்களில் விரிவாக வாழ்வோம்.

தகவல் மையங்களின் நடைமுறை நடவடிக்கைகளில், தானாக கண்டறிதல் மற்றும் உரைகளில் உள்ள பிழைகளை கணினியில் உள்ளிடும்போது அவற்றை சரிசெய்தல் ஆகியவற்றின் சிக்கலை தீர்க்க வேண்டிய அவசியம் உள்ளது. இந்த சிக்கலான பணியை நிபந்தனையுடன் மூன்று பணிகளாகப் பிரிக்கலாம் - ஆர்த்தோகிராஃபிக், தொடரியல் மற்றும் சொற்பொருள் கட்டுப்பாட்டின் பணிகள். அவற்றில் முதன்மையானது, சொல் தண்டுகளின் மிகவும் சக்திவாய்ந்த குறிப்பு இயந்திர அகராதியைப் பயன்படுத்தும் உருவவியல் பகுப்பாய்வு செயல்முறையைப் பயன்படுத்தி தீர்க்கப்படலாம். எழுத்துப்பிழைக் கட்டுப்பாட்டின் செயல்பாட்டில், உரையின் சொற்கள் உருவவியல் பகுப்பாய்விற்கு உட்பட்டவை, மேலும் அவற்றின் அடிப்படைகள் குறிப்பு அகராதியின் அடிப்படைகளுடன் அடையாளம் காணப்பட்டால், அவை சரியானதாகக் கருதப்படுகின்றன; அவை அடையாளம் காணப்படவில்லை என்றால், அவை, ஒரு நுண்ணிய சூழலுடன் சேர்ந்து, ஒரு நபருக்கு பார்வைக்கு வழங்கப்படுகின்றன. ஒரு நபர் சிதைந்த சொற்களைக் கண்டறிந்து திருத்துகிறார், மேலும் தொடர்புடைய மென்பொருள் அமைப்பு இந்த திருத்தங்களை திருத்தப்பட்ட உரையாக மாற்றுகிறது.

எழுத்துப்பிழைகளைக் கண்டறிவதற்காக உரைகளின் தொடரியல் கட்டுப்பாட்டின் பணி எழுத்துக் கட்டுப்பாட்டின் பணியை விட மிகவும் கடினம். முதலாவதாக, அதன் கலவையில் எழுத்துப்பிழைக் கட்டுப்பாட்டை அதன் கட்டாய அங்கமாக உள்ளடக்கியிருப்பதால், இரண்டாவதாக, முறைசாரா நூல்களின் தொடரியல் பகுப்பாய்வின் சிக்கல் இன்னும் முழுமையாக தீர்க்கப்படவில்லை. இருப்பினும், உரைகளின் பகுதி தொடரியல் கட்டுப்பாடு மிகவும் சாத்தியம். இங்கே நீங்கள் இரண்டு வழிகளில் செல்லலாம்: குறிப்பு தொடரியல் கட்டமைப்புகளின் மிகவும் பிரதிநிதித்துவ இயந்திர அகராதிகளைத் தொகுக்கவும் மற்றும் பகுப்பாய்வு செய்யப்பட்ட உரையின் தொடரியல் கட்டமைப்புகளை அவற்றுடன் ஒப்பிடவும்; அல்லது உரை கூறுகளின் இலக்கண நிலைத்தன்மையை சரிபார்க்க சிக்கலான விதிகளை உருவாக்கவும். முதல் பாதை எங்களுக்கு மிகவும் நம்பிக்கைக்குரியதாகத் தோன்றுகிறது, இருப்பினும் இது இரண்டாவது பாதையின் கூறுகளைப் பயன்படுத்துவதற்கான வாய்ப்பை விலக்கவில்லை. உரைகளின் தொடரியல் அமைப்பு வார்த்தைகளின் இலக்கண வகுப்புகளின் அடிப்படையில் விவரிக்கப்பட வேண்டும் (இன்னும் துல்லியமாக, சொற்களுக்கான இலக்கண தகவல்களின் தொகுப்புகளின் வரிசைகளின் வடிவத்தில்).

சொற்பொருள் பிழைகளைக் கண்டறிவதற்காக நூல்களின் சொற்பொருள் கட்டுப்பாட்டின் பணி செயற்கை நுண்ணறிவு பணிகளின் வகுப்பாக வகைப்படுத்தப்பட வேண்டும். மனித சிந்தனையின் செயல்முறைகளை மாதிரியாக்குவதன் அடிப்படையில் மட்டுமே இது முழுமையாக தீர்க்கப்பட முடியும். இந்த வழக்கில், அறிவு கையாளுதலுக்கான சக்திவாய்ந்த கலைக்களஞ்சிய அறிவுத் தளங்கள் மற்றும் மென்பொருள் கருவிகளை உருவாக்குவது அவசியமாக இருக்கும். இருப்பினும், வரையறுக்கப்பட்ட பாடப் பகுதிகள் மற்றும் முறைப்படுத்தப்பட்ட தகவல்களுக்கு, இந்த பணி முற்றிலும் தீர்க்கக்கூடியது. இது உரைகளின் சொற்பொருள்-தொடக்கக் கட்டுப்பாட்டின் சிக்கலாக முன்வைக்கப்பட்டு தீர்க்கப்பட வேண்டும்.