HSE இல் கணக்கீட்டு மொழியியல்: புதிய முதுகலை திட்டத்தைப் பற்றி அனஸ்டாசியா போன்ச்-ஓஸ்மோலோவ்ஸ்கயா. ஒரு அறிவியல் திசையாக கணக்கீட்டு மொழியியலின் வரலாறு, வளர்ச்சி மற்றும் நிறுவுதல்

பாடப் பணி

"தகவல்" துறையில்

தலைப்பில்: "கணக்கீட்டு மொழியியல்"


அறிமுகம்

2. கணக்கீட்டு மொழியியலுக்கான நவீன இடைமுகங்கள்

முடிவுரை

இலக்கியம்


அறிமுகம்

வாழ்க்கையில் நவீன சமுதாயம்தானியங்கி தகவல் தொழில்நுட்பங்கள் முக்கிய பங்கு வகிக்கின்றன. காலப்போக்கில், அவற்றின் முக்கியத்துவம் தொடர்ந்து அதிகரிக்கிறது. ஆனால் தகவல் தொழில்நுட்பத்தின் வளர்ச்சி மிகவும் சீரற்றது: தற்போதைய நிலை என்றால் கணினி தொழில்நுட்பம்தகவல்தொடர்பு வழிமுறைகள் ஆச்சரியமானவை, ஆனால் தகவல்களின் சொற்பொருள் செயலாக்கத் துறையில், வெற்றிகள் மிகவும் எளிமையானவை. இந்த வெற்றிகள் முதலில், மனித சிந்தனையின் செயல்முறைகள், மக்களிடையே வாய்மொழி தகவல்தொடர்பு செயல்முறைகள் மற்றும் கணினியில் இந்த செயல்முறைகளை உருவகப்படுத்தும் திறன் ஆகியவற்றின் ஆய்வில் சாதனைகள் சார்ந்தது.

நம்பிக்கைக்குரிய தகவல் தொழில்நுட்பங்களை உருவாக்கும் போது, ​​​​இயற்கை மொழிகளில் வழங்கப்படும் உரை தகவல்களின் தானியங்கி செயலாக்கத்தின் சிக்கல்கள் முன்னுக்கு வருகின்றன. ஒரு நபரின் சிந்தனை அவரது மொழியுடன் நெருக்கமாக இணைக்கப்பட்டுள்ளது என்பதன் மூலம் இது தீர்மானிக்கப்படுகிறது. மேலும், இயற்கை மொழி சிந்தனைக்கான ஒரு கருவியாகும். இது மக்களிடையே தகவல்தொடர்புக்கான உலகளாவிய வழிமுறையாகும் - கருத்து, குவிப்பு, சேமிப்பு, செயலாக்கம் மற்றும் தகவல் பரிமாற்றத்திற்கான ஒரு வழிமுறையாகும். தானியங்கி தகவல் செயலாக்க அமைப்புகளில் இயற்கை மொழியைப் பயன்படுத்துவதில் உள்ள சிக்கல்களை அறிவியல் கையாள்கிறது கணக்கீட்டு மொழியியல். இந்த விஞ்ஞானம் ஒப்பீட்டளவில் சமீபத்தில் எழுந்தது - கடந்த நூற்றாண்டின் ஐம்பதுகள் மற்றும் அறுபதுகளின் தொடக்கத்தில். கடந்த அரை நூற்றாண்டில், கணினி மொழியியல் துறையில் குறிப்பிடத்தக்க அறிவியல் மற்றும் நடைமுறை முடிவுகள் பெறப்பட்டுள்ளன: ஒரு இயற்கை மொழியிலிருந்து மற்றொன்றுக்கு நூல்களை இயந்திர மொழிபெயர்ப்பதற்கான அமைப்புகள், உரைகளில் உள்ள தகவல்களை தானியங்கு முறையில் மீட்டெடுப்பதற்கான அமைப்புகள், தானியங்கி பகுப்பாய்வு மற்றும் தொகுப்புக்கான அமைப்புகள் உருவாக்கப்பட்டது வாய்வழி பேச்சுமற்றும் பலர். மொழியியல் ஆராய்ச்சியின் போது கணினி மொழியியலைப் பயன்படுத்தி உகந்த கணினி இடைமுகத்தை உருவாக்குவதற்கு இந்த வேலை அர்ப்பணிக்கப்பட்டுள்ளது.


1. மொழியியல் ஆராய்ச்சியில் கணக்கீட்டு மொழியியலின் இடம் மற்றும் பங்கு

நவீன உலகில், பல்வேறு மொழியியல் ஆய்வுகளை நடத்துவதற்கு கணக்கீட்டு மொழியியல் அதிகளவில் பயன்படுத்தப்படுகிறது.

கணக்கீட்டு மொழியியல் என்பது இயற்கையான மொழியில் வழங்கப்பட்ட தகவல்களை தானியங்கு செயலாக்கத்தின் சிக்கல்களைத் தீர்ப்பதோடு தொடர்புடைய அறிவுத் துறையாகும். கணினி மொழியியலின் மைய அறிவியல் சிக்கல்கள், உரைகளின் பொருளைப் புரிந்துகொள்ளும் செயல்முறையை மாதிரியாக்குவது (உரையிலிருந்து அதன் அர்த்தத்தின் முறைப்படுத்தப்பட்ட பிரதிநிதித்துவத்திற்கு மாறுதல்) மற்றும் பேச்சுத் தொகுப்பின் சிக்கல் (இயற்கையில் உள்ள உரைகளுக்கு முறைப்படுத்தப்பட்ட அர்த்தத்திலிருந்து மாறுதல் மொழி). பல பயன்பாட்டு சிக்கல்களைத் தீர்க்கும்போது இந்த சிக்கல்கள் எழுகின்றன, குறிப்பாக, கணினியில் உரைகளை உள்ளிடும்போது பிழைகளைத் தானாகக் கண்டறிதல் மற்றும் சரிசெய்தல், தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி பேச்சின் தொகுப்பு, ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் தானியங்கி மொழிபெயர்ப்பு, தொடர்பு இயற்கை மொழியில் உள்ள கணினி, உரை ஆவணங்களின் தானியங்கு வகைப்பாடு மற்றும் அட்டவணைப்படுத்தல், அவற்றின் தானியங்கி சுருக்கம், முழு உரை தரவுத்தளங்களில் ஆவணங்களைத் தேடுதல்.

கணக்கீட்டு மொழியியலில் உருவாக்கப்பட்ட மற்றும் பயன்படுத்தப்படும் மொழியியல் கருவிகளை இரண்டு பகுதிகளாகப் பிரிக்கலாம்: அறிவிப்பு மற்றும் நடைமுறை. அறிவிப்புப் பகுதியில் மொழி மற்றும் பேச்சு அலகுகளின் அகராதிகள், உரைகள் மற்றும் பல்வேறு வகையான இலக்கண அட்டவணைகள் உள்ளன, நடைமுறைப் பகுதியில் மொழி மற்றும் பேச்சு அலகுகள், உரைகள் மற்றும் இலக்கண அட்டவணைகள் ஆகியவற்றைக் கையாளும் வழிமுறைகள் அடங்கும். கணினி இடைமுகம் என்பது கணக்கீட்டு மொழியியலின் செயல்முறைப் பகுதியைக் குறிக்கிறது.

கணினி மொழியியலின் பயன்பாட்டு சிக்கல்களைத் தீர்ப்பதில் வெற்றி, முதலில், கணினி நினைவகத்தில் அறிவிப்பு வழிமுறைகளின் பிரதிநிதித்துவத்தின் முழுமை மற்றும் துல்லியம் மற்றும் நடைமுறை வழிமுறைகளின் தரம் ஆகியவற்றைப் பொறுத்தது. உலகின் அனைத்து வளர்ந்த நாடுகளிலும் (ரஷ்யா, அமெரிக்கா, இங்கிலாந்து, பிரான்ஸ், ஜெர்மனி, ஜப்பான், முதலியன) கணக்கீட்டு மொழியியல் துறையில் பணிகள் மேற்கொள்ளப்பட்டாலும், இன்றுவரை, இந்த சிக்கல்களைத் தீர்ப்பதற்கான தேவையான அளவு இன்னும் அடையப்படவில்லை. )

ஆயினும்கூட, கணக்கீட்டு மொழியியல் துறையில் தீவிர அறிவியல் மற்றும் நடைமுறை சாதனைகளைக் குறிப்பிடலாம். இவ்வாறு, பல நாடுகளில் (ரஷ்யா, அமெரிக்கா, ஜப்பான், முதலியன) சோதனை மற்றும் தொழில்துறை அமைப்புகள்ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் இயந்திர மொழிபெயர்ப்பு, இயற்கையான மொழியில் கணினிகளுடன் தொடர்புகொள்வதற்கான பல சோதனை அமைப்புகள் கட்டப்பட்டுள்ளன, டெர்மினாலாஜிக்கல் தரவு வங்கிகள், சொற்களஞ்சியம், இருமொழி மற்றும் பன்மொழி இயந்திர அகராதிகளை (ரஷ்யா, அமெரிக்கா, ஜெர்மனி, பிரான்ஸ்) உருவாக்கும் பணி நடந்து வருகிறது. , முதலியன), அமைப்புகள் தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி பேச்சின் தொகுப்பு (ரஷ்யா, அமெரிக்கா, ஜப்பான் போன்றவை) உருவாக்கப்படுகின்றன, இயற்கை மொழி மாதிரிகளை உருவாக்கும் துறையில் ஆராய்ச்சி நடந்து வருகிறது.

பயன்பாட்டு கணக்கீட்டு மொழியியலின் ஒரு முக்கியமான வழிமுறை சிக்கல், தானியங்கி உரை தகவல் செயலாக்க அமைப்புகளின் அறிவிப்பு மற்றும் செயல்முறை கூறுகளுக்கு இடையே தேவையான உறவின் சரியான மதிப்பீடு ஆகும். எது விரும்பப்பட வேண்டும்: வளமான இலக்கண மற்றும் சொற்பொருள் தகவல்களுடன் ஒப்பீட்டளவில் சிறிய சொற்களஞ்சிய அமைப்புகளை அடிப்படையாகக் கொண்ட சக்திவாய்ந்த கணக்கீட்டு நடைமுறைகள் அல்லது ஒப்பீட்டளவில் எளிமையான கணினி இடைமுகங்களைக் கொண்ட சக்திவாய்ந்த அறிவிப்பு கூறு? பெரும்பாலான விஞ்ஞானிகள் இரண்டாவது வழி விரும்பத்தக்கது என்று நம்புகிறார்கள். இது நடைமுறை இலக்குகளை விரைவாக அடைய வழிவகுக்கும், ஏனெனில் குறைவான முட்டுக்கட்டைகள் மற்றும் கடக்க கடினமான தடைகள் இருக்கும், மேலும் இங்கு ஆராய்ச்சி மற்றும் மேம்பாட்டை தானியக்கமாக்குவதற்கு கணினிகளை பெரிய அளவில் பயன்படுத்த முடியும்.

தானியங்கி உரை தகவல் செயலாக்க அமைப்புகளின் அறிவிப்பு கூறுகளை உருவாக்குவதற்கான முயற்சிகளை அணிதிரட்ட வேண்டிய அவசியம், கணினி மொழியியல் வளர்ச்சியில் அரை நூற்றாண்டு அனுபவத்தால் உறுதிப்படுத்தப்பட்டுள்ளது. எல்லாவற்றிற்கும் மேலாக, இங்கே, இந்த அறிவியலின் மறுக்க முடியாத வெற்றிகள் இருந்தபோதிலும், அல்காரிதம் நடைமுறைகளுக்கான ஆர்வம் எதிர்பார்த்த வெற்றியைக் கொண்டுவரவில்லை. நடைமுறை வழிமுறைகளின் திறன்களில் சில ஏமாற்றம் கூட இருந்தது.

மேற்கூறியவற்றின் வெளிச்சத்தில், கணினி மொழியியலின் வளர்ச்சிக்கான அத்தகைய பாதையை உருவாக்குவது உறுதியளிக்கிறது, முக்கிய முயற்சிகள் மொழி மற்றும் பேச்சு அலகுகளின் சக்திவாய்ந்த அகராதிகளை உருவாக்குதல், அவற்றின் சொற்பொருள்-தொடரியல் கட்டமைப்பை ஆய்வு செய்தல் மற்றும் உருவவியல் அடிப்படை நடைமுறைகளை உருவாக்குதல், சொற்பொருள்-தொடக்கவியல் மற்றும் கருத்தியல் பகுப்பாய்வு மற்றும் உரைகளின் தொகுப்பு. இது எதிர்காலத்தில் பரவலான பயன்பாட்டு சிக்கல்களைத் தீர்க்க அனுமதிக்கும்.

கணினி மொழியியல், முதலில், தகவல்களைச் சேகரித்தல், குவித்தல், செயலாக்குதல் மற்றும் மீட்டெடுப்பதற்கான செயல்முறைகளுக்கான மொழியியல் ஆதரவின் பணிகளை எதிர்கொள்கிறது. அவற்றில் மிக முக்கியமானவை:

1. இயந்திர அகராதிகளின் தொகுத்தல் மற்றும் மொழியியல் செயலாக்கத்தின் ஆட்டோமேஷன்;

2. கணினியில் உரைகளை உள்ளிடும்போது பிழைகளைக் கண்டறிந்து திருத்தும் செயல்முறைகளின் ஆட்டோமேஷன்;

3. ஆவணங்கள் மற்றும் தகவல் கோரிக்கைகளின் தானியங்கி அட்டவணைப்படுத்தல்;

4. ஆவணங்களின் தானியங்கு வகைப்பாடு மற்றும் சுருக்கம்;

5. ஒருமொழி மற்றும் பன்மொழி தரவுத்தளங்களில் தகவல் மீட்டெடுப்பு செயல்முறைகளுக்கான மொழியியல் ஆதரவு;

6. ஒரு இயற்கை மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் இயந்திர மொழிபெயர்ப்பு;

7. தானியங்கி அறிவார்ந்த தகவல் அமைப்புகளுடன் (குறிப்பாக, நிபுணர் அமைப்புகள்) இயற்கையான மொழியில் அல்லது இயற்கைக்கு நெருக்கமான மொழியில் பயனர் தொடர்புகளை உறுதி செய்யும் மொழியியல் செயலிகளின் கட்டுமானம்;

8. முறைசாரா நூல்களிலிருந்து உண்மைத் தகவல்களைப் பிரித்தெடுத்தல்.

ஆராய்ச்சியின் தலைப்புக்கு மிகவும் பொருத்தமான சிக்கல்களில் விரிவாக வாழ்வோம்.

தகவல் மையங்களின் நடைமுறை நடவடிக்கைகளில், தானாக கண்டறிதல் மற்றும் உரைகளில் உள்ள பிழைகளை கணினியில் உள்ளிடும்போது அவற்றை சரிசெய்தல் ஆகியவற்றின் சிக்கலை தீர்க்க வேண்டிய அவசியம் உள்ளது. இந்த சிக்கலான பணியை நிபந்தனையுடன் மூன்று பணிகளாகப் பிரிக்கலாம் - ஆர்த்தோகிராஃபிக், தொடரியல் மற்றும் சொற்பொருள் கட்டுப்பாட்டின் பணிகள். அவற்றில் முதன்மையானது, சொல் தண்டுகளின் மிகவும் சக்திவாய்ந்த குறிப்பு இயந்திர அகராதியைப் பயன்படுத்தும் உருவவியல் பகுப்பாய்வு செயல்முறையைப் பயன்படுத்தி தீர்க்கப்படலாம். எழுத்துப்பிழைக் கட்டுப்பாட்டின் செயல்பாட்டில், உரையின் சொற்கள் உருவவியல் பகுப்பாய்விற்கு உட்பட்டவை, மேலும் அவற்றின் அடிப்படைகள் குறிப்பு அகராதியின் அடிப்படைகளுடன் அடையாளம் காணப்பட்டால், அவை சரியானதாகக் கருதப்படுகின்றன; அவை அடையாளம் காணப்படவில்லை என்றால், அவை, ஒரு நுண்ணிய சூழலுடன் சேர்ந்து, ஒரு நபருக்கு பார்வைக்கு வழங்கப்படுகின்றன. ஒரு நபர் சிதைந்த சொற்களைக் கண்டறிந்து திருத்துகிறார், மேலும் தொடர்புடைய மென்பொருள் அமைப்பு இந்த திருத்தங்களை திருத்தப்பட்ட உரையாக மாற்றுகிறது.

எழுத்துப்பிழைகளைக் கண்டறிவதற்காக உரைகளின் தொடரியல் கட்டுப்பாட்டின் பணி எழுத்துக் கட்டுப்பாட்டின் பணியை விட மிகவும் கடினம். முதலாவதாக, அதன் கலவையில் எழுத்துப்பிழைக் கட்டுப்பாட்டை அதன் கட்டாய அங்கமாக உள்ளடக்கியிருப்பதால், இரண்டாவதாக, முறைசாரா நூல்களின் தொடரியல் பகுப்பாய்வின் சிக்கல் இன்னும் முழுமையாக தீர்க்கப்படவில்லை. இருப்பினும், உரைகளின் பகுதி தொடரியல் கட்டுப்பாடு மிகவும் சாத்தியம். இங்கே நீங்கள் இரண்டு வழிகளில் செல்லலாம்: குறிப்பு தொடரியல் கட்டமைப்புகளின் மிகவும் பிரதிநிதித்துவ இயந்திர அகராதிகளைத் தொகுக்கவும் மற்றும் பகுப்பாய்வு செய்யப்பட்ட உரையின் தொடரியல் கட்டமைப்புகளை அவற்றுடன் ஒப்பிடவும்; அல்லது உரை கூறுகளின் இலக்கண நிலைத்தன்மையை சரிபார்க்க சிக்கலான விதிகளை உருவாக்கவும். முதல் பாதை எங்களுக்கு மிகவும் நம்பிக்கைக்குரியதாகத் தோன்றுகிறது, இருப்பினும் இது இரண்டாவது பாதையின் கூறுகளைப் பயன்படுத்துவதற்கான வாய்ப்பை விலக்கவில்லை. உரைகளின் தொடரியல் அமைப்பு வார்த்தைகளின் இலக்கண வகுப்புகளின் அடிப்படையில் விவரிக்கப்பட வேண்டும் (இன்னும் துல்லியமாக, சொற்களுக்கான இலக்கண தகவல்களின் தொகுப்புகளின் வரிசைகளின் வடிவத்தில்).

சொற்பொருள் பிழைகளைக் கண்டறிவதற்காக நூல்களின் சொற்பொருள் கட்டுப்பாட்டின் பணி செயற்கை நுண்ணறிவு பணிகளின் வகுப்பாக வகைப்படுத்தப்பட வேண்டும். மனித சிந்தனையின் செயல்முறைகளை மாதிரியாக்குவதன் அடிப்படையில் மட்டுமே இது முழுமையாக தீர்க்கப்பட முடியும். இந்த வழக்கில், அறிவு கையாளுதலுக்கான சக்திவாய்ந்த கலைக்களஞ்சிய அறிவுத் தளங்கள் மற்றும் மென்பொருள் கருவிகளை உருவாக்குவது அவசியமாக இருக்கும். இருப்பினும், வரையறுக்கப்பட்ட பாடப் பகுதிகள் மற்றும் முறைப்படுத்தப்பட்ட தகவல்களுக்கு, இந்த பணி முற்றிலும் தீர்க்கக்கூடியது. இது உரைகளின் சொற்பொருள்-தொடக்கக் கட்டுப்பாட்டின் சிக்கலாக முன்வைக்கப்பட்டு தீர்க்கப்பட வேண்டும்.

ஆவணங்கள் மற்றும் வினவல்களின் அட்டவணைப்படுத்தலை தானியங்குபடுத்துவதில் உள்ள சிக்கல் தானியங்கு உரை தகவல் மீட்டெடுப்பு அமைப்புகளுக்கு பாரம்பரியமானது. முதலில், அட்டவணைப்படுத்தல் என்பது அவற்றின் கருப்பொருள் உள்ளடக்கத்தை பிரதிபலிக்கும் ஆவணங்கள் மற்றும் வினவல்களுக்கு வகைப்படுத்தல் குறியீடுகளை ஒதுக்கும் செயல்முறையாக புரிந்து கொள்ளப்பட்டது. பின்னர், இந்த கருத்து மாற்றப்பட்டது மற்றும் "அட்டவணை" என்ற சொல் ஆவணங்கள் மற்றும் வினவல்களின் விளக்கங்களை இயற்கை மொழியிலிருந்து முறைப்படுத்தப்பட்ட மொழியில், குறிப்பாக, "தேடல் படங்கள்" மொழியில் மொழிபெயர்க்கும் செயல்முறையைக் குறிக்கத் தொடங்கியது. ஆவணங்களின் தேடல் படங்கள், ஒரு விதியாக, அவற்றின் கருப்பொருள் உள்ளடக்கத்தை பிரதிபலிக்கும் முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்களின் பட்டியல்களின் வடிவத்தில் வரையப்படத் தொடங்கின, மேலும் வினவல்களின் படங்களைத் தேடுங்கள் - முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்கள் ஒன்றோடொன்று இணைக்கப்பட்ட தருக்க கட்டமைப்புகளின் வடிவத்தில். தருக்க மற்றும் தொடரியல் ஆபரேட்டர்கள் மூலம்.

ஆவணங்களை அவற்றின் சுருக்கங்களின் (ஏதேனும் இருந்தால்) அடிப்படையில் தானாக அட்டவணைப்படுத்துவது வசதியானது, ஏனெனில் சுருக்கங்கள் ஆவணங்களின் முக்கிய உள்ளடக்கத்தை செறிவூட்டப்பட்ட வடிவத்தில் பிரதிபலிக்கின்றன. அட்டவணைப்படுத்தல் சொற்களஞ்சியம் கட்டுப்பாட்டுடன் அல்லது இல்லாமல் மேற்கொள்ளப்படலாம். முதல் வழக்கில், ஆவணத்தின் தலைப்பின் உரை மற்றும் அதன் சுருக்கம், குறிப்பு இயந்திர அகராதியின் முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்கள் தேடப்பட்டு, அகராதியில் உள்ளவை மட்டுமே AML இல் சேர்க்கப்பட்டுள்ளன. இரண்டாவது வழக்கில், முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்கள் உரையிலிருந்து தனிமைப்படுத்தப்பட்டு POD இல் சேர்க்கப்படும், அவை எந்த குறிப்பு அகராதியிலும் இல்லை. மூன்றாவது விருப்பமும் செயல்படுத்தப்பட்டது, அங்கு, இயந்திர சொற்களஞ்சியத்தின் விதிமுறைகளுடன், AML ஆவணத்தின் தலைப்பு மற்றும் முதல் வாக்கியத்திலிருந்து பிரித்தெடுக்கப்பட்ட சொற்களையும் உள்ளடக்கியது. தலைப்புகள் மற்றும் ஆவணங்களின் சுருக்கங்களைப் பயன்படுத்தி தானாக தொகுக்கப்பட்ட PODகள் கைமுறையாக தொகுக்கப்பட்ட PODகளை விட அதிக தேடல் முழுமையை வழங்குவதாக சோதனைகள் காட்டுகின்றன. கையேடு குறியீட்டு முறையை விட தானியங்கி அட்டவணைப்படுத்தல் அமைப்பு ஆவணங்களின் உள்ளடக்கத்தின் பல்வேறு அம்சங்களை முழுமையாக பிரதிபலிக்கிறது என்பதன் மூலம் இது விளக்கப்படுகிறது.

வினவல்களின் தானியங்கி அட்டவணைப்படுத்தல் ஆவணங்களின் தானியங்கி அட்டவணைப்படுத்தல் போன்ற சிக்கல்களை ஏற்படுத்துகிறது. இங்கே நீங்கள் உரையிலிருந்து முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்களைப் பிரித்தெடுக்க வேண்டும் மற்றும் வினவல் உரையில் சேர்க்கப்பட்டுள்ள சொற்களை இயல்பாக்க வேண்டும். முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்கள் மற்றும் சூழ்நிலை ஆபரேட்டர்களுக்கு இடையே உள்ள தர்க்கரீதியான இணைப்புகளை கைமுறையாக அல்லது தானியங்கு செயல்முறையைப் பயன்படுத்தி உள்ளிடலாம். வினவலின் தானியங்கி அட்டவணைப்படுத்தல் செயல்முறையின் ஒரு முக்கிய அங்கம், அதன் முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்களை அவற்றின் ஒத்த சொற்கள் மற்றும் ஹைப்போனிம்களுடன் சேர்ப்பது ஆகும் (சில நேரங்களில் ஹைபரோனிம்கள் மற்றும் அசல் வினவல் சொற்களுடன் தொடர்புடைய பிற சொற்களும்). இது ஒரு இயந்திர சொற்களஞ்சியத்தைப் பயன்படுத்தி தானாகவே அல்லது ஊடாடும் வகையில் செய்யப்படலாம்.

தானியங்கி அட்டவணையிடல் பணி தொடர்பாக ஆவணத் தகவலுக்கான தேடலை தானியங்குபடுத்துவதில் உள்ள சிக்கலை நாங்கள் ஏற்கனவே ஓரளவு கருத்தில் கொண்டுள்ளோம். இந்த நோக்கத்திற்காக அனைத்து வகையான மாற்றீடுகளின் பயன்பாடு (நூல் விளக்கங்கள், ஆவணங்களின் தேடல் படங்கள் மற்றும் அவற்றின் சுருக்கங்களின் உரைகள்) தேடலின் போது தகவல்களை இழக்க வழிவகுக்கும் என்பதால், அவற்றின் முழு உரைகளையும் பயன்படுத்தி ஆவணங்களைத் தேடுவதே இங்கு மிகவும் நம்பிக்கைக்குரியது. முதன்மை ஆவணங்களுக்கு மாற்றாக நூலியல் விளக்கங்கள் பயன்படுத்தப்படும்போது மிகப்பெரிய இழப்புகள் ஏற்படுகின்றன, மேலும் சுருக்கங்கள் பயன்படுத்தப்படும்போது மிகச்சிறிய இழப்புகள் ஏற்படுகின்றன.

தகவல் மீட்டெடுப்பின் தரத்தின் முக்கிய பண்புகள் அதன் முழுமை மற்றும் துல்லியம் ஆகும். மொழி மற்றும் பேச்சு அலகுகள் (சொற்கள் மற்றும் சொற்றொடர்கள்) மற்றும் துல்லியம் - அவற்றின் தொடரியல் இணைப்புகளை கணக்கில் எடுத்துக்கொள்வதன் மூலம் அதிகபட்ச முன்னுதாரண இணைப்புகளை எடுத்துக்கொள்வதன் மூலம் தேடலின் முழுமையை உறுதிப்படுத்த முடியும். தேடலின் முழுமையும் துல்லியமும் நேர்மாறாக தொடர்புடையவை என்று ஒரு கருத்து உள்ளது: இந்த குணாதிசயங்களில் ஒன்றை மேம்படுத்துவதற்கான நடவடிக்கைகள் மற்றொன்றில் மோசமடைய வழிவகுக்கும். ஆனால் இது நிலையான தேடல் தர்க்கத்திற்கு மட்டுமே பொருந்தும். இந்த தர்க்கம் மேம்படுத்தப்பட்டால், இரண்டு பண்புகளையும் ஒரே நேரத்தில் மேம்படுத்தலாம்.

பயனர் மற்றும் தகவல் மீட்டெடுப்பு அமைப்பு (IRS) ஆகியவற்றுக்கு இடையேயான ஊடாடும் தகவல்தொடர்பு செயல்முறையாக முழு-உரை தரவுத்தளங்களில் தகவலைத் தேடும் செயல்முறையை உருவாக்குவது நல்லது. கோரிக்கை, மற்றும் அவருக்கு பொருத்தமானவற்றைத் தேர்ந்தெடுக்கிறது. இறுதி தேடல் முடிவுகள் இவ்வாறு தோன்றலாம் முழு நூல்கள்ஆவணங்கள் மற்றும் அதன் துண்டுகள்.

முந்தைய விவாதங்களிலிருந்து காணக்கூடியது போல, தானாகவே தகவல்களைத் தேடும் போது, ​​உரைகளில் நிகழும் அதே அர்த்தத்தின் பல்வேறு வடிவங்களின் பிரதிநிதித்துவத்தின் காரணமாக பயனருக்கும் தகவல் அமைப்புக்கும் இடையே எழும் மொழித் தடையை கடக்க வேண்டியது அவசியம். பன்மொழி தரவுத்தளங்களில் தேடுதல் மேற்கொள்ளப்பட வேண்டும் என்றால் இந்த தடை இன்னும் குறிப்பிடத்தக்கதாகிறது. ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு ஆவண நூல்களை இயந்திர மொழிபெயர்ப்பதே இங்குள்ள சிக்கலுக்கு ஒரு தீவிரமான தீர்வு. இது முன்கூட்டியே, தேடுபொறியில் ஆவணங்களை ஏற்றுவதற்கு முன் அல்லது தகவலைத் தேடும் போது செய்யப்படலாம். பிந்தைய வழக்கில், பயனரின் கோரிக்கையானது தேடல் நடத்தப்படும் ஆவண வரிசையின் மொழியில் மொழிபெயர்க்கப்பட வேண்டும், மேலும் தேடல் முடிவுகள் கோரிக்கையின் மொழியில் மொழிபெயர்க்கப்பட வேண்டும். இந்த வகையான தேடுபொறிகள் ஏற்கனவே இணையத்தில் இயங்குகின்றன. VINITI RAS ஆனது ஒரு சிரிலிக் உலாவி அமைப்பையும் உருவாக்கியுள்ளது, இது ரஷ்ய மொழி உரைகளில் உள்ள தகவலை ஆங்கிலத்தில் வினவல்களைப் பயன்படுத்தி பயனர் மொழியிலும் தேடல் முடிவுகளுடன் தேட அனுமதிக்கிறது.

கணினி மொழியியலின் முக்கியமான மற்றும் நம்பிக்கைக்குரிய பணியானது, இயற்கையான மொழியில் அல்லது இயற்கைக்கு நெருக்கமான மொழியில் அறிவார்ந்த தானியங்கி தகவல் அமைப்புகளுடன் (குறிப்பாக, நிபுணர் அமைப்புகள்) பயனர் தொடர்புகளை உறுதி செய்யும் மொழியியல் செயலிகளை உருவாக்குவதாகும். நவீன அறிவார்ந்த அமைப்புகளில் தகவல் முறைப்படுத்தப்பட்ட வடிவத்தில் சேமிக்கப்படுவதால், ஒரு நபருக்கும் கணினிக்கும் இடையில் இடைத்தரகர்களாக செயல்படும் மொழியியல் செயலிகள் பின்வரும் முக்கிய பணிகளைத் தீர்க்க வேண்டும்: 1) உள்ளீட்டு தகவல் கோரிக்கைகள் மற்றும் செய்திகளின் உரையிலிருந்து இயற்கையான முறையில் மாற்றும் பணி ஒரு முறைப்படுத்தப்பட்ட மொழியில் அவற்றின் பொருளைக் குறிக்கும் மொழி (ஒரு கணினியில் தகவலை உள்ளிடும்போது); 2) வெளியீட்டுச் செய்திகளின் பொருளின் முறையான பிரதிநிதித்துவத்திலிருந்து இயற்கையான மொழியில் அதன் பிரதிநிதித்துவத்திற்கு (ஒரு நபருக்கு தகவலை வழங்கும்போது) மாற்றும் பணி. முதல் பணியானது உள்ளீட்டு வினவல்கள் மற்றும் செய்திகளின் உருவவியல், தொடரியல் மற்றும் கருத்தியல் பகுப்பாய்வு மூலம் தீர்க்கப்பட வேண்டும், இரண்டாவது - வெளியீட்டு செய்திகளின் கருத்தியல், தொடரியல் மற்றும் உருவவியல் தொகுப்பு மூலம்.

தகவல் கோரிக்கைகள் மற்றும் செய்திகளின் கருத்தியல் பகுப்பாய்வு அவற்றின் கருத்தியல் கட்டமைப்பை (கருத்துகளின் பெயர்களின் எல்லைகள் மற்றும் உரையில் உள்ள கருத்துக்களுக்கு இடையிலான உறவுகள்) அடையாளம் கண்டு, இந்த கட்டமைப்பை முறைப்படுத்தப்பட்ட மொழியில் மொழிபெயர்ப்பதைக் கொண்டுள்ளது. கோரிக்கைகள் மற்றும் செய்திகளின் உருவவியல் மற்றும் தொடரியல் பகுப்பாய்வுக்குப் பிறகு இது மேற்கொள்ளப்படுகிறது. செய்திகளின் கருத்தியல் தொகுப்பு முறைப்படுத்தப்பட்ட மொழியில் அவற்றின் கட்டமைப்பின் கூறுகளின் பிரதிநிதித்துவத்திலிருந்து வாய்மொழி (வாய்மொழி) பிரதிநிதித்துவத்திற்கு மாறுவதைக் கொண்டுள்ளது. இதற்குப் பிறகு, செய்திகளுக்கு தேவையான தொடரியல் மற்றும் உருவ வடிவம் வழங்கப்படுகிறது.

ஒரு இயற்கை மொழியிலிருந்து மற்றொன்றுக்கு நூல்களை இயந்திர மொழிபெயர்ப்பதற்கு, கருத்துகளின் பெயர்களுக்கு இடையில் மொழிபெயர்ப்பு கடிதங்களின் அகராதிகளை வைத்திருப்பது அவசியம். இத்தகைய மொழிபெயர்ப்பு கடிதங்களைப் பற்றிய அறிவு பல தலைமுறை மக்களால் திரட்டப்பட்டது மற்றும் சிறப்பு வெளியீடுகள் - இருமொழி அல்லது பன்மொழி அகராதிகள் வடிவில் தொகுக்கப்பட்டது. சில அறிவு உள்ள நிபுணர்களுக்கு வெளிநாட்டு மொழிகள், இந்த அகராதிகள் நூல்களை மொழிபெயர்ப்பதில் மதிப்புமிக்க உதவிகளாக செயல்பட்டன.

பாரம்பரிய இருமொழி மற்றும் பன்மொழி பொது-நோக்கு அகராதிகளில், மொழிபெயர்ப்புச் சமமானவை முதன்மையாக தனிப்பட்ட சொற்களுக்கும், சொற்றொடர்களுக்கும் - மிகக் குறைவாகவே குறிப்பிடப்படுகின்றன. சொற்றொடருக்கான மொழிபெயர்ப்புச் சமமான குறிப்பானது சிறப்பு சொற்களஞ்சிய அகராதிகளுக்கு மிகவும் பொதுவானதாக இருந்தது. எனவே, பல சொற்களைக் கொண்ட நூல்களின் பகுதிகளை மொழிபெயர்க்கும்போது, ​​மாணவர்கள் பெரும்பாலும் சிரமங்களை எதிர்கொண்டனர்.

"பள்ளி" தலைப்புகளில் பல ஜோடி ஆங்கிலம் மற்றும் ரஷ்ய சொற்றொடர்களுக்கு இடையேயான மொழிபெயர்ப்பு கடிதங்கள் கீழே உள்ளன.

1) வௌவால் இறக்கைகள் கொண்ட எலி போல் தெரிகிறது - வௌவால் இறக்கைகள் கொண்ட எலி போல் தெரிகிறது.

2) குழந்தைகள் கடற்கரையில் மணலில் விளையாட விரும்புகிறார்கள் - குழந்தைகள் கடற்கரையில் மணலில் விளையாட விரும்புகிறார்கள்.

3) ஒரு துளி மழை என் கையில் விழுந்தது - ஒரு துளி மழை என் கையில் விழுந்தது.

4) உலர்ந்த மரம் எளிதில் எரிகிறது - உலர்ந்த மரம் நன்றாக எரிகிறது.

5) அவர் என்னைக் கேட்காதது போல் நடித்தார் - அவர் என்னைக் கேட்காதது போல் நடித்தார்.

இங்கே ஆங்கில சொற்றொடர்கள்மொழியியல் வெளிப்பாடுகள் அல்ல. எவ்வாறாயினும், ரஷ்ய மொழியில் அவற்றின் மொழிபெயர்ப்பு ஒரு எளிய வார்த்தைக்கு வார்த்தை மொழிபெயர்ப்பாக மட்டுமே கருதப்படும், ஏனெனில் அவற்றில் சேர்க்கப்பட்டுள்ள அனைத்து சொற்களும் தெளிவற்றவை. எனவே, கணினி மொழியியல் சாதனைகள் மட்டுமே இங்கு மாணவர்களுக்கு உதவும்.

பாடப் பணி

"தகவல்" துறையில்

தலைப்பில்: "கணக்கீட்டு மொழியியல்"


அறிமுகம்

1. மொழியியல் ஆராய்ச்சியில் கணக்கீட்டு மொழியியலின் இடம் மற்றும் பங்கு

2. கணக்கீட்டு மொழியியலுக்கான நவீன இடைமுகங்கள்

முடிவுரை

இலக்கியம்


அறிமுகம்

நவீன சமூகத்தின் வாழ்க்கையில் தானியங்கி தகவல் தொழில்நுட்பங்கள் முக்கிய பங்கு வகிக்கின்றன. காலப்போக்கில், அவற்றின் முக்கியத்துவம் தொடர்ந்து அதிகரிக்கிறது. ஆனால் தகவல் தொழில்நுட்பத்தின் வளர்ச்சி மிகவும் சீரற்றது: கணினி தொழில்நுட்பம் மற்றும் தகவல்தொடர்புகளின் நவீன நிலை ஆச்சரியமாக இருந்தால், தகவலின் சொற்பொருள் செயலாக்கத் துறையில், வெற்றிகள் மிகவும் மிதமானவை. இந்த வெற்றிகள், முதலில், மனித சிந்தனையின் செயல்முறைகள், மக்களிடையே வாய்மொழி தகவல்தொடர்பு செயல்முறைகள் மற்றும் கணினியில் இந்த செயல்முறைகளை மாதிரியாக்கும் திறன் ஆகியவற்றின் ஆய்வில் உள்ள சாதனைகளைப் பொறுத்தது.

நம்பிக்கைக்குரிய தகவல் தொழில்நுட்பங்களை உருவாக்கும் போது, ​​​​இயற்கை மொழிகளில் வழங்கப்படும் உரை தகவல்களின் தானியங்கி செயலாக்கத்தின் சிக்கல்கள் முன்னுக்கு வருகின்றன. ஒரு நபரின் சிந்தனை அவரது மொழியுடன் நெருக்கமாக இணைக்கப்பட்டுள்ளது என்பதன் மூலம் இது தீர்மானிக்கப்படுகிறது. மேலும், இயற்கை மொழி சிந்தனைக்கான ஒரு கருவியாகும். இது மக்களிடையே தகவல்தொடர்புக்கான உலகளாவிய வழிமுறையாகும் - கருத்து, குவிப்பு, சேமிப்பு, செயலாக்கம் மற்றும் தகவல் பரிமாற்றத்திற்கான ஒரு வழிமுறையாகும். கணினி மொழியியல் அறிவியல் தானியங்கி தகவல் செயலாக்க அமைப்புகளில் இயற்கை மொழியைப் பயன்படுத்துவதில் உள்ள சிக்கல்களைக் கையாள்கிறது. இந்த விஞ்ஞானம் ஒப்பீட்டளவில் சமீபத்தில் எழுந்தது - கடந்த நூற்றாண்டின் ஐம்பதுகள் மற்றும் அறுபதுகளின் தொடக்கத்தில். கடந்த அரை நூற்றாண்டில், கணினி மொழியியல் துறையில் குறிப்பிடத்தக்க அறிவியல் மற்றும் நடைமுறை முடிவுகள் பெறப்பட்டுள்ளன: ஒரு இயற்கை மொழியிலிருந்து மற்றொன்றுக்கு நூல்களை இயந்திர மொழிபெயர்ப்பதற்கான அமைப்புகள், உரைகளில் தானியங்கு தகவல்களை மீட்டெடுப்பதற்கான அமைப்புகள், தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி தொகுப்புக்கான அமைப்புகள். பேச்சு, மற்றும் பல உருவாக்கப்பட்டுள்ளன. மொழியியல் ஆராய்ச்சியின் போது கணினி மொழியியலைப் பயன்படுத்தி உகந்த கணினி இடைமுகத்தை உருவாக்குவதற்கு இந்த வேலை அர்ப்பணிக்கப்பட்டுள்ளது.


நவீன உலகில், பல்வேறு மொழியியல் ஆய்வுகளை நடத்துவதற்கு கணக்கீட்டு மொழியியல் அதிகளவில் பயன்படுத்தப்படுகிறது.

கணக்கீட்டு மொழியியல் என்பது இயற்கையான மொழியில் வழங்கப்பட்ட தகவல்களை தானியங்கு செயலாக்கத்தின் சிக்கல்களைத் தீர்ப்பதோடு தொடர்புடைய அறிவுத் துறையாகும். கணினி மொழியியலின் மைய அறிவியல் சிக்கல்கள், உரைகளின் பொருளைப் புரிந்துகொள்ளும் செயல்முறையை மாதிரியாக்குவது (உரையிலிருந்து அதன் அர்த்தத்தின் முறைப்படுத்தப்பட்ட பிரதிநிதித்துவத்திற்கு மாறுதல்) மற்றும் பேச்சுத் தொகுப்பின் சிக்கல் (இயற்கையில் உள்ள உரைகளுக்கு முறைப்படுத்தப்பட்ட அர்த்தத்திலிருந்து மாறுதல் மொழி). பல பயன்பாட்டு சிக்கல்களைத் தீர்க்கும்போது இந்த சிக்கல்கள் எழுகின்றன, குறிப்பாக, கணினியில் உரைகளை உள்ளிடும்போது பிழைகளைத் தானாகக் கண்டறிதல் மற்றும் சரிசெய்தல், தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி பேச்சின் தொகுப்பு, ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் தானியங்கி மொழிபெயர்ப்பு, தொடர்பு இயற்கை மொழியில் உள்ள கணினி, உரை ஆவணங்களின் தானியங்கு வகைப்பாடு மற்றும் அட்டவணைப்படுத்தல், அவற்றின் தானியங்கி சுருக்கம், முழு உரை தரவுத்தளங்களில் ஆவணங்களைத் தேடுதல்.

கணக்கீட்டு மொழியியலில் உருவாக்கப்பட்ட மற்றும் பயன்படுத்தப்படும் மொழியியல் கருவிகளை இரண்டு பகுதிகளாகப் பிரிக்கலாம்: அறிவிப்பு மற்றும் நடைமுறை. அறிவிப்புப் பகுதியில் மொழி மற்றும் பேச்சு அலகுகளின் அகராதிகள், உரைகள் மற்றும் பல்வேறு வகையான இலக்கண அட்டவணைகள் உள்ளன, நடைமுறைப் பகுதியில் மொழி மற்றும் பேச்சு அலகுகள், உரைகள் மற்றும் இலக்கண அட்டவணைகள் ஆகியவற்றைக் கையாளும் வழிமுறைகள் அடங்கும். கணினி இடைமுகம் என்பது கணக்கீட்டு மொழியியலின் செயல்முறைப் பகுதியைக் குறிக்கிறது.

கணினி மொழியியலின் பயன்பாட்டு சிக்கல்களைத் தீர்ப்பதில் வெற்றி, முதலில், கணினி நினைவகத்தில் அறிவிப்பு வழிமுறைகளின் பிரதிநிதித்துவத்தின் முழுமை மற்றும் துல்லியம் மற்றும் நடைமுறை வழிமுறைகளின் தரம் ஆகியவற்றைப் பொறுத்தது. உலகின் அனைத்து வளர்ந்த நாடுகளிலும் (ரஷ்யா, அமெரிக்கா, இங்கிலாந்து, பிரான்ஸ், ஜெர்மனி, ஜப்பான், முதலியன) கணக்கீட்டு மொழியியல் துறையில் பணிகள் மேற்கொள்ளப்பட்டாலும், இன்றுவரை, இந்த சிக்கல்களைத் தீர்ப்பதற்கான தேவையான அளவு இன்னும் அடையப்படவில்லை. )

ஆயினும்கூட, கணக்கீட்டு மொழியியல் துறையில் தீவிர அறிவியல் மற்றும் நடைமுறை சாதனைகளைக் குறிப்பிடலாம். இவ்வாறு, பல நாடுகளில் (ரஷ்யா, அமெரிக்கா, ஜப்பான், முதலியன) ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களை இயந்திர மொழிபெயர்ப்பிற்கான சோதனை மற்றும் தொழில்துறை அமைப்புகள் உருவாக்கப்பட்டுள்ளன, இயற்கை மொழியில் கணினிகளுடன் தொடர்புகொள்வதற்கான பல சோதனை அமைப்புகள் கட்டமைக்கப்பட்டுள்ளன. , டெர்மினாலாஜிக்கல் தரவு வங்கிகள், சொற்களஞ்சியம், இருமொழி மற்றும் பன்மொழி இயந்திர அகராதிகளை (ரஷ்யா, அமெரிக்கா, ஜெர்மனி, பிரான்ஸ், முதலியன) உருவாக்கும் பணி நடந்து வருகிறது, தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி பேச்சின் தொகுப்புக்கான அமைப்புகள் கட்டமைக்கப்படுகின்றன (ரஷ்யா, அமெரிக்கா, ஜப்பான் போன்றவை. .), இயற்கை மொழி மாதிரிகளை உருவாக்கும் துறையில் ஆராய்ச்சி நடத்தப்படுகிறது.

பயன்பாட்டு கணக்கீட்டு மொழியியலின் ஒரு முக்கியமான வழிமுறை சிக்கல், தானியங்கி உரை தகவல் செயலாக்க அமைப்புகளின் அறிவிப்பு மற்றும் செயல்முறை கூறுகளுக்கு இடையே தேவையான உறவின் சரியான மதிப்பீடு ஆகும். எது விரும்பப்பட வேண்டும்: வளமான இலக்கண மற்றும் சொற்பொருள் தகவல்களுடன் ஒப்பீட்டளவில் சிறிய சொற்களஞ்சிய அமைப்புகளை அடிப்படையாகக் கொண்ட சக்திவாய்ந்த கணக்கீட்டு நடைமுறைகள் அல்லது ஒப்பீட்டளவில் எளிமையான கணினி இடைமுகங்களைக் கொண்ட சக்திவாய்ந்த அறிவிப்பு கூறு? பெரும்பாலான விஞ்ஞானிகள் இரண்டாவது வழி விரும்பத்தக்கது என்று நம்புகிறார்கள். இது நடைமுறை இலக்குகளை விரைவாக அடைய வழிவகுக்கும், ஏனெனில் குறைவான முட்டுக்கட்டைகள் மற்றும் கடக்க கடினமான தடைகள் இருக்கும், மேலும் இங்கு ஆராய்ச்சி மற்றும் மேம்பாட்டை தானியக்கமாக்குவதற்கு கணினிகளை பெரிய அளவில் பயன்படுத்த முடியும்.

தானியங்கி உரை தகவல் செயலாக்க அமைப்புகளின் அறிவிப்பு கூறுகளை உருவாக்குவதற்கான முயற்சிகளை அணிதிரட்ட வேண்டிய அவசியம், கணினி மொழியியல் வளர்ச்சியில் அரை நூற்றாண்டு அனுபவத்தால் உறுதிப்படுத்தப்பட்டுள்ளது. எல்லாவற்றிற்கும் மேலாக, இங்கே, இந்த அறிவியலின் மறுக்க முடியாத வெற்றிகள் இருந்தபோதிலும், அல்காரிதம் நடைமுறைகளுக்கான ஆர்வம் எதிர்பார்த்த வெற்றியைக் கொண்டுவரவில்லை. நடைமுறை வழிமுறைகளின் திறன்களில் சில ஏமாற்றம் கூட இருந்தது.

மேற்கூறியவற்றின் வெளிச்சத்தில், கணினி மொழியியலின் வளர்ச்சிக்கான அத்தகைய பாதையை உருவாக்குவது உறுதியளிக்கிறது, முக்கிய முயற்சிகள் மொழி மற்றும் பேச்சு அலகுகளின் சக்திவாய்ந்த அகராதிகளை உருவாக்குதல், அவற்றின் சொற்பொருள்-தொடரியல் கட்டமைப்பை ஆய்வு செய்தல் மற்றும் உருவவியல் அடிப்படை நடைமுறைகளை உருவாக்குதல், சொற்பொருள்-தொடக்கவியல் மற்றும் கருத்தியல் பகுப்பாய்வு மற்றும் உரைகளின் தொகுப்பு. இது எதிர்காலத்தில் பரவலான பயன்பாட்டு சிக்கல்களைத் தீர்க்க அனுமதிக்கும்.

கணினி மொழியியல், முதலில், தகவல்களைச் சேகரித்தல், குவித்தல், செயலாக்குதல் மற்றும் மீட்டெடுப்பதற்கான செயல்முறைகளுக்கான மொழியியல் ஆதரவின் பணிகளை எதிர்கொள்கிறது. அவற்றில் மிக முக்கியமானவை:

1. இயந்திர அகராதிகளின் தொகுத்தல் மற்றும் மொழியியல் செயலாக்கத்தின் ஆட்டோமேஷன்;

2. கணினியில் உரைகளை உள்ளிடும்போது பிழைகளைக் கண்டறிந்து திருத்தும் செயல்முறைகளின் ஆட்டோமேஷன்;

3. ஆவணங்கள் மற்றும் தகவல் கோரிக்கைகளின் தானியங்கி அட்டவணைப்படுத்தல்;

4. ஆவணங்களின் தானியங்கு வகைப்பாடு மற்றும் சுருக்கம்;

5. ஒருமொழி மற்றும் பன்மொழி தரவுத்தளங்களில் தகவல் மீட்டெடுப்பு செயல்முறைகளுக்கான மொழியியல் ஆதரவு;

6. ஒரு இயற்கை மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் இயந்திர மொழிபெயர்ப்பு;

7. தானியங்கி அறிவார்ந்த தகவல் அமைப்புகளுடன் (குறிப்பாக, நிபுணர் அமைப்புகள்) இயற்கையான மொழியில் அல்லது இயற்கைக்கு நெருக்கமான மொழியில் பயனர் தொடர்புகளை உறுதி செய்யும் மொழியியல் செயலிகளின் கட்டுமானம்;

8. முறைசாரா நூல்களிலிருந்து உண்மைத் தகவல்களைப் பிரித்தெடுத்தல்.

ஆராய்ச்சியின் தலைப்புக்கு மிகவும் பொருத்தமான சிக்கல்களில் விரிவாக வாழ்வோம்.

தகவல் மையங்களின் நடைமுறை நடவடிக்கைகளில், தானாக கண்டறிதல் மற்றும் உரைகளில் உள்ள பிழைகளை கணினியில் உள்ளிடும்போது அவற்றை சரிசெய்தல் ஆகியவற்றின் சிக்கலை தீர்க்க வேண்டிய அவசியம் உள்ளது. இந்த சிக்கலான பணியை நிபந்தனையுடன் மூன்று பணிகளாகப் பிரிக்கலாம் - ஆர்த்தோகிராஃபிக், தொடரியல் மற்றும் சொற்பொருள் கட்டுப்பாட்டின் பணிகள். அவற்றில் முதன்மையானது, சொல் தண்டுகளின் மிகவும் சக்திவாய்ந்த குறிப்பு இயந்திர அகராதியைப் பயன்படுத்தும் உருவவியல் பகுப்பாய்வு செயல்முறையைப் பயன்படுத்தி தீர்க்கப்படலாம். எழுத்துப்பிழைக் கட்டுப்பாட்டின் செயல்பாட்டில், உரையின் சொற்கள் உருவவியல் பகுப்பாய்விற்கு உட்பட்டவை, மேலும் அவற்றின் அடிப்படைகள் குறிப்பு அகராதியின் அடிப்படைகளுடன் அடையாளம் காணப்பட்டால், அவை சரியானதாகக் கருதப்படுகின்றன; அவை அடையாளம் காணப்படவில்லை என்றால், அவை, ஒரு நுண்ணிய சூழலுடன் சேர்ந்து, ஒரு நபருக்கு பார்வைக்கு வழங்கப்படுகின்றன. ஒரு நபர் சிதைந்த சொற்களைக் கண்டறிந்து திருத்துகிறார், மேலும் தொடர்புடைய மென்பொருள் அமைப்பு இந்த திருத்தங்களை திருத்தப்பட்ட உரையாக மாற்றுகிறது.

எழுத்துப்பிழைகளைக் கண்டறிவதற்காக உரைகளின் தொடரியல் கட்டுப்பாட்டின் பணி எழுத்துக் கட்டுப்பாட்டின் பணியை விட மிகவும் கடினம். முதலாவதாக, அதன் கலவையில் எழுத்துப்பிழைக் கட்டுப்பாட்டை அதன் கட்டாய அங்கமாக உள்ளடக்கியிருப்பதால், இரண்டாவதாக, முறைசாரா நூல்களின் தொடரியல் பகுப்பாய்வின் சிக்கல் இன்னும் முழுமையாக தீர்க்கப்படவில்லை. இருப்பினும், உரைகளின் பகுதி தொடரியல் கட்டுப்பாடு மிகவும் சாத்தியம். இங்கே நீங்கள் இரண்டு வழிகளில் செல்லலாம்: குறிப்பு தொடரியல் கட்டமைப்புகளின் மிகவும் பிரதிநிதித்துவ இயந்திர அகராதிகளைத் தொகுக்கவும் மற்றும் பகுப்பாய்வு செய்யப்பட்ட உரையின் தொடரியல் கட்டமைப்புகளை அவற்றுடன் ஒப்பிடவும்; அல்லது உரை கூறுகளின் இலக்கண நிலைத்தன்மையை சரிபார்க்க சிக்கலான விதிகளை உருவாக்கவும். முதல் பாதை எங்களுக்கு மிகவும் நம்பிக்கைக்குரியதாகத் தோன்றுகிறது, இருப்பினும் இது இரண்டாவது பாதையின் கூறுகளைப் பயன்படுத்துவதற்கான வாய்ப்பை விலக்கவில்லை. உரைகளின் தொடரியல் அமைப்பு வார்த்தைகளின் இலக்கண வகுப்புகளின் அடிப்படையில் விவரிக்கப்பட வேண்டும் (இன்னும் துல்லியமாக, சொற்களுக்கான இலக்கண தகவல்களின் தொகுப்புகளின் வரிசைகளின் வடிவத்தில்).

சொற்பொருள் பிழைகளைக் கண்டறிவதற்காக நூல்களின் சொற்பொருள் கட்டுப்பாட்டின் பணி செயற்கை நுண்ணறிவு பணிகளின் வகுப்பாக வகைப்படுத்தப்பட வேண்டும். மனித சிந்தனையின் செயல்முறைகளை மாதிரியாக்குவதன் அடிப்படையில் மட்டுமே இது முழுமையாக தீர்க்கப்பட முடியும். இந்த வழக்கில், அறிவு கையாளுதலுக்கான சக்திவாய்ந்த கலைக்களஞ்சிய அறிவுத் தளங்கள் மற்றும் மென்பொருள் கருவிகளை உருவாக்குவது அவசியமாக இருக்கும். இருப்பினும், வரையறுக்கப்பட்ட பாடப் பகுதிகள் மற்றும் முறைப்படுத்தப்பட்ட தகவல்களுக்கு, இந்த பணி முற்றிலும் தீர்க்கக்கூடியது. இது உரைகளின் சொற்பொருள்-தொடக்கக் கட்டுப்பாட்டின் சிக்கலாக முன்வைக்கப்பட்டு தீர்க்கப்பட வேண்டும்.

2012 முதல், மனிதநேயத்திற்கான ரஷ்ய மாநில பல்கலைக்கழகத்தின் மொழியியல் நிறுவனம் முதுகலை திட்டத்தின் கீழ் முதுகலை பயிற்சி அளித்து வருகிறது. கணக்கீட்டு மொழியியல்(திசையில் அடிப்படை மற்றும் பயன்பாட்டு மொழியியல்) இந்த திட்டம் தொழில்முறை தயார் செய்ய வடிவமைக்கப்பட்டுள்ளது மொழியியலாளர்கள்மொழியியல் அடிப்படைகள் இரண்டிலும் தேர்ச்சி பெற்றவர்கள் நவீன முறைகள்ஆராய்ச்சி, நிபுணர்-பகுப்பாய்வு, பொறியியல் வேலை மற்றும் புதுமையான மொழி கணினி தொழில்நுட்பங்களின் வளர்ச்சியில் திறம்பட பங்கேற்க முடியும்.

முக்கிய ஆராய்ச்சி மற்றும் மேம்பாட்டுத் திட்டங்களின் உருவாக்குநர்கள் கல்விச் செயல்பாட்டில் பங்கேற்கின்றனர். வணிக அமைப்புகள்தானியங்கி உரை செயலாக்கத் துறையில், இது நவீன கணினி மொழியியலின் முக்கிய நீரோட்டத்துடன் மாஸ்டர் பயிற்சியின் இணைப்பை உறுதி செய்கிறது. சிறப்பு கவனம்ரஷ்ய மற்றும் சர்வதேச மாநாடுகளில் முதுகலை பங்கேற்பதற்காக செலுத்தப்படுகிறது.

ஆசிரியர்களில் மொழியியல் சிறப்புகள், உலகத் தரம் வாய்ந்த வல்லுநர்கள், பெரிய தானியங்கி மொழி செயலாக்க அமைப்புகளின் திட்ட மேலாளர்கள் பற்றிய அடிப்படை பாடப்புத்தகங்களின் ஆசிரியர்கள் உள்ளனர்: யா.ஜி. டெஸ்டெலெட்ஸ், ஐ.எம். போகஸ்லாவ்ஸ்கி, வி.ஐ. பெலிகோவ், வி.ஐ. Podlesskaya, V.P. செலிஜி, எல்.எல். அயோம்டின், ஏ.எஸ். ஸ்டாரோஸ்டின், எஸ்.ஏ. ஷரோவ், அத்துடன் கணக்கீட்டு மொழியியல் துறையில் உலகத் தலைவர்களாக இருக்கும் நிறுவனங்களின் பணியாளர்கள்: IBM (வாட்சன் அமைப்பு), யாண்டெக்ஸ், ABBYY (Lingvo, FineReader, Compreno அமைப்புகள்).

இந்த திட்டத்தில் முதுநிலை பயிற்சிக்கான அடிப்படை திட்ட அணுகுமுறை ஆகும். கணக்கீட்டு மொழியியல் துறையில் ஆராய்ச்சிப் பணிகளில் முதுகலை மாணவர்களின் ஈடுபாடு ரஷ்ய மாநில மனிதநேய பல்கலைக்கழகத்தின் அடிப்படையிலும், AOT (ABBYY, IBM, முதலியன) துறையில் திட்டங்களை உருவாக்கும் நிறுவனங்களின் அடிப்படையிலும் நடைபெறுகிறது. , நிச்சயமாக, எஜமானர்களுக்கும் அவர்களது சாத்தியமான முதலாளிகளுக்கும் ஒரு பெரிய பிளஸ் ஆகும். குறிப்பாக, இலக்கு மாஸ்டர்கள் மாஸ்டர் திட்டத்தில் அனுமதிக்கப்படுகிறார்கள், அதன் பயிற்சி எதிர்கால முதலாளிகளால் வழங்கப்படுகிறது.

நுழைவுத் தேர்வுகள்: "நவீன மொழியியலின் முறையான மாதிரிகள் மற்றும் முறைகள்." பரீட்சை நேரத்தைப் பற்றிய துல்லியமான தகவலை மனிதநேயத்திற்கான ரஷ்ய மாநில பல்கலைக்கழகத்தின் முதுகலை துறையின் இணையதளத்தில் பெறலாம்.

மாஜிஸ்திரேசியின் தலைவர்கள் - தலை. கணக்கீட்டு மொழியியலுக்கான கல்வி மற்றும் அறிவியல் மையம், ABBYY இல் மொழியியல் ஆராய்ச்சி இயக்குனர் விளாடிமிர் பாவ்லோவிச் செலிஜிமற்றும் Philology டாக்டர், பேராசிரியர் வேரா இசகோவ்னா பொட்லெஸ்கயா .

"நவீன மொழியியலின் முறையான மாதிரிகள் மற்றும் முறைகள்" என்ற பிரிவில் நுழைவுத் தேர்வு மற்றும் நேர்காணலுக்கான திட்டம்.

நிரல் பற்றிய கருத்துகள்

  • எந்தவொரு நிரல் கேள்வியும் கேள்வியின் பகுதியுடன் தொடர்புடைய குறிப்பிட்ட மொழியியல் நிகழ்வுகளின் விளக்கங்கள் தொடர்பான பணிகளுடன் இருக்கலாம்: கட்டமைப்புகளின் கட்டுமானம், கட்டுப்பாடுகளின் விளக்கம், கட்டுமானத்திற்கான சாத்தியமான வழிமுறைகள் மற்றும்/அல்லது அடையாளம் காணுதல்.
  • நட்சத்திரக் குறியீடுகளால் குறிக்கப்பட்ட கேள்விகள் விருப்பமானவை (அவை டிக்கெட்டுகளில் எண் 3-ன் கீழ் தோன்றும்). தொடர்புடைய பொருள் பற்றிய அறிவு வேட்பாளர்களுக்கு ஒரு முக்கிய போனஸ், ஆனால் தேவையில்லை.
  • கோட்பாட்டு கேள்விகளுக்கு கூடுதலாக, தேர்வு டிக்கெட்டுகள் மொழிபெயர்ப்பு மற்றும் விவாதத்திற்காக ஆங்கிலத்தில் ஒரு சிறப்பு (மொழியியல்) உரையின் சிறிய பகுதியை வழங்கும். விண்ணப்பதாரர்கள் ஆங்கில அறிவியல் சொற்களஞ்சியம் மற்றும் அறிவியல் உரை பகுப்பாய்வு திறன் ஆகியவற்றில் திருப்திகரமான அளவிலான தேர்ச்சியை வெளிப்படுத்த வேண்டும். விண்ணப்பதாரருக்கு கடுமையான சிரமங்களை ஏற்படுத்தாத உரையின் எடுத்துக்காட்டு, கட்டுரையின் ஒரு பகுதி கீழே உள்ளது https://en.wikipedia.org/wiki/Anaphora_(linguistics):

மொழியியலில், அனஃபோரா (/əˈnæfərə/) என்பது ஒரு வெளிப்பாட்டின் பயன்பாடாகும், அதன் விளக்கம் சூழலில் மற்றொரு வெளிப்பாட்டைச் சார்ந்தது (அதன் முன்னோடி அல்லது பின்தொடர்). ஒரு குறுகிய அர்த்தத்தில், அனஃபோரா என்பது ஒரு முன்னோடி வெளிப்பாட்டைச் சார்ந்து இருக்கும் ஒரு வெளிப்பாட்டின் பயன்பாடாகும், இதனால் கேடஃபோராவுடன் வேறுபடுகிறது, இது ஒரு பிந்தைய வெளிப்பாட்டைச் சார்ந்திருக்கும் ஒரு வெளிப்பாட்டின் பயன்பாடாகும். அனபோரிக் (குறிப்பிடும்) சொல் அனஃபர் என்று அழைக்கப்படுகிறது. எடுத்துக்காட்டாக, சாலி வந்தான் என்ற வாக்கியத்தில், ஆனால் யாரும் அவளைப் பார்க்கவில்லை, அவள் ஒரு அனஃபர் என்ற பிரதிபெயர், சாலியின் முன்னோடியைக் குறிக்கிறது. அவள் வருவதற்கு முன், சாலி என்ற வாக்கியத்தில், யாரும் சாலியைப் பார்க்கவில்லை, அவள் என்ற பிரதிபெயரை பின்தொடர்ந்த சாலியைக் குறிக்கிறது, எனவே அவள் இப்போது ஒரு கேடஃபோர் (மற்றும் பரந்த, ஆனால் குறுகிய, உணர்வு அல்ல). வழக்கமாக, ஒரு அனபோரிக் வெளிப்பாடு என்பது ஒரு புரோஃபார்ம் அல்லது வேறு சில வகையான டிக்டிக் (சூழல் சார்ந்த) வெளிப்பாடு ஆகும். அனஃபோரா மற்றும் கேடஃபோரா இரண்டும் எண்டோஃபோராவின் இனங்கள், இது ஒரு உரையாடல் அல்லது உரையில் வேறு இடத்தில் குறிப்பிடப்பட்டுள்ளதைக் குறிக்கிறது.

அனஃபோரா என்பது வெவ்வேறு காரணங்களுக்காக மற்றும் வெவ்வேறு நிலைகளில் உள்ள ஒரு முக்கியமான கருத்து: முதலில், உரையாடல் எவ்வாறு கட்டமைக்கப்படுகிறது மற்றும் பராமரிக்கப்படுகிறது என்பதை அனஃபோரா குறிக்கிறது; இரண்டாவதாக, அனஃபோரா வாக்கியத்தின் மட்டத்தில் வெவ்வேறு தொடரியல் கூறுகளை ஒன்றாக இணைக்கிறது; மூன்றாவதாக, கணக்கீட்டு மொழியியலில் இயற்கை மொழி செயலாக்கத்திற்கு அனஃபோரா ஒரு சவாலை முன்வைக்கிறது, ஏனெனில் குறிப்பை அடையாளம் காண்பது கடினமாக இருக்கும்; மற்றும் நான்காவதாக, மொழி எவ்வாறு புரிந்து கொள்ளப்படுகிறது மற்றும் செயலாக்கப்படுகிறது என்பதைப் பற்றி அனஃபோரா சில விஷயங்களைக் கூறுகிறது, இது அறிவாற்றல் உளவியலில் ஆர்வமுள்ள மொழியியல் துறைகளுக்குப் பொருத்தமானது.

தத்துவார்த்த சிக்கல்கள்

மொழியியலின் பொதுவான சிக்கல்கள்

  • மொழியியலின் பொருள். மொழி மற்றும் பேச்சு. ஒத்திசைவு மற்றும் டயக்ரோனி.
  • மொழியின் நிலைகள். மொழி நிலைகளின் முறையான மாதிரிகள்.
  • தொடரியல் மற்றும் முன்னுதாரணங்கள். விநியோகத்தின் கருத்து.
  • மொழிகளுக்கிடையேயான ஒப்பீடுகளின் அடிப்படைகள்: அச்சுக்கலை, மரபியல் மற்றும் வட்டார மொழியியல்.
  • *கணித மொழியியல்: பொருள் மற்றும் ஆராய்ச்சி முறைகள்

ஃபோனிடிக்ஸ்

  • ஒலிப்பு பாடம். உச்சரிப்பு மற்றும் ஒலி ஒலியியல்.
  • பிரிவு மற்றும் உயர்தர ஒலிப்பு. உரைநடை மற்றும் ஒலியமைப்பு.
  • ஒலியியலின் அடிப்படைக் கருத்துக்கள். ஒலியியல் அமைப்புகளின் வகைப்பாடு மற்றும் அவற்றின் ஒலிப்பு செயலாக்கங்கள்.
  • *கணினி கருவிகள் மற்றும் ஒலிப்பு ஆராய்ச்சி முறைகள்
  • * பேச்சு பகுப்பாய்வு மற்றும் தொகுப்பு.

உருவவியல்

  • உருவவியல் பொருள். உருவங்கள், மார்பிம்கள், அலோமார்ப்கள்.
  • ஊடுருவல் மற்றும் சொல் உருவாக்கம்.
  • இலக்கண அர்த்தங்கள்மற்றும் அவற்றை செயல்படுத்துவதற்கான வழிகள். இலக்கண வகைகள் மற்றும் இலக்கணங்கள். உருவவியல் மற்றும் தொடரியல் இலக்கண அர்த்தங்கள்.
  • சொல் வடிவம், தண்டு, லெம்மா மற்றும் முன்னுதாரணத்தின் கருத்துக்கள்.
  • பேச்சு பாகங்கள்; பேச்சின் பகுதிகளை கண்டறிவதற்கான அடிப்படை அணுகுமுறைகள்.
  • *பரிமாற்றம் மற்றும் சொல் உருவாக்கம் ஆகியவற்றை விவரிக்கும் முறையான மாதிரிகள்.
  • *தானியங்கி மொழி செயலாக்கப் பணிகளில் உருவவியல்: எழுத்துப்பிழை சரிபார்ப்பு, லெமடிசேஷன், பிஓஎஸ்-டேக்கிங்

சின்டாக்ஸ்

  • தொடரியல் பொருள். தொடரியல் உறவுகளை வெளிப்படுத்தும் வழிகள்.
  • ஒரு வாக்கியத்தின் தொடரியல் கட்டமைப்பைக் குறிக்கும் வழிகள். சார்பு மரங்கள் மற்றும் கூறுகளின் நன்மைகள் மற்றும் தீமைகள்.
  • நேரியல் வரிசையை விவரிப்பதற்கான வழிகள். திட்டத்திறன் இல்லாமை மற்றும் கூறுகளின் முறிவு. மாற்றத்தின் கருத்து; நேரியல் வரிசையுடன் தொடர்புடைய மாற்றங்கள்.
  • தொடரியல் மற்றும் சொற்பொருளுக்கு இடையிலான உறவு: வேலன்ஸ்கள், கட்டுப்பாட்டு மாதிரிகள், செயல்கள் மற்றும் சர்கான்ஸ்டன்ட்கள்.
  • டையடிசிஸ் மற்றும் இணை. செயல் வழித்தோன்றல்.
  • பேச்சின் தொடர்பு அமைப்பு. தீம் மற்றும் ரீம், கொடுக்கப்பட்ட மற்றும் புதிய, மாறாக.
  • *முக்கிய தொடரியல் கோட்பாடுகள்: MST, ஜெனரேடிவிசம், செயல்பாட்டு இலக்கணம், HPSG
  • * தொடரியல் கணித மாதிரிகள்: சாம்ஸ்கியின் படி முறையான மொழிகளின் வகைப்பாடு, அங்கீகார வழிமுறைகள் மற்றும் அவற்றின் சிக்கலானது.

சொற்பொருள்

  • பொருளியல் பொருள். உலகின் அப்பாவி மற்றும் அறிவியல் மொழியியல் படங்கள். Sapir-Worf கருதுகோள்.
  • மொழி மற்றும் பேச்சில் பொருள்: பொருள் மற்றும் குறிப்பு. குறிப்பு வகை (குறிப்பு நிலை).
  • லெக்சிகல் சொற்பொருள். ஒரு வார்த்தையின் சொற்பொருளை விவரிக்கும் வழிகள்.
  • இலக்கண சொற்பொருள். ரஷ்ய மொழியின் உதாரணத்தைப் பயன்படுத்தி முக்கிய வகைகள்.
  • வாக்கியத்தின் சொற்பொருள். முன்மொழிவு கூறு. டீக்ஸிஸ் மற்றும் அனஃபோரா. அளவீடுகள் மற்றும் இணைப்புகள். மாடலிட்டி.
  • லெக்சிகல் அர்த்தங்களின் படிநிலை மற்றும் முறைமை. பாலிசெமி மற்றும் ஹோமோனிமி. பாலிசெமண்டிக் வார்த்தையின் சொற்பொருள் அமைப்பு. மாறாத மற்றும் முன்மாதிரியின் கருத்துக்கள்.
  • சொல்லகராதியில் முன்னுதாரண மற்றும் தொடரியல் உறவுகள். லெக்சிக்கல் செயல்பாடுகள்.
  • விளக்கம். விளக்கத்தின் மொழி. மாஸ்கோ சொற்பொருள் பள்ளி
  • சொற்பொருள் மற்றும் தர்க்கம். அறிக்கையின் உண்மை மதிப்பு.
  • பேச்சு செயல்களின் கோட்பாடு. உச்சரிப்பு மற்றும் அதன் மாயையான சக்தி. நிகழ்ச்சிகள். பேச்சு செயல்களின் வகைப்பாடு.
  • சொற்களஞ்சியம்: சரக்கு மற்றும் சொற்றொடர் அலகுகளை விவரிக்கும் முறைகள்.
  • *முறையான சொற்பொருளின் மாதிரிகள் மற்றும் முறைகள்.
  • *நவீன கணக்கீட்டு மொழியியலில் சொற்பொருளின் மாதிரிகள்.
  • *பகிர்வு மற்றும் செயல்பாட்டு சொற்பொருள்.
  • * கட்டுமான இலக்கணத்தின் அடிப்படை யோசனைகள்.

அச்சுக்கலை

  • மொழிகளின் பாரம்பரிய அச்சுக்கலை வகைப்பாடுகள்.
  • பெயர்ச்சொல் மற்றும் வினைச்சொல்லின் இலக்கண வகைகளின் வகைப்பாடு.
  • அச்சுக்கலை எளிய வாக்கியம். கட்டுமானங்களின் முக்கிய வகைகள்: குற்றச்சாட்டு, தூண்டுதல், செயலில்.
  • சொல் வரிசை மற்றும் கிரீன்பெர்க் தொடர்புகளின் வகை. இடது மற்றும் வலது கிளை மொழிகள்.

லெக்சிகோகிராபி

  • சொல்லகராதி கலாச்சாரத்தின் ஒரு சரக்கு; சொல்லகராதியின் சமூக மாறுபாடு, லெக்சிக்கல் பயன்பாடு, விதிமுறை, குறியீடாக்கம்.
  • அகராதிகளின் வகைப்பாடு (ரஷ்ய பொருளில்). பல்வேறு வகையான அகராதிகளில் சொல்லகராதியின் பிரதிபலிப்பு.
  • ரஷ்ய மொழியைப் பயன்படுத்தி இருமொழி அகராதி.
  • விளக்கமான மற்றும் பரிந்துரைக்கப்பட்ட அகராதி. தொழில்முறை மொழியியல் அகராதிகள்.
  • முக்கிய ரஷ்ய விளக்க அகராதிகளின் விவரக்குறிப்புகள். அகராதி உள்ளீட்டின் அமைப்பு. விளக்கம் மற்றும் கலைக்களஞ்சிய தகவல்.
  • சொல்லகராதி மற்றும் இலக்கணம். மாஸ்கோ சொற்பொருள் பள்ளியில் மொழியின் ஒருங்கிணைந்த மாதிரியின் யோசனை.
  • * அகராதி ஆசிரியரின் முறை.
  • *சொற்பொழிலில் கார்பஸ் முறைகள்.

உரை மற்றும் சொற்பொழிவின் மொழியியல்

  • உரை மற்றும் சொற்பொழிவின் கருத்து.
  • இடைச்சொல் தொடர்பு வழிமுறைகள். அவற்றின் மொழியியல் செயலாக்கத்தின் முக்கிய வகைகள்.
  • வாக்கியம் மொழியின் ஒரு அலகு மற்றும் உரையின் ஒரு உறுப்பு.
  • சூப்பர்ஃப்ரேசல் ஒற்றுமைகள், அவற்றின் உருவாக்கம் மற்றும் தனிமைப்படுத்தலின் கொள்கைகள், அடிப்படை பண்புகள்.
  • உரை வகைப்பாட்டின் முக்கிய வகைகள் (வகை, நடை, பதிவு, பொருள் பகுதி போன்றவை)
  • *தானியங்கி வகை வகைப்பாடு முறைகள்.

சமூகவியல்

  • சமூக மொழியியலின் பொருள் மற்றும் எல்லைகளின் சிக்கல், அதன் இடைநிலை இயல்பு. சமூகவியல் மற்றும் மக்கள்தொகையின் அடிப்படைக் கருத்துக்கள். மொழியியல் கட்டமைப்பு மற்றும் சமூக மொழியியல் நிலைகள். சமூக மொழியியலின் அடிப்படை கருத்துக்கள் மற்றும் திசைகள்.
  • மொழி தொடர்புகள். இருமொழி மற்றும் டிகுளோசியா. மொழியின் வரலாற்றில் மாறுபட்ட மற்றும் குவிந்த செயல்முறைகள்.
  • மொழியின் சமூக வேறுபாடு. மொழியின் இருப்பு வடிவங்கள். இலக்கிய மொழி: பயன்பாடு-நெறி-குறியீடு. மொழியின் செயல்பாட்டு பகுதிகள்.
  • மொழி சமூகமயமாக்கல். சமூக மற்றும் மொழியியல் அடையாளத்தின் படிநிலை இயல்பு. ஒரு நபரின் மொழியியல் நடத்தை மற்றும் அவரது தொடர்பு திறன்.
  • சமூகவியல் ஆராய்ச்சியின் முறைகள்.

கணினி மொழியியல்

  • கணக்கீட்டு மொழியியலின் பணிகள் மற்றும் முறைகள்.
  • கார்பஸ் மொழியியல். வழக்கின் முக்கிய பண்புகள்.
  • அறிவு பிரதிநிதித்துவம். எம்.மின்ஸ்கியின் பிரேம்களின் கோட்பாட்டின் அடிப்படைக் கருத்துக்கள். ஃபிரேம்நெட் அமைப்பு.
  • சொற்களஞ்சியம் மற்றும் ஆன்டாலஜிகள். வேர்ட்நெட்.
  • புள்ளிவிவர உரை பகுப்பாய்வின் அடிப்படைகள். அதிர்வெண் அகராதிகள். சேகரிப்பு பகுப்பாய்வு.
  • * இயந்திர கற்றல் கருத்து.

இலக்கியம்

கல்வி (அடிப்படை நிலை)

பரனோவ் ஏ.என்.பயன்பாட்டு மொழியியல் அறிமுகம். எம்.: தலையங்கம் URRS, 2001.

பரனோவ் ஏ.என்., டோப்ரோவோல்ஸ்கி டி.ஓ.சொற்றொடரின் அடிப்படைகள் ( குறுகிய பாடநெறி) பயிற்சி. 2வது பதிப்பு. மாஸ்கோ: பிளின்டா, 2014.

பெலிகோவ் வி.ஏ., கிரிசின் எல்.பி.சமூக மொழியியல். எம்., மனிதநேயத்திற்கான ரஷ்ய மாநில பல்கலைக்கழகம், 2001.

பர்லாக் எஸ்.ஏ., ஸ்டாரோஸ்டின் எஸ்.ஏ.ஒப்பீட்டு வரலாற்று மொழியியல். எம்.: அகாடமி. 2005

வக்டின் என்.பி., கோலோவ்கோ ஈ.வி.மொழியின் சமூகவியல் மற்றும் சமூகவியல். செயின்ட் பீட்டர்ஸ்பர்க், 2004.

Knyazev S.V., Pozharitskaya எஸ்.கே.நவீன ரஷ்ய இலக்கிய மொழி: ஒலிப்பு, கிராபிக்ஸ், எழுத்துப்பிழை, எழுத்துப்பிழை. 2வது பதிப்பு. எம்., 2010

கோபோசேவா ஐ.எம்.மொழியியல் சொற்பொருள். எம்.: தலையங்கம் யுஆர்எஸ்எஸ். 2004.

கோட்சாசோவ் எஸ்.வி., கிரிவ்னோவா ஓ.எஃப்.பொது ஒலிப்பு. எம்.: RSUH, 2001.

Krongauz எம்.ஏ.சொற்பொருள். எம்.: RSUH. 2001.

Krongauz எம்.ஏ.சொற்பொருள்: பணிகள், பணிகள், உரைகள். எம்.: அகாடமி. 2006..

மஸ்லோவ் யு.எஸ்.மொழியியல் அறிமுகம். எட். 6வது, அழிக்கப்பட்டது. எம்.: அகாடமி, பில். போலி. செயின்ட் பீட்டர்ஸ்பர்க் மாநில பல்கலைக்கழகம்,

பிளங்யான் வி.ஏ.பொது உருவவியல்: பொருள் அறிமுகம். எட். 2வது. எம்.: எடிட்டோரியல் யுஆர்எஸ்எஸ், 2003.

டெஸ்டெலெட்ஸ் யா.ஜி.பொது தொடரியல் அறிமுகம். எம்., 2001.

ஷைகேவிச் ஏ.யா.மொழியியல் அறிமுகம். எம்.: அகாடமி. 2005.

அறிவியல் மற்றும் குறிப்பு

அப்ரேசியன் யு.டி.தேர்ந்தெடுக்கப்பட்ட படைப்புகள், தொகுதி I. லெக்சிகல் சொற்பொருள்: 2வது பதிப்பு., ஸ்பானிஷ். மற்றும் கூடுதல் எம்.: பள்ளி "ரஷ்ய கலாச்சாரத்தின் மொழிகள்", 1995.

அப்ரேசியன் யு.டி.தேர்ந்தெடுக்கப்பட்ட படைப்புகள், தொகுதி II. மொழி மற்றும் அமைப்பு அகராதியின் ஒருங்கிணைந்த விளக்கம். எம்.: பள்ளி "ரஷ்ய கலாச்சாரத்தின் மொழிகள்", 1995.

அப்ரேசியன் யு.டி.(எட்.) ரஷ்ய மொழியின் ஒத்த சொற்களின் புதிய விளக்க அகராதி. மாஸ்கோ - வியன்னா: "ரஷ்ய கலாச்சாரத்தின் மொழிகள்", வீனர் ஸ்லாவிஸ்டிஷர் அல்மனாச், சோண்டர்பேண்ட் 60, 2004.

அப்ரேசியன் யு.டி.(எட்.) உலகின் மொழியியல் படம் மற்றும் முறையான அகராதி (எடி. யு. டி. அப்ரேசியன்). எம்.: "ஸ்லாவிக் கலாச்சாரங்களின் மொழிகள்", 2006, முன்னுரை மற்றும் அத்தியாயம். 1, ப.26 -- 74.

புலிஜினா டி.வி., ஷ்மேலெவ் ஏ.டி.உலகின் மொழியியல் கருத்தாக்கம் (ரஷ்ய இலக்கணத்தின் அடிப்படையில்). எம்.: பள்ளி "ரஷ்ய கலாச்சாரத்தின் மொழிகள்", 1997.

வெயின்ரிச் டபிள்யூ.மொழி தொடர்புகள். கீவ், 1983.

வெஜ்பிட்ஸ்காயா ஏ.சொற்பொருள் உலகளாவிய மற்றும் மொழிகளின் விளக்கம். எம்.: பள்ளி "ரஷ்ய கலாச்சாரத்தின் மொழிகள்". 1999.

கல்பெரின் ஐ.ஆர்.மொழியியல் ஆராய்ச்சியின் ஒரு பொருளாக உரை. 6வது பதிப்பு. எம்.: LKI, 2008 ("20 ஆம் நூற்றாண்டின் மொழியியல் பாரம்பரியம்")

ஜலிஸ்னியாக் ஏ.ஏ.நவீன ரஷ்ய மொழி மற்றும் பொது மொழியியல் ஆகியவற்றில் தேர்ந்தெடுக்கப்பட்ட படைப்புகளின் பயன்பாட்டுடன் "ரஷ்ய பெயரளவு ஊடுருவல்". எம்.: மொழிகள் ஸ்லாவிக் கலாச்சாரம், 2002.

ஜலிஸ்னியாக் ஏ.ஏ., படுச்சேவா ஈ.வி.தொடர்புடைய உட்பிரிவுகளின் அச்சுக்கலை நோக்கி. / செமியோடிக்ஸ் மற்றும் கணினி அறிவியல், தொகுதி. 35. எம்., 1997, பக். 59-107.

இவனோவ் வியாச். சூரியன்..மூன்றாம் மில்லினியத்தின் மொழியியல். எதிர்காலத்திற்கான கேள்விகள். எம்., 2004. பி. 89-100 (11. உலகில் மொழி நிலைமை மற்றும் எதிர்காலத்திற்கான முன்னறிவிப்பு).

கிப்ரிக் ஏ.இ.மொழியியலின் பொதுவான மற்றும் பயன்பாட்டு சிக்கல்கள் பற்றிய கட்டுரைகள். எம்.: மாஸ்கோ ஸ்டேட் யுனிவர்சிட்டி பப்ளிஷிங் ஹவுஸ், 1992.

கிப்ரிக் ஏ.இ.மொழி மாறிலிகள் மற்றும் மாறிகள். செயின்ட் பீட்டர்ஸ்பர்க்: அலேதியா, 2003.

லபோவ் யு.மொழி மாற்றங்களின் பொறிமுறையில் // மொழியியலில் புதியது. இதழ் 7. எம்., 1975. பி.320-335.

லியோன்ஸ் ஜே.மொழியியல் சொற்பொருள்: அறிமுகம். எம்.: ஸ்லாவிக் கலாச்சாரத்தின் மொழிகள். 2003.

லியோன்ஸ் ஜான்.மொழி மற்றும் மொழியியல். அறிமுக பாடநெறி. எம்: யுஆர்எஸ்எஸ், 2004

லகோஃப் ஜே.பெண்கள், தீ மற்றும் ஆபத்தான விஷயங்கள்: மொழியின் வகைகள் சிந்தனை பற்றி நமக்கு என்ன சொல்கின்றன. எம்.: ஸ்லாவிக் கலாச்சாரத்தின் மொழிகள். 2004.

லகோஃப் ஜே, ஜான்சன் எம். நாம் வாழும் உருவகங்கள். பெர். ஆங்கிலத்தில் இருந்து பதிப்பு 2. எம்.: யுஆர்எஸ்எஸ். 2008.

மொழியியல் கலைக்களஞ்சிய அகராதி / எட். மற்றும். யார்ட்சேவா. எம்.: அறிவியல் பதிப்பகம் "பிக் ரஷியன் என்சைக்ளோபீடியா", 2002.

மெல்சுக் ஐ.ஏ.பொது உருவவியல் பாடநெறி. Tt. I-IV. மாஸ்கோ-வியன்னா: "ஸ்லாவிக் கலாச்சாரத்தின் மொழிகள்", வீனர் ஸ்லாவிஸ்டிஷர் அல்மனாச், சோண்டர்பேண்ட் 38/1-38/4, 1997-2001.

மெல்சுக் ஐ. ஏ.மொழியியல் மாதிரிகள் கோட்பாட்டில் அனுபவம் "அர்த்தம் ↔ உரை". எம்.: பள்ளி "ரஷ்ய கலாச்சாரத்தின் மொழிகள்", 1999.

ஃபெடோரோவா எல்.எல்.செமியோடிக்ஸ். எம்., 2004.

பிலிப்போவ் கே. ஏ.உரையின் மொழியியல்: விரிவுரைகளின் பாடநெறி - 2வது பதிப்பு., ஸ்பானிஷ். மற்றும் கூடுதல் எட். செயின்ட் பீட்டர்ஸ்பர்க் பல்கலைக்கழகம், 2007.

ஹாஸ்பெல்மாத், எம்., மற்றும் பலர். (பதிப்பு.). மொழி கட்டமைப்புகளின் உலக அட்லஸ். ஆக்ஸ்போர்டு, 2005.

உலர்த்தி, எம்.எஸ். மற்றும் ஹாஸ்பெல்மாத், எம்.(பதிப்பு.) தி வேர்ல்ட் அட்லஸ் ஆஃப் லாங்குவேஜ் ஸ்ட்ரக்சர்ஸ் ஆன்லைன். லீப்ஜிக்: மேக்ஸ் பிளாங்க் இன்ஸ்டிடியூட் ஃபார் எவல்யூஷனரி ஆந்த்ரோபாலஜி, 2013. (http://wals.info)

கிராஃப்ட் டபிள்யூ.அச்சுக்கலை மற்றும் யுனிவர்சல்கள். கேம்பிரிட்ஜ்: கேம்பிரிட்ஜ் யுனிவர்சிட்டி பிரஸ், 2003. ஷோபன், டி. (பதிப்பு). மொழி அச்சுக்கலை மற்றும் தொடரியல் விளக்கம். 2வது பதிப்பு. கேம்பிரிட்ஜ், 2007.

V. I. பெலிகோவ். அகராதிகளைப் பற்றி “நவீன ரஷ்ய இலக்கிய மொழியின் விதிமுறைகளைக் கொண்டுள்ளது மாநில மொழி இரஷ்ய கூட்டமைப்பு" 2010 // போர்டல் Gramota.Ru (http://gramota.ru/biblio/research/slovari-norm)

கணினி மொழியியல் மற்றும் அறிவுசார் தொழில்நுட்பங்கள்: வருடாந்திர சர்வதேச மாநாட்டின் பொருட்கள் அடிப்படையில் "உரையாடல்". தொகுதி. 1-11. - எம்.: பப்ளிஷிங் ஹவுஸ் நௌகா, மனிதநேயத்திற்கான ரஷ்ய மாநில பல்கலைக்கழகத்தில் இருந்து, 2002-2012. (கணக்கீட்டு மொழியியல் பற்றிய கட்டுரைகள், http://www.dialog-21.ru).

ரஷ்ய மொழியின் தேசிய கார்பஸ்: 2006-2008. புதிய முடிவுகள் மற்றும் வாய்ப்புகள். / பிரதிநிதி. எட். வி. ஏ. பிளங்க்யான். - செயின்ட் பீட்டர்ஸ்பர்க்: நெஸ்டர்-ஹிஸ்டரி, 2009.

வெளிநாட்டு மொழியியலில் புதியது. தொகுதி. XXIV, கணக்கீட்டு மொழியியல் / Comp. பி.யு.கோரோடெட்ஸ்கி. எம்.: முன்னேற்றம், 1989.

ஷிம்சுக் ஈ.ஜி. ரஷ்ய அகராதி: பாடநூல். எம்.: அகாடமி, 2009.

ரஷ்ய மொழியின் தேசிய கார்பஸ்: 2003-2005. கட்டுரைகளின் தொகுப்பு. எம்.: இன்ட்ரிக், 2005.

தொடர்புகளுக்கு:

மனிதநேயத்திற்கான ரஷ்ய மாநில பல்கலைக்கழகத்தின் மொழியியல் நிறுவனத்தின் கணக்கீட்டு மொழியியல் கல்வி மற்றும் அறிவியல் மையம்

மொழியியல் (லத்தீன் மொழியிலிருந்து -
மொழி), மொழியியல், மொழியியல் - அறிவியல்,
மொழிகளை படிக்கிறது.
இது பொதுவாக இயற்கை மனித மொழியின் அறிவியல்
மேலும் அவரைப் போன்ற உலகின் அனைத்து மொழிகளையும் பற்றி
தனிப்பட்ட பிரதிநிதிகள்.
வார்த்தையின் பரந்த பொருளில், மொழியியல்
அறிவியல் மற்றும் நடைமுறை என பிரிக்கப்பட்டுள்ளது. மேலும் அடிக்கடி
மொழியியல் என்பதன் பொருள் துல்லியமாக
அறிவியல் மொழியியல். இது செமியோடிக்ஸின் ஒரு பகுதியாகும்
அறிகுறிகளின் அறிவியல்.
மொழியியல் என்பது மொழியியல் விஞ்ஞானிகளால் தொழில் ரீதியாக ஆய்வு செய்யப்படுகிறது.

மொழியியல் மற்றும் கணினி அறிவியல்.
நவீன சமுதாயத்தின் வாழ்க்கையில் தானியங்கி அமைப்புகள் முக்கிய பங்கு வகிக்கின்றன.
தகவல் தொழில்நுட்பம். ஆனால் தகவல் தொழில் நுட்ப வளர்ச்சி நடக்கிறது
மிகவும் சீரற்றது: கணினி தொழில்நுட்பத்தின் நவீன நிலை மற்றும்
தகவல்தொடர்பு வழிமுறைகள் கற்பனையை வியக்க வைக்கிறது, பின்னர் சொற்பொருள் செயலாக்கத் துறையில்
தகவல், வெற்றிகள் மிகவும் சுமாரானவை. இந்த வெற்றிகள் முதலில், சார்ந்தது
மனித சிந்தனை செயல்முறைகள், பேச்சு செயல்முறைகள் பற்றிய ஆய்வில் சாதனைகள்
மக்களிடையே தொடர்பு மற்றும் கணினியில் இந்த செயல்முறைகளை உருவகப்படுத்தும் திறன். மேலும் இது மிகவும் சிக்கலான பணியாகும்
தகவல் தொழில்நுட்பம், பின்னர் தானியங்கி உரை செயலாக்கத்தின் சிக்கல்கள்
இயற்கை மொழிகளில் வழங்கப்படும் தகவல்கள் முன்னுக்கு வருகின்றன.
ஒரு நபரின் சிந்தனை அவரது மொழியுடன் நெருக்கமாக இணைக்கப்பட்டுள்ளது என்பதன் மூலம் இது தீர்மானிக்கப்படுகிறது. மேலும்
மேலும், இயற்கை மொழி என்பது சிந்தனைக்கான ஒரு கருவி. அவரும் கூட
மக்களிடையே தகவல்தொடர்புக்கான உலகளாவிய வழிமுறை - உணர்தல் வழிமுறை,
தகவல் திரட்டுதல், சேமிப்பு, செயலாக்கம் மற்றும் பரிமாற்றம்.
தானாக இயற்கை மொழியைப் பயன்படுத்துவதில் சிக்கல்கள்
கணினி மொழியியல் அறிவியல் தகவல் செயலாக்கத்தைக் கையாள்கிறது. இந்த அறிவியல்
ஒப்பீட்டளவில் சமீபத்தில் எழுந்தது - ஐம்பதுகள் மற்றும் அறுபதுகளின் தொடக்கத்தில்
கடந்த நூற்றாண்டு. முதலில், அதன் உருவாக்கம் போது, ​​அது பல்வேறு இருந்தது
தலைப்புகள்: கணித மொழியியல், கணக்கீட்டு மொழியியல், பொறியியல்
மொழியியல். ஆனால் எண்பதுகளின் முற்பகுதியில் அதற்கு பெயர் ஒதுக்கப்பட்டது
கணக்கீட்டு மொழியியல்.

கணக்கீட்டு மொழியியல் என்பது சிக்கலைத் தீர்ப்பது தொடர்பான அறிவுத் துறையாகும்
இயற்கை மொழியில் வழங்கப்பட்ட தகவல்களின் தானியங்கி செயலாக்கம்.
கணக்கீட்டு மொழியியலின் மைய அறிவியல் சிக்கல்கள் பிரச்சனை
உரைகளின் பொருளைப் புரிந்துகொள்ளும் செயல்முறையை மாதிரியாக்குதல் (உரையிலிருந்து மாறுதல்
அதன் அர்த்தத்தின் முறைப்படுத்தப்பட்ட பிரதிநிதித்துவம்) மற்றும் பேச்சு தொகுப்பின் சிக்கல் (இதிலிருந்து மாற்றம்
இயற்கை மொழியில் உள்ள நூல்களுக்கான அர்த்தத்தின் முறைப்படுத்தப்பட்ட பிரதிநிதித்துவம்). இந்த பிரச்சனைகள்
பல பயன்பாட்டு சிக்கல்களைத் தீர்க்கும்போது எழுகிறது:
1) கணினியில் உரைகளை உள்ளிடும்போது பிழைகளைத் தானாகக் கண்டறிதல் மற்றும் திருத்துதல்,
2) வாய்வழி பேச்சின் தானியங்கி பகுப்பாய்வு மற்றும் தொகுப்பு,
3) ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் தானியங்கி மொழிபெயர்ப்பு,
4) இயற்கையான மொழியில் கணினியுடன் தொடர்பு,
5) உரை ஆவணங்களின் தானியங்கு வகைப்பாடு மற்றும் அட்டவணைப்படுத்தல், அவற்றின்
தானியங்கி சுருக்கம், முழு உரை தரவுத்தளங்களில் ஆவணங்களைத் தேடுதல்.
கணக்கீட்டு மொழியியல் துறையில் கடந்த அரை நூற்றாண்டில் பெறப்பட்டது
குறிப்பிடத்தக்க அறிவியல் மற்றும் நடைமுறை முடிவுகள்: இயந்திர அமைப்புகள் உருவாக்கப்பட்டன
ஒரு இயற்கை மொழியிலிருந்து மற்றொரு மொழிக்கு உரைகளை மொழிபெயர்த்தல், தானியங்கு அமைப்புகள்
உரைகளில் தகவல்களைத் தேடுதல், தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி பேச்சு தொகுப்புக்கான அமைப்புகள் மற்றும்
நிறைய மற்றவர்கள். ஆனால் ஏமாற்றங்களும் இருந்தன. எடுத்துக்காட்டாக, இயந்திர மொழிபெயர்ப்பின் சிக்கல்
ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு வரும் நூல்கள் கற்பனை செய்வதை விட மிகவும் கடினமானதாக மாறியது
இயந்திர மொழிபெயர்ப்பின் முன்னோடிகள் மற்றும் அவர்களைப் பின்பற்றுபவர்கள். அதைப் பற்றியும் கூறலாம்
உரைகளில் உள்ள தகவலுக்கான தானியங்கு தேடல் மற்றும் வாய்வழி பகுப்பாய்வு மற்றும் தொகுப்பு பணி
பேச்சு. விஞ்ஞானிகள் மற்றும் பொறியாளர்கள் வெளிப்படையாக நிறைய வேலை செய்ய வேண்டும்
விரும்பிய முடிவுகளை அடைய.

இயற்கை மொழி செயலாக்கம்; தொடரியல்,
உரையின் உருவவியல், சொற்பொருள் பகுப்பாய்வு). இதுவும் அடங்கும்:
கார்பஸ் மொழியியல், மின்னணு உரை கார்போராவின் உருவாக்கம் மற்றும் பயன்பாடு
மின்னணு அகராதிகள் உருவாக்கம், தெசோரி, ஆன்டாலஜிகள். உதாரணமாக, லிங்வோ. அகராதிகள்
எடுத்துக்காட்டாக, தானியங்கி மொழிபெயர்ப்பு மற்றும் எழுத்துப்பிழை சரிபார்ப்புக்கு பயன்படுத்தப்பட்டது.
உரைகளின் தானியங்கி மொழிபெயர்ப்பு. ரஷ்ய மொழிபெயர்ப்பாளர்களிடையே பிரபலமானது
ப்ரோம்ட் ஆகும். இலவசங்களில் கூகுள் மொழியாக்கம் உள்ளது.
உரையிலிருந்து உண்மைகளை தானாக பிரித்தெடுத்தல் (தகவல் பிரித்தெடுத்தல்)
பிரித்தெடுத்தல், உரைச் சுரங்கம்)
தானியங்கு உரை சுருக்கம். இந்த அம்சம் இயக்கப்பட்டுள்ளது
உதாரணமாக, Microsoft Word இல்.
அறிவு மேலாண்மை அமைப்புகளை உருவாக்குதல். நிபுணர் அமைப்புகளைப் பார்க்கவும்
கேள்விகளுக்கு பதிலளிக்கும் அமைப்புகளை உருவாக்குதல்.
ஒளியியல் எழுத்து அங்கீகாரம் (OCR). உதாரணமாக, FineReader நிரல்
தானியங்கி பேச்சு அங்கீகாரம் (ASR). கட்டண மற்றும் இலவச மென்பொருள்கள் உள்ளன
தானியங்கி பேச்சு தொகுப்பு

கட்டுரையின் உள்ளடக்கம்

கணினி மொழியியல்,பயன்பாட்டு மொழியியலின் திசை, கணினி கருவிகளின் பயன்பாட்டில் கவனம் செலுத்துகிறது - நிரல்கள், தரவை ஒழுங்கமைத்தல் மற்றும் செயலாக்குவதற்கான கணினி தொழில்நுட்பங்கள் - சில நிபந்தனைகள், சூழ்நிலைகள், சிக்கல் பகுதிகள் போன்றவற்றில் மொழியின் செயல்பாட்டை மாதிரியாக்க, அத்துடன் பயன்பாட்டின் முழு நோக்கமும் மொழியியல் மற்றும் தொடர்புடைய துறைகளில் மொழியின் கணினி மாதிரிகள். உண்மையில், பிந்தைய வழக்கில் மட்டுமே நாம் கடுமையான அர்த்தத்தில் பயன்பாட்டு மொழியியலைப் பற்றி பேசுகிறோம், ஏனெனில் மொழியின் கணினி மாடலிங் கணினி அறிவியல் மற்றும் நிரலாக்க கோட்பாட்டின் பயன்பாடு மற்றும் மொழி அறிவியலில் உள்ள சிக்கல்களைத் தீர்ப்பதற்கான ஒரு துறையாகக் கருதப்படலாம். எவ்வாறாயினும், நடைமுறையில், கணக்கீட்டு மொழியியல் என்பது மொழியியலில் கணினிகளின் பயன்பாடு தொடர்பான அனைத்தையும் உள்ளடக்கியது.

கணக்கீட்டு மொழியியல் 1960 களில் ஒரு சிறப்பு அறிவியல் துறையாக வடிவம் பெற்றது. "கணினி மொழியியல்" என்ற ரஷ்ய சொல் ஆங்கில கணக்கீட்டு மொழியியலில் இருந்து மொழிபெயர்க்கப்பட்டுள்ளது. ரஷ்ய மொழியில் கணக்கீட்டு என்ற பெயரடை "கணக்கீட்டு" என்றும் மொழிபெயர்க்கப்படலாம் என்பதால், "கணக்கீட்டு மொழியியல்" என்ற சொல் இலக்கியத்திலும் காணப்படுகிறது, ஆனால் ரஷ்ய அறிவியலில் இது "அளவு மொழியியல்" என்ற கருத்தை அணுகும் ஒரு குறுகிய பொருளைப் பெறுகிறது. இந்த பகுதியில் வெளியீடுகளின் ஓட்டம் மிகவும் பெரியது. கருப்பொருள் தொகுப்புகளுக்கு கூடுதலாக, கணினி மொழியியல் இதழ் அமெரிக்காவில் காலாண்டுக்கு ஒருமுறை வெளியிடப்படுகிறது. கணக்கீட்டு மொழியியல் சங்கத்தால் பல நிறுவன மற்றும் அறிவியல் பணிகள் மேற்கொள்ளப்படுகின்றன, இது பிராந்திய கட்டமைப்புகளைக் கொண்டுள்ளது (குறிப்பாக, ஒரு ஐரோப்பிய கிளை). ஒவ்வொரு இரண்டு வருடங்களுக்கும், கணக்கீட்டு மொழியியல் பற்றிய சர்வதேச மாநாடுகள் - COLING - நடத்தப்படுகின்றன. செயற்கை நுண்ணறிவு குறித்த பல்வேறு மாநாடுகளில் தொடர்புடைய சிக்கல்கள் பொதுவாக பரவலாக குறிப்பிடப்படுகின்றன.

கணக்கீட்டு மொழியியலுக்கான கருவித்தொகுப்பு.

கணக்கீட்டு மொழியியல் ஒரு சிறப்பு பயன்பாட்டு ஒழுக்கமாக அதன் கருவி மூலம் முதன்மையாக வேறுபடுகிறது - அதாவது. பயன்படுத்துவதன் மூலம் கணினி கருவிகள்மொழி தரவு செயலாக்கம். ஒரு மொழியின் செயல்பாட்டின் சில அம்சங்களை மாதிரியாகக் கொண்ட கணினி நிரல்கள் பல்வேறு நிரலாக்க கருவிகளைப் பயன்படுத்த முடியும் என்பதால், கணினி மொழியியலின் பொதுவான கருத்தியல் கருவியைப் பற்றி பேச வேண்டிய அவசியமில்லை. எனினும், அது இல்லை. கணினி மாடலிங் சிந்தனையின் பொதுவான கொள்கைகள் உள்ளன, அவை எப்படியாவது எந்த கணினி மாதிரியிலும் செயல்படுத்தப்படுகின்றன. அவை அறிவுக் கோட்பாட்டை அடிப்படையாகக் கொண்டவை, இது முதலில் செயற்கை நுண்ணறிவுத் துறையில் உருவாக்கப்பட்டது, பின்னர் அறிவாற்றல் அறிவியலின் கிளைகளில் ஒன்றாக மாறியது. கணினி மொழியியலின் மிக முக்கியமான கருத்தியல் வகைகளானது "பிரேம்கள்" (கருத்துசார்ந்த அல்லது அவர்கள் சொல்வது போல், ஒரு குறிப்பிட்ட கருப்பொருளாக ஒருங்கிணைக்கப்பட்ட சூழ்நிலையைப் பற்றிய அறிவின் பிரகடனப் பிரதிநிதித்துவத்திற்கான கருத்தியல் கட்டமைப்புகள்), "காட்சிகள்" (செயல்முறைக்கான கருத்தியல் கட்டமைப்புகள்) போன்ற அறிவு கட்டமைப்புகள் ஆகும். ஒரே மாதிரியான சூழ்நிலை அல்லது ஒரே மாதிரியான நடத்தை பற்றிய அறிவின் பிரதிநிதித்துவம்), "திட்டங்கள்" (ஒரு குறிப்பிட்ட இலக்கை அடைவதற்கு வழிவகுக்கும் சாத்தியமான செயல்கள் பற்றிய யோசனைகளைப் பிடிக்கும் அறிவு கட்டமைப்புகள்). சட்டத்தின் வகையுடன் நெருக்கமாக தொடர்புடையது "காட்சி" என்ற கருத்து. காட்சி வகை முதன்மையாக கணக்கீட்டு மொழியியல் இலக்கியத்தில் உண்மையான மற்றும் சிறப்பம்சமாக அறிவிக்கப்பட்ட பிரதிநிதித்துவத்திற்கான கருத்தியல் கட்டமைப்பின் பெயராகப் பயன்படுத்தப்படுகிறது. மொழி அர்த்தம்(லெக்ஸீம்கள், தொடரியல் கட்டுமானங்கள், இலக்கண வகைகள், முதலியன) சூழ்நிலைகள் மற்றும் அவற்றின் பாகங்கள்.

ஒரு குறிப்பிட்ட வழியில் அறிவு கட்டமைப்புகளின் ஒழுங்கமைக்கப்பட்ட தொகுப்பு அறிவாற்றல் அமைப்பு மற்றும் அதன் கணினி மாதிரியின் "உலக மாதிரியை" உருவாக்குகிறது. செயற்கை நுண்ணறிவு அமைப்புகளில், உலக மாதிரியானது ஒரு சிறப்புத் தொகுதியை உருவாக்குகிறது, இது தேர்ந்தெடுக்கப்பட்ட கட்டிடக்கலையைப் பொறுத்து, உலகத்தைப் பற்றிய பொதுவான அறிவை உள்ளடக்கியிருக்கலாம் ("குளிர்காலத்தில் குளிர்" போன்ற எளிய முன்மொழிவுகளின் வடிவத்தில் அல்லது உற்பத்தி விதிகளின் வடிவத்தில் "வெளியில் மழை பெய்தால், நீங்கள் ஒரு ரெயின்கோட் அணிய வேண்டும் அல்லது குடை எடுக்க வேண்டும்"), சில குறிப்பிட்ட உண்மைகள் ("உலகின் மிக உயர்ந்த சிகரம் எவரெஸ்ட்"), அத்துடன் மதிப்புகள் மற்றும் அவற்றின் படிநிலைகள், சில நேரங்களில் பிரிக்கப்படுகின்றன சிறப்பு "ஆக்ஸியோலாஜிக்கல் பிளாக்".

கணக்கீட்டு மொழியியலின் கருவிகளின் கருத்துகளின் பெரும்பாலான கூறுகள் ஒரே மாதிரியானவை: அவை ஒரே நேரத்தில் மனித அறிவாற்றல் அமைப்பின் சில உண்மையான நிறுவனங்களையும் அவற்றின் கோட்பாட்டு விளக்கம் மற்றும் மாடலிங்கில் பயன்படுத்தப்படும் இந்த நிறுவனங்களைப் பிரதிநிதித்துவப்படுத்தும் வழிகளையும் குறிக்கின்றன. வேறு வார்த்தைகளில் கூறுவதானால், கணினி மொழியியலின் கருத்தியல் கருவியின் கூறுகள் இயக்கவியல் மற்றும் கருவி அம்சங்களைக் கொண்டுள்ளன. எடுத்துக்காட்டாக, ஆன்டாலாஜிக்கல் அம்சத்தில், அறிவிப்பு மற்றும் நடைமுறை அறிவின் பிரிவு ஒரு நபருக்குக் கிடைக்கும் பல்வேறு வகையான அறிவுக்கு ஒத்திருக்கிறது - அறிவு என்று அழைக்கப்படும் WHAT (அறிவிப்பு; அத்தகைய, எடுத்துக்காட்டாக, சில NN இன் அஞ்சல் முகவரி பற்றிய அறிவு), ஒருபுறம், மற்றும் அறிவு எப்படி (செயல்முறை; எடுத்துக்காட்டாக, இந்த NN இன் குடியிருப்பைக் கண்டுபிடிக்க உங்களை அனுமதிக்கும் அறிவு, அதன் முறையான முகவரி தெரியாமல் கூட) - மறுபுறம். கருவி அம்சத்தில், அறிவை விளக்கங்களின் தொகுப்பில் (விளக்கங்கள்), தரவுகளின் தொகுப்பில், ஒருபுறம், மற்றும் ஒரு வழிமுறையில், கணினி அல்லது அறிவாற்றல் அமைப்பின் வேறு மாதிரியால் மேற்கொள்ளப்படும் அறிவுறுத்தல்களில் பொதிந்திருக்க முடியும். மறுபுறம்.

கணக்கீட்டு மொழியியலின் திசைகள்.

CL இன் துறையானது மிகவும் மாறுபட்டது மற்றும் கணினி மாடலிங், ப்ளாட் கட்டமைப்பு மாடலிங், உரை விளக்கத்திற்கான ஹைபர்டெக்ஸ்ட் தொழில்நுட்பங்கள், இயந்திர மொழிபெயர்ப்பு மற்றும் கணினி அகராதியியல் போன்ற பகுதிகளை உள்ளடக்கியது. ஒரு குறுகிய அர்த்தத்தில், CL இன் சிக்கல்கள் பெரும்பாலும் "இயற்கை மொழி செயலாக்கம்" (இயற்கை மொழி செயலாக்கம் என்ற ஆங்கில வார்த்தையின் மொழிபெயர்ப்பு) என்ற சற்றே துரதிர்ஷ்டவசமான பெயருடன் ஒரு இடைநிலை பயன்பாட்டு பகுதியுடன் தொடர்புடையது. இது 1960 களின் பிற்பகுதியில் எழுந்தது மற்றும் "செயற்கை நுண்ணறிவு" என்ற அறிவியல் மற்றும் தொழில்நுட்ப துறைக்குள் உருவாக்கப்பட்டது. அதன் உள் வடிவத்தில், "இயற்கை மொழி செயலாக்கம்" என்ற சொற்றொடர் மொழித் தரவை செயலாக்க கணினிகள் பயன்படுத்தப்படும் அனைத்து பகுதிகளையும் உள்ளடக்கியது. இதற்கிடையில், இந்த வார்த்தையின் குறுகிய புரிதல் நடைமுறையில் உள்ளது - முறைகள், தொழில்நுட்பங்கள் மற்றும் இயற்கையான அல்லது வரையறுக்கப்பட்ட இயற்கை மொழியில் ஒரு கணினியுடன் மனித தொடர்புகளை உறுதி செய்யும் குறிப்பிட்ட அமைப்புகளின் வளர்ச்சி.

"இயற்கை மொழி செயலாக்கம்" துறையின் விரைவான வளர்ச்சி 1970 களில் ஏற்பட்டது, இது கணினி இறுதி பயனர்களின் எண்ணிக்கையில் எதிர்பாராத அதிவேக வளர்ச்சியுடன் தொடர்புடையது. அனைத்து பயனர்களுக்கும் மொழிகள் மற்றும் நிரலாக்க தொழில்நுட்பத்தை கற்பிப்பது சாத்தியமற்றது என்பதால், கணினி நிரல்களுடன் தொடர்புகளை ஒழுங்கமைப்பதில் சிக்கல் எழுந்துள்ளது. இந்த தகவல் தொடர்பு பிரச்சனைக்கான தீர்வு இரண்டு முக்கிய வழிகளைப் பின்பற்றியது. முதல் வழக்கில், நிரலாக்க மொழிகள் மற்றும் இயக்க முறைமைகளை இறுதி பயனருக்கு மாற்றியமைக்க முயற்சிகள் மேற்கொள்ளப்பட்டன. இதன் விளைவாக, மொழிகள் தோன்றின உயர் நிலைவிஷுவல் பேசிக் போன்றவை, மனிதர்களுக்கு நன்கு தெரிந்த உருவகங்களின் கருத்தியல் இடத்தில் கட்டமைக்கப்பட்ட வசதியான இயக்க முறைமைகள் - டெஸ்க், லைப்ரரி. இரண்டாவது வழி, ஒரு குறிப்பிட்ட சிக்கல் பகுதியில் உள்ள கணினியுடன் இயற்கையான மொழியில் அல்லது அதன் சில வரையறுக்கப்பட்ட பதிப்பில் தொடர்பு கொள்ள அனுமதிக்கும் அமைப்புகளை உருவாக்குவது.

பொது வழக்கில் இயற்கை மொழி செயலாக்க அமைப்புகளின் கட்டமைப்பில் பயனரின் பேச்சு செய்தியை பகுப்பாய்வு செய்வதற்கான ஒரு தொகுதி, செய்தியை விளக்குவதற்கான ஒரு தொகுதி, பதிலின் பொருளை உருவாக்குவதற்கான ஒரு தொகுதி மற்றும் அறிக்கையின் மேற்பரப்பு கட்டமைப்பை ஒருங்கிணைப்பதற்கான ஒரு தொகுதி ஆகியவை அடங்கும். அமைப்பின் ஒரு சிறப்புப் பகுதி உரையாடல் கூறு ஆகும், இது உரையாடலை நடத்துவதற்கான உத்திகள், இந்த உத்திகளைப் பயன்படுத்துவதற்கான நிபந்தனைகள் மற்றும் சாத்தியமான தொடர்பு தோல்விகளை (தொடர்பு செயல்பாட்டில் தோல்விகள்) சமாளிப்பதற்கான வழிகளை பதிவு செய்கிறது.

கணினி இயற்கை மொழி செயலாக்க அமைப்புகளில், கேள்வி-பதில் அமைப்புகள், ஊடாடும் சிக்கல் தீர்க்கும் அமைப்புகள் மற்றும் இணைக்கப்பட்ட உரை செயலாக்க அமைப்புகள் பொதுவாக வேறுபடுகின்றன. ஆரம்பத்தில், தகவல் மீட்டெடுப்பு அமைப்புகளில் தகவலைத் தேடும் போது வினவல் குறியாக்கத்தின் மோசமான தரத்திற்கு எதிர்வினையாக கேள்வி-பதில் அமைப்புகள் உருவாக்கத் தொடங்கின. இத்தகைய அமைப்புகளின் சிக்கல் பகுதி மிகவும் குறைவாக இருந்ததால், வினவல்களை முறையான மொழியில் பிரதிநிதித்துவமாக மொழிபெயர்ப்பதற்கான வழிமுறைகளையும், முறையான பிரதிநிதித்துவத்தை இயற்கையான மொழியில் அறிக்கைகளாக மாற்றுவதற்கான தலைகீழ் செயல்முறையையும் இது ஓரளவு எளிதாக்கியது. உள்நாட்டு முன்னேற்றங்களில், இந்த வகை திட்டங்களில் POET அமைப்பு அடங்கும், இது E.V. போபோவ் தலைமையில் ஆராய்ச்சியாளர்கள் குழுவால் உருவாக்கப்பட்டது. கணினி ரஷ்ய மொழியில் கோரிக்கைகளை செயலாக்குகிறது (சிறிய கட்டுப்பாடுகளுடன்) மற்றும் பதிலை ஒருங்கிணைக்கிறது. நிரல் பாய்வு விளக்கப்படம் பகுப்பாய்வின் அனைத்து நிலைகளையும் (உருவவியல், தொடரியல் மற்றும் சொற்பொருள்) மற்றும் தொகுப்பின் தொடர்புடைய நிலைகளை உள்ளடக்கியது.

உரையாடல் சிக்கல் தீர்க்கும் அமைப்புகள், முந்தைய வகை அமைப்புகளைப் போலல்லாமல், தகவல்தொடர்புகளில் செயலில் பங்கு வகிக்கின்றன, ஏனெனில் அவற்றின் பணி அதில் வழங்கப்பட்ட அறிவு மற்றும் பயனரிடமிருந்து பெறக்கூடிய தகவல்களின் அடிப்படையில் சிக்கலுக்கு ஒரு தீர்வைப் பெறுவதாகும். கொடுக்கப்பட்ட சிக்கல் பகுதியில் உள்ள சிக்கல்களைத் தீர்ப்பதற்கான வழக்கமான செயல்களின் வரிசைகளையும், தேவையான ஆதாரங்களைப் பற்றிய தகவல்களையும் பதிவு செய்யும் அறிவு கட்டமைப்புகளை கணினி கொண்டுள்ளது. ஒரு பயனர் ஒரு கேள்வியைக் கேட்கும்போது அல்லது ஒரு குறிப்பிட்ட பணியை அமைக்கும்போது, ​​தொடர்புடைய ஸ்கிரிப்ட் செயல்படுத்தப்படும். சில ஸ்கிரிப்ட் கூறுகள் காணவில்லை அல்லது சில ஆதாரங்கள் காணவில்லை என்றால், கணினி தகவல்தொடர்புகளைத் தொடங்குகிறது. SNUKA அமைப்பு இப்படித்தான் செயல்படுகிறது, எடுத்துக்காட்டாக, பிரச்சனை தீர்ப்போர்இராணுவ நடவடிக்கைகளை திட்டமிடுதல்.

இணைக்கப்பட்ட உரைகளைச் செயலாக்குவதற்கான அமைப்புகள் கட்டமைப்பில் மிகவும் வேறுபட்டவை. அவர்களின் பொதுவான அம்சம் அறிவு பிரதிநிதித்துவ தொழில்நுட்பங்களின் பரவலான பயன்பாட்டைக் கருதலாம். இந்த வகையான அமைப்புகளின் செயல்பாடுகள் உரையைப் புரிந்துகொள்வதும் அதன் உள்ளடக்கத்தைப் பற்றிய கேள்விகளுக்கு பதிலளிப்பதும் ஆகும். புரிதல் ஒரு உலகளாவிய வகையாகக் கருதப்படுவதில்லை, ஆனால் ஒரு குறிப்பிட்ட தகவல்தொடர்பு நோக்கத்தால் தீர்மானிக்கப்படும் ஒரு உரையிலிருந்து தகவலைப் பிரித்தெடுக்கும் செயல்முறையாக கருதப்படுகிறது. வேறு வார்த்தைகளில் கூறுவதானால், சாத்தியமான பயனர் அதைப் பற்றி சரியாக என்ன தெரிந்து கொள்ள விரும்புகிறார் என்ற அனுமானத்துடன் மட்டுமே உரை "படிக்கப்படுகிறது". எனவே, இணைக்கப்பட்ட உரைகளைச் செயலாக்குவதற்கான அமைப்புகள் எந்த வகையிலும் உலகளாவியதாக இல்லை, ஆனால் சிக்கல் சார்ந்தவை. விவாதிக்கப்பட்ட வகை அமைப்புகளின் பொதுவான எடுத்துக்காட்டுகள் RESEARCHER மற்றும் TAILOR அமைப்புகள் ஆகும், இது ஒரு மென்பொருள் தொகுப்பை உருவாக்குகிறது, இது சிக்கலான இயற்பியல் பொருட்களை விவரிக்கும் காப்புரிமை சுருக்கங்களிலிருந்து பயனரைப் பெற அனுமதிக்கிறது.

கணினி மொழியியலின் மிக முக்கியமான பகுதி தகவல் மீட்டெடுப்பு அமைப்புகளின் (IRS) வளர்ச்சியாகும். பிந்தையது 1950 களின் பிற்பகுதியிலும் 1960 களின் முற்பகுதியிலும் அறிவியல் மற்றும் தொழில்நுட்ப தகவல்களின் அளவு கூர்மையான அதிகரிப்புக்கு பதிலளிக்கும் விதமாக எழுந்தது. சேமிக்கப்பட்ட மற்றும் செயலாக்கப்பட்ட தகவலின் வகை மற்றும் தேடல் அம்சங்களின் அடிப்படையில், தகவல் மீட்டெடுப்பு அமைப்புகள் இரண்டு பெரிய குழுக்களாக பிரிக்கப்படுகின்றன - ஆவணப்படம் மற்றும் உண்மை. ஆவணத் தகவல் மீட்டெடுப்பு அமைப்புகள் ஆவணங்களின் உரைகள் அல்லது அவற்றின் விளக்கங்களை (சுருக்கங்கள், நூலியல் அட்டைகள் போன்றவை) சேமிக்கின்றன. உண்மையான ஐஆர்எஸ் குறிப்பிட்ட உண்மைகளின் விளக்கத்தைக் கையாள்கிறது, மேலும் உரை வடிவத்தில் அவசியமில்லை. இவை அட்டவணைகள், சூத்திரங்கள் மற்றும் பிற தரவு விளக்கக்காட்சிகளாக இருக்கலாம். ஆவணங்கள் மற்றும் உண்மைத் தகவல் ஆகிய இரண்டும் உட்பட கலப்பு தகவல் அமைப்புகளும் உள்ளன. தற்போது, ​​உண்மைத் தகவல் அமைப்புகள் தரவுத்தள தொழில்நுட்பங்களின் (DB) அடிப்படையில் கட்டமைக்கப்பட்டுள்ளன. தகவல் மீட்டெடுப்பு அமைப்பில் தகவல் மீட்டெடுப்பை உறுதி செய்வதற்காக, சிறப்பு தகவல் மீட்டெடுப்பு மொழிகள் உருவாக்கப்படுகின்றன, அவை தகவல் மீட்டெடுப்பு சொற்களஞ்சியங்களை அடிப்படையாகக் கொண்டவை. தகவல் மீட்டெடுப்பு மொழி என்பது தகவல் மீட்டெடுப்பு அமைப்பு மற்றும் கோரிக்கையில் சேமிக்கப்பட்ட ஆவணங்களின் உள்ளடக்கத் திட்டத்தின் சில அம்சங்களை விவரிக்க வடிவமைக்கப்பட்ட ஒரு முறையான மொழியாகும். தகவல் மீட்டெடுப்பு மொழியில் ஒரு ஆவணத்தை விவரிக்கும் செயல்முறை அட்டவணைப்படுத்தல் என்று அழைக்கப்படுகிறது. அட்டவணைப்படுத்தலின் விளைவாக, ஒவ்வொரு ஆவணத்திற்கும் ஒரு தகவல் மீட்டெடுப்பு மொழியில் அதன் முறையான விளக்கம் ஒதுக்கப்படுகிறது - ஆவணத்தின் தேடல் படம். வினவல் அதே வழியில் அட்டவணைப்படுத்தப்பட்டுள்ளது, இதற்கு ஒரு தேடல் வினவல் படம் மற்றும் ஒரு தேடல் மருந்து ஒதுக்கப்பட்டுள்ளது. தகவல் மீட்டெடுப்பு வழிமுறைகள் தேடல் வினவல் படத்துடன் தேடல் மருந்துச் சீட்டை ஒப்பிடுவதை அடிப்படையாகக் கொண்டவை. கோரிக்கைக்கான ஆவணத்தை வழங்குவதற்கான அளவுகோல் ஆவணத்தின் தேடல் படம் மற்றும் தேடல் அறிவுறுத்தலுடன் முழுமையாகவோ அல்லது பகுதியாகவோ பொருத்தமாக இருக்கலாம். சில சந்தர்ப்பங்களில், வழங்கல் அளவுகோலை தானே உருவாக்க பயனருக்கு வாய்ப்பு உள்ளது. இது அவரது தகவல் தேவையால் தீர்மானிக்கப்படுகிறது. தானியங்கு தகவல் மீட்டெடுப்பு அமைப்புகள் பெரும்பாலும் விளக்கமான தகவல் மீட்டெடுப்பு மொழிகளைப் பயன்படுத்துகின்றன. ஒரு ஆவணத்தின் பொருள் விளக்கப்படங்களின் தொகுப்பால் விவரிக்கப்படுகிறது. விளக்கங்கள் என்பது சொற்கள் மற்றும் சொற்கள் ஆகும், அவை எளிமையான, மிகவும் அடிப்படை வகைகளையும் சிக்கல் பகுதியின் கருத்துக்களையும் குறிக்கின்றன. ஆவணத்தில் வெவ்வேறு தலைப்புகள் இருப்பதால், ஆவணத்தின் தேடல் படத்தில் பல விளக்கங்கள் உள்ளிடப்பட்டுள்ளன. விவரிப்பாளர்களின் எண்ணிக்கை வரையறுக்கப்படவில்லை, இது அம்சங்களின் பல பரிமாண மேட்ரிக்ஸில் ஆவணத்தை விவரிக்க உங்களை அனுமதிக்கிறது. பெரும்பாலும் டிஸ்கிரிப்டர் தகவல் மீட்டெடுப்பு மொழியில், விளக்கிகளின் இணக்கத்தன்மைக்கு கட்டுப்பாடுகள் விதிக்கப்படுகின்றன. இந்த வழக்கில், தகவல் மீட்டெடுப்பு மொழியில் தொடரியல் உள்ளது என்று கூறலாம்.

M. Taube ஆல் உருவாக்கப்பட்ட அமெரிக்க UNITERM அமைப்பு, விளக்க மொழியுடன் செயல்பட்ட முதல் அமைப்புகளில் ஒன்றாகும். ஆவணச் சொற்கள் - யூனிடெர்ம்கள் - இந்த அமைப்பில் விளக்கங்களாகச் செயல்படுகின்றன. இந்த IRS இன் தனித்தன்மை என்னவென்றால், ஆரம்பத்தில் தகவல் மொழியின் அகராதி குறிப்பிடப்படவில்லை, ஆனால் ஆவணம் மற்றும் வினவலை அட்டவணைப்படுத்தும் செயல்பாட்டில் எழுந்தது. நவீன தகவல் மீட்டெடுப்பு அமைப்புகளின் வளர்ச்சியானது, தெசரஸ் அல்லாத வகை தகவல் மீட்டெடுப்பு அமைப்புகளின் வளர்ச்சியுடன் தொடர்புடையது. இத்தகைய தகவல் அமைப்புகள் பயனருடன் வரையறுக்கப்பட்ட இயற்கையான மொழியில் வேலை செய்கின்றன, மேலும் தேடல் ஆவண சுருக்கங்களின் உரைகள் மூலமாகவும், அவற்றின் நூலியல் விளக்கங்கள் மூலமாகவும், பெரும்பாலும் ஆவணங்கள் மூலமாகவும் மேற்கொள்ளப்படுகிறது. சொற்களஞ்சியம் அல்லாத வகை IRS இல் அட்டவணைப்படுத்துவதற்கு, இயற்கை மொழியின் சொற்கள் மற்றும் சொற்றொடர்கள் பயன்படுத்தப்படுகின்றன.

ஒரு குறிப்பிட்ட அளவிற்கு, கணினி மொழியியல் துறையில் ஹைபர்டெக்ஸ்ட் அமைப்புகளை உருவாக்கும் துறையில் பணி அடங்கும், இது உரையை ஒழுங்கமைப்பதற்கான ஒரு சிறப்பு வழியாகவும் ஒரு அடிப்படையாகவும் கருதப்படுகிறது. புதிய வகைடெக்ஸ்ட், குட்டன்பெர்க் அச்சிடும் பாரம்பரியத்தில் உருவாக்கப்பட்ட சாதாரண உரையுடன் அதன் பல பண்புகளில் வேறுபடுகிறது. ஹைபர்டெக்ஸ்ட் யோசனை வன்னேவர் புஷ்ஷின் பெயருடன் தொடர்புடையது, ஜனாதிபதி எஃப். ரூஸ்வெல்ட்டின் அறிவியல் ஆலோசகர். V. புஷ் கோட்பாட்டளவில் திட்டத்தை உறுதிப்படுத்தினார் தொழில்நுட்ப அமைப்பு"Memex", இது பயனர் பல்வேறு வகையான இணைப்புகளைப் பயன்படுத்தி உரைகள் மற்றும் அவற்றின் துண்டுகளை இணைக்க அனுமதித்தது, முக்கியமாக துணை உறவுகளால். கணினி தொழில்நுட்பம் இல்லாததால் திட்டத்தை செயல்படுத்த கடினமாக இருந்தது, ஏனெனில் இயந்திர அமைப்பு நடைமுறை செயல்படுத்த மிகவும் சிக்கலானதாக மாறியது.

புஷ்ஷின் யோசனை 1960 களில் டி. நெல்சனின் சனாடு அமைப்பில் மீண்டும் பிறந்தது, இது ஏற்கனவே கணினி தொழில்நுட்பத்தைப் பயன்படுத்தியது. "Xanadu" பயனரை கணினியில் உள்ளிடப்பட்ட உரைகளின் தொகுப்பைப் படிக்க அனுமதித்தது வெவ்வேறு வழிகளில், வெவ்வேறு வரிசைகளில், பார்த்த நூல்களின் வரிசையை நினைவில் வைத்துக் கொள்ளவும், அவற்றில் ஏதேனும் ஒன்றை ஒரு தன்னிச்சையான நேரத்தில் தேர்ந்தெடுக்கவும் மென்பொருள் சாத்தியமாக்கியது. அவற்றை இணைக்கும் உறவுகளுடன் கூடிய நூல்களின் தொகுப்பு (மாற்றங்களின் அமைப்பு) டி. நெல்சனால் ஹைபர்டெக்ஸ்ட் என அழைக்கப்பட்டது. பல ஆராய்ச்சியாளர்கள் ஹைப்பர் டெக்ஸ்ட் உருவாக்கத்தை ஒரு புதிய தகவல் சகாப்தத்தின் தொடக்கமாக கருதுகின்றனர், இது அச்சிடும் சகாப்தத்திற்கு எதிராக உள்ளது. பேச்சின் நேரியல் தன்மையை வெளிப்புறமாக பிரதிபலிக்கும் எழுத்தின் நேரியல் தன்மை, மனித சிந்தனை மற்றும் உரையின் புரிதலைக் கட்டுப்படுத்தும் ஒரு அடிப்படை வகையாக மாறும். பொருளின் உலகம் நேரியல் அல்ல, எனவே, ஒரு நேரியல் பேச்சுப் பிரிவில் சொற்பொருள் தகவலைச் சுருக்குவதற்கு சிறப்பு “தொடர்பு பேக்கேஜிங்” தேவை - தீம் மற்றும் ரீம் எனப் பிரித்தல், ஒரு சொல்லின் உள்ளடக்கத் திட்டத்தை வெளிப்படையாகப் பிரித்தல் (அறிக்கை, முன்மொழிவு, கவனம்) மற்றும் மறைமுகமான (முன்கணிப்பு, விளைவு, சொற்பொழிவு உட்குறிப்பு) அடுக்குகள் . கோட்பாட்டாளர்களின் கூற்றுப்படி, வாசகருக்கு அதன் விளக்கக்காட்சியின் போது (அதாவது வாசிப்பு மற்றும் புரிந்துகொள்ளும் போது) மற்றும் தொகுப்பின் செயல்பாட்டில் உரையின் நேரியல் தன்மையை மறுப்பது சிந்தனையின் "விடுதலை" மற்றும் அதன் தோற்றத்திற்கு பங்களிக்கும். புதிய வடிவங்கள்.

கணினி அமைப்பில், ஹைபர்டெக்ஸ்ட் ஒரு வரைபடத்தின் வடிவத்தில் வழங்கப்படுகிறது, அதன் முனைகளில் பாரம்பரிய நூல்கள் அல்லது அவற்றின் துண்டுகள், படங்கள், அட்டவணைகள், வீடியோக்கள் போன்றவை உள்ளன. முனைகள் பல்வேறு உறவுகளால் இணைக்கப்பட்டுள்ளன, அவற்றின் வகைகள் டெவலப்பர்களால் குறிப்பிடப்படுகின்றன மென்பொருள்மிகை உரை அல்லது வாசகரால். உறவுகள் இயக்கத்தின் சாத்தியமான சாத்தியங்களை வரையறுக்கின்றன, அல்லது ஹைபர்டெக்ஸ்ட் மூலம் வழிசெலுத்துகின்றன. உறவுகள் ஒரு திசை அல்லது இருதரப்பு இருக்கலாம். அதன்படி, இருதரப்பு அம்புகள் பயனரை இரு திசைகளிலும் நகர்த்த அனுமதிக்கின்றன, அதே நேரத்தில் ஒரு திசை அம்புகள் பயனரை ஒரு திசையில் மட்டுமே நகர்த்த அனுமதிக்கின்றன. உரையின் கூறுகளைப் பார்க்கும்போது வாசகர் கடந்து செல்லும் முனைகளின் சங்கிலி ஒரு பாதை அல்லது பாதையை உருவாக்குகிறது.

மிகை உரையின் கணினி செயலாக்கங்கள் படிநிலை அல்லது பிணையமாக இருக்கலாம். ஹைபர்டெக்ஸ்ட்டின் படிநிலை - மரம் போன்ற - அமைப்பு அதன் கூறுகளுக்கு இடையில் மாறுவதற்கான சாத்தியக்கூறுகளை கணிசமாகக் கட்டுப்படுத்துகிறது. அத்தகைய உயர் உரையில், கூறுகளுக்கு இடையிலான உறவுகள், பேரின-இன உறவுகளின் அடிப்படையில் ஒரு சொற்களஞ்சியத்தின் கட்டமைப்பை ஒத்திருக்கும். பிணைய ஹைப்பர்டெக்ஸ்ட், கூறுகளுக்கு இடையே பல்வேறு வகையான உறவுகளைப் பயன்படுத்த அனுமதிக்கிறது, இது இன-இன உறவுகளுக்கு மட்டுப்படுத்தப்படவில்லை. ஹைபர்டெக்ஸ்ட் இருக்கும் முறையின்படி, நிலையான மற்றும் மாறும் ஹைபர்டெக்ஸ்ட்கள் வேறுபடுகின்றன. செயல்பாட்டின் போது நிலையான உயர் உரை மாறாது; அதில் பயனர் தனது கருத்துக்களை பதிவு செய்யலாம், ஆனால் அவை விஷயத்தின் சாரத்தை மாற்றாது. டைனமிக் ஹைபர்டெக்ஸ்டைப் பொறுத்தவரை, மாற்றம் என்பது இருப்பின் இயல்பான வடிவமாகும். பொதுவாக, டைனமிக் ஹைபர்டெக்ஸ்ட்கள், தகவல் ஓட்டத்தை தொடர்ந்து பகுப்பாய்வு செய்ய வேண்டிய இடத்தில் செயல்படுகின்றன, அதாவது. பல்வேறு வகையான தகவல் சேவைகளில். ஹைபர்டெக்ஸ்ட், எடுத்துக்காட்டாக, அரிசோனா தகவல் அமைப்பு (AAIS), இது மாதத்திற்கு 300-500 சுருக்கங்கள் மூலம் புதுப்பிக்கப்படுகிறது.

ஹைப்பர்டெக்ஸ்ட் உறுப்புகளுக்கு இடையேயான உறவுகள் ஆரம்பத்தில் படைப்பாளர்களால் சரிசெய்யப்படலாம் அல்லது ஒரு பயனர் ஹைபர்டெக்ஸ்டை அணுகும் போதெல்லாம் அவை உருவாக்கப்படலாம். முதல் வழக்கில் நாம் ஒரு கடினமான கட்டமைப்பின் ஹைப்பர்டெக்ஸ்ட்களைப் பற்றி பேசுகிறோம், இரண்டாவதாக - ஒரு மென்மையான கட்டமைப்பின் ஹைபர்டெக்ஸ்ட்களைப் பற்றி. கடினமான கட்டமைப்பு தொழில்நுட்ப ரீதியாக மிகவும் புரிந்துகொள்ளக்கூடியது. ஒரு மென்மையான கட்டமைப்பை ஒழுங்கமைப்பதற்கான தொழில்நுட்பம் ஆவணங்களின் (அல்லது பிற தகவல் ஆதாரங்கள்) ஒருவருக்கொருவர் அருகாமையில் உள்ள சொற்பொருள் பகுப்பாய்வின் அடிப்படையில் இருக்க வேண்டும். கணக்கீட்டு மொழியியலில் இது ஒரு அற்பமான பணி. இப்போதெல்லாம், முக்கிய வார்த்தைகளில் மென்மையான கட்டமைப்பு தொழில்நுட்பங்களின் பயன்பாடு பரவலாக உள்ளது. ஹைபர்டெக்ஸ்ட் நெட்வொர்க்கில் ஒரு முனையிலிருந்து மற்றொரு முனைக்கு மாறுவது முக்கிய வார்த்தைகளைத் தேடுவதன் விளைவாக மேற்கொள்ளப்படுகிறது. ஒவ்வொரு முறையும் முக்கிய வார்த்தைகளின் தொகுப்பு வேறுபட்டிருக்கலாம் என்பதால், ஒவ்வொரு முறையும் ஹைபர்டெக்ஸ்ட் அமைப்பு மாறுகிறது.

ஹைபர்டெக்ஸ்ட் அமைப்புகளை உருவாக்குவதற்கான தொழில்நுட்பம் உரை மற்றும் உரை அல்லாத தகவல்களை வேறுபடுத்துவதில்லை. இதற்கிடையில், காட்சி மற்றும் ஆடியோ தகவல்களை (வீடியோக்கள், படங்கள், புகைப்படங்கள், ஒலிப்பதிவுகள் போன்றவை) சேர்ப்பதற்கு பயனர் இடைமுகத்தில் குறிப்பிடத்தக்க மாற்றம் மற்றும் அதிக சக்திவாய்ந்த மென்பொருள் மற்றும் கணினி ஆதரவு தேவைப்படுகிறது. இத்தகைய அமைப்புகள் ஹைப்பர் மீடியா அல்லது மல்டிமீடியா என்று அழைக்கப்படுகின்றன. மல்டிமீடியா அமைப்புகளின் தெரிவுநிலையானது, கற்பித்தல் மற்றும் கலைக்களஞ்சியங்களின் கணினி பதிப்புகளை உருவாக்குவதில் அவற்றின் பரவலான பயன்பாட்டை முன்னரே தீர்மானித்தது. எடுத்துக்காட்டாக, டோர்லின் கிண்டர்ஸ்லியால் வெளியிடப்பட்ட குழந்தைகள் கலைக்களஞ்சியங்களின் அடிப்படையில் மல்டிமீடியா அமைப்புகளுடன் அழகாக தயாரிக்கப்பட்ட சிடி-ரோம்கள் உள்ளன.

கணினி அகராதியின் கட்டமைப்பிற்குள், அகராதிகளைத் தொகுத்து இயக்குவதற்கான கணினி தொழில்நுட்பங்கள் உருவாக்கப்பட்டு வருகின்றன. சிறப்பு நிரல்கள் - தரவுத்தளங்கள், கணினி கோப்பு பெட்டிகள், சொல் செயலாக்க நிரல்கள் - தானாகவே அகராதி உள்ளீடுகளை உருவாக்கவும், அகராதி தகவலைச் சேமிக்கவும் மற்றும் செயலாக்கவும் உங்களை அனுமதிக்கின்றன. பல்வேறு கணினி லெக்சிகோகிராஃபிக் புரோகிராம்கள் இரண்டு பெரிய குழுக்களாகப் பிரிக்கப்பட்டுள்ளன: லெக்சிகோகிராஃபிக் படைப்புகளை ஆதரிக்கும் நிரல்கள் மற்றும் பல்வேறு வகையான தன்னியக்க அகராதிகள், அகராதி தரவுத்தளங்கள் உட்பட. தானியங்கி அகராதி என்பது ஒரு பயனர் அல்லது கணினி சொல் செயலாக்க நிரலால் கணினியில் பயன்படுத்த வடிவமைக்கப்பட்ட ஒரு சிறப்பு இயந்திர வடிவமைப்பில் உள்ள அகராதி ஆகும். வேறு வார்த்தைகளில் கூறுவதானால், மனித இறுதிப் பயனருக்கான தானியங்கி அகராதிகள் மற்றும் சொல் செயலாக்க நிரல்களுக்கான தானியங்கி அகராதிகளுக்கு இடையே வேறுபாடு உள்ளது. இயந்திர மொழிபெயர்ப்பு அமைப்புகள், தானியங்கி சுருக்க அமைப்புகள், தகவல் மீட்டெடுப்பு அமைப்புகள் போன்றவற்றில் உள்ள தானியங்கி அகராதிகளிலிருந்து இறுதிப் பயனருக்கான தானியங்கி அகராதிகள் இடைமுகம் மற்றும் அகராதி உள்ளீட்டின் கட்டமைப்பில் கணிசமாக வேறுபடுகின்றன. பெரும்பாலும் அவை நன்கு அறியப்பட்ட வழக்கமான அகராதிகளின் கணினி பதிப்புகள். மென்பொருள் சந்தையில் விளக்க அகராதிகளின் கணினி ஒப்புமைகள் உள்ளன ஆங்கிலத்தில்(தானியங்கி வெப்ஸ்டர், தானியங்கி அகராதிஆங்கில மொழிப் பதிப்பகம் காலின்ஸ், நியூ கிரேட்டின் தானியங்கி பதிப்பு ஆங்கிலம்-ரஷ்ய அகராதிதிருத்தியவர் யு.டி. அப்ரேசியன் மற்றும் ஈ.எம். மெட்னிகோவா), ஓசெகோவின் அகராதியின் கணினி பதிப்பும் உள்ளது. சொல் செயலாக்க நிரல்களுக்கான தானியங்கி அகராதிகளை கடுமையான அர்த்தத்தில் தானியங்கி அகராதிகள் என்று அழைக்கலாம். அவை பொதுவாக சராசரி பயனரை நோக்கமாகக் கொண்டவை அல்ல. அவற்றின் கட்டமைப்பின் அம்சங்கள் மற்றும் சொல்லகராதி பொருளின் நோக்கம் அவற்றுடன் தொடர்பு கொள்ளும் நிரல்களால் தீர்மானிக்கப்படுகிறது.

சதி கட்டமைப்பின் கணினி மாடலிங் என்பது கணினி மொழியியலின் மற்றொரு நம்பிக்கைக்குரிய பகுதி. சதி கட்டமைப்பின் ஆய்வு, கட்டமைப்பு இலக்கிய விமர்சனம் (பரந்த பொருளில்), செமியோடிக்ஸ் மற்றும் கலாச்சார ஆய்வுகள் ஆகியவற்றின் சிக்கல்களுடன் தொடர்புடையது. ப்ளாட் மாடலிங்கிற்கான கிடைக்கக்கூடிய கணினி நிரல்கள் சதி பிரதிநிதித்துவத்திற்கான மூன்று அடிப்படை சம்பிரதாயங்களை அடிப்படையாகக் கொண்டவை - சதி பிரதிநிதித்துவத்தின் உருவவியல் மற்றும் தொடரியல் திசைகள், அத்துடன் அறிவாற்றல் அணுகுமுறை. சதி கட்டமைப்பின் உருவ அமைப்பு பற்றிய கருத்துக்கள் V.Ya. Propp இன் புகழ்பெற்ற படைப்புகளுக்குச் செல்கின்றன ( செ.மீ.) ஒரு ரஷ்ய விசித்திரக் கதையைப் பற்றி. ஒரு விசித்திரக் கதையில் ஏராளமான கதாபாத்திரங்கள் மற்றும் நிகழ்வுகள் இருப்பதால், கதாபாத்திரங்களின் செயல்பாடுகளின் எண்ணிக்கை குறைவாக இருப்பதை ப்ராப் கவனித்தார், மேலும் இந்த செயல்பாடுகளை விவரிக்கும் ஒரு கருவியை அவர் முன்மொழிந்தார். ப்ராப்பின் கருத்துக்கள் அடிப்படையாக அமைந்தன கணினி நிரல் TALE, இது ஒரு விசித்திரக் கதையின் தலைமுறையை மாதிரியாக்குகிறது. TALE திட்டத்தின் அல்காரிதம் விசித்திரக் கதையில் உள்ள கதாபாத்திரங்களின் செயல்பாடுகளின் வரிசையை அடிப்படையாகக் கொண்டது. உண்மையில், ப்ராப்பின் செயல்பாடுகள், அனுபவப் பொருளின் பகுப்பாய்வின் அடிப்படையில் வரிசைப்படுத்தப்பட்ட வகைப்படுத்தப்பட்ட சூழ்நிலைகளின் தொகுப்பை வரையறுக்கின்றன. தலைமுறை விதிகளில் பல்வேறு சூழ்நிலைகளை இணைப்பதற்கான சாத்தியக்கூறுகள் ஒரு பொதுவான செயல்பாடுகளின் வரிசையால் தீர்மானிக்கப்படுகின்றன - இது விசித்திரக் கதைகளின் நூல்களிலிருந்து நிறுவக்கூடிய வடிவத்தில். நிரலில், வழக்கமான செயல்பாடு வரிசைகள் வழக்கமான எழுத்து சந்திப்பு காட்சிகளாக விவரிக்கப்பட்டுள்ளன.

ஒரு உரையின் சதித்திட்டத்திற்கான தொடரியல் அணுகுமுறையின் கோட்பாட்டு அடிப்படையானது "கதை இலக்கணங்கள்" அல்லது "கதை இலக்கணங்கள்" ஆகும். N. சாம்ஸ்கியின் உருவாக்க இலக்கணத்தின் கருத்துக்களை உரையின் மேக்ரோஸ்ட்ரக்சரின் விளக்கத்திற்கு மாற்றியதன் விளைவாக அவை 1970 களின் நடுப்பகுதியில் தோன்றின. ஒரு உருவாக்கும் இலக்கணத்தில் தொடரியல் கட்டமைப்பின் மிக முக்கியமான கூறுகள் வினைச்சொல் மற்றும் பெயர்ச்சொல் சொற்றொடர்களாக இருந்தால், பெரும்பாலான சதி இலக்கணங்களில் வெளிப்பாடு (அமைப்பு), நிகழ்வு மற்றும் அத்தியாயம் ஆகியவை அடிப்படைக் கூறுகளாக தனிமைப்படுத்தப்படுகின்றன. சதி இலக்கணங்களின் கோட்பாட்டில், குறைந்தபட்ச நிலைமைகள், அதாவது, சதி கூறுகளின் வரிசையின் நிலையை ஒரு சாதாரண சதித்திட்டமாக தீர்மானிக்கும் கட்டுப்பாடுகள் பரவலாக விவாதிக்கப்பட்டுள்ளன. இருப்பினும், முற்றிலும் மொழியியல் முறைகளைப் பயன்படுத்தி இதைச் செய்ய முடியாது என்று மாறியது. பல கட்டுப்பாடுகள் சமூக கலாச்சார இயல்புடையவை. சதி இலக்கணங்கள், தலைமுறை மரத்தில் உள்ள வகைகளின் தொகுப்பில் கணிசமாக வேறுபடும் போது, ​​கதை கட்டமைப்பை மாற்றியமைக்க மிகவும் வரையறுக்கப்பட்ட விதிகளை அனுமதித்தது.

1980 களின் முற்பகுதியில், ஆர். ஷெங்கின் மாணவர்களில் ஒருவரான வி. லெஹ்னெர்ட், கணினி சதி ஜெனரேட்டரை உருவாக்கும் பணியின் ஒரு பகுதியாக, உணர்ச்சிகரமான சதி அலகுகளின் (அஃபெக்டிவ் ப்ளாட் யூனிட்ஸ்) அசல் சம்பிரதாயத்தை முன்மொழிந்தார், இது ஒரு சக்திவாய்ந்த வழிமுறையாக மாறியது. சதி கட்டமைப்பைக் குறிக்கும். இது முதலில் செயற்கை நுண்ணறிவு அமைப்பிற்காக உருவாக்கப்பட்டது என்ற போதிலும், இந்த முறையானது முற்றிலும் தத்துவார்த்த ஆய்வுகளில் பயன்படுத்தப்பட்டது. லெஹ்னெர்ட்டின் அணுகுமுறையின் சாராம்சம் என்னவென்றால், கதைக்களம் கதாபாத்திரங்களின் அறிவாற்றல்-உணர்ச்சி நிலைகளில் தொடர்ச்சியான மாற்றமாக விவரிக்கப்பட்டது. எனவே, Lehnert இன் சம்பிரதாயத்தின் கவனம் சதித்திட்டத்தின் வெளிப்புற கூறுகள் - வெளிப்பாடு, நிகழ்வு, அத்தியாயம், ஒழுக்கம் - ஆனால் அதன் உள்ளடக்க பண்புகளில் கவனம் செலுத்துகிறது. இந்த வகையில், லெஹ்னெர்ட்டின் சம்பிரதாயவாதம் ஓரளவுக்கு ப்ராப்பின் கருத்துகளுக்கு திரும்புவதாகும்.

கணினி மொழியியலின் திறனில் இயந்திர மொழிபெயர்ப்பும் அடங்கும், இது தற்போது மறுபிறப்பை அனுபவித்து வருகிறது.

இலக்கியம்:

போபோவ் ஈ.வி. இயற்கையான மொழியில் கணினியுடன் தொடர்பு. எம்., 1982
சதுர் வி.ஜி. மின்னணு கணினிகளுடன் பேச்சு தொடர்பு மற்றும் அவற்றின் வளர்ச்சியின் சிக்கல்கள். – புத்தகத்தில்: பேச்சு தொடர்பு: சிக்கல்கள் மற்றும் வாய்ப்புகள். எம்., 1983
பரனோவ் ஏ.என். மொழியியல் சொற்பொருளில் செயற்கை நுண்ணறிவின் வகைகள். பிரேம்கள் மற்றும் ஸ்கிரிப்டுகள். எம்., 1987
Kobozeva I.M., Laufer N.I., Saburova I.G. மனித-இயந்திர அமைப்புகளில் மாடலிங் தகவல்தொடர்பு. - மொழியியல் ஆதரவு தகவல் அமைப்புகள். எம்., 1987
ஓல்கர் எச்.ஆர். கற்பனை கதைகள், துயரங்கள் மற்றும் உலக வரலாற்றை முன்வைக்கும் வழிகள். - புத்தகத்தில்: சமூக தொடர்புகளின் மொழி மற்றும் மாடலிங். எம்., 1987
கோரோடெட்ஸ்கி பி.யு. கணக்கீட்டு மொழியியல்: மாடலிங் மொழி தொடர்பு
மெக்வீன் கே. இயற்கை மொழி உரை தொகுப்புக்கான சொற்பொழிவு உத்திகள். - வெளிநாட்டு மொழியியலில் புதியது. தொகுதி. XXIV, கணக்கீட்டு மொழியியல். எம்., 1989
போபோவ் ஈ.வி., ப்ரீபிரஜென்ஸ்கி ஏ.பி. . என்எல் அமைப்புகளை செயல்படுத்துவதற்கான அம்சங்கள்
ப்ரீபிரஜென்ஸ்கி ஏ.பி. நவீன NL அமைப்புகளின் வளர்ச்சியின் நிலை. - செயற்கை நுண்ணறிவு. நூல் 1, தொடர்பு அமைப்புகள் மற்றும் நிபுணர் அமைப்புகள். எம்., 1990
சுபோடின் எம்.எம். ஹைபர்டெக்ஸ்ட். புதிய வடிவம்எழுதப்பட்ட தொடர்பு. – வினிதி, சேர். கணினி அறிவியல், 1994, தொகுதி. 18
பரனோவ் ஏ.என். பயன்பாட்டு மொழியியல் அறிமுகம். எம்., 2000