संगणकीय भाषाविज्ञान : संगणकाद्वारे भाषेचे विश्लेषण व संश्लेषण करणारी उपयोजित भाषाविज्ञानाची एक शाखा. साधारणतः पन्नास वर्षापुर्वी यांत्रिक भाषांतराची सुरुवात झाली तेव्हापासून संगणकीय भाषाविज्ञान तिव्रतेने वाढत आणि विकसित होत आहे. भाषेच्या संगणकीय आणि औपचारिक घडणीतून या क्षेत्राचा सैध्दांतिक विकास झाला आहे. या प्रक्रियेत भाषेच्या अनुप्रयोगात आणि उपयोगात बरीच वाढ झाली आहे. संगणकीय भाषाविज्ञान हा ‘नैसर्गिक भाषा प्रक्रियेसाठी’ प्रतिशब्द सुध्दा मानला जाऊ शकतो. याचे कारण असे की संगणकीय भाषाविज्ञानाचे मुख्य कार्य नैसर्गिक भाषेमध्ये पाठावर प्रक्रिया करून संगणकीय आज्ञावलीची (प्रोग्रॅमची) रचना करणे आहे.
संगणकीय भाषाविज्ञानाच्या हालचालींना पुढील दोन तत्त्वे प्रेरणा देतात. पहिली सैध्दांतिक स्वरुपाची आहे. याचा अर्थ असा की वाढते संगणकीय उदि्दष्टे जे भाषावैज्ञानिक सिध्दांताच्या विकासाला महत्त्वपूर्ण बळ देतील. औपचारिक व्याकरणाच्या अंमलबजावणीमुळे भाषिक अंतर्गत सुसंगतता आणि भाषेचे किचकट गुणधर्म स्पष्ट होतील. त्याचे परिणाम स्पष्टपणे वाक्यीय रचना व्याकरणाच्या स्वरुपात पहायला मिळतात. उदा. सामान्य घटक संरचना व्याकरण (जी. पी. एस. जी.), शब्दगत कार्यलक्षी व्याकरण (एल. एफ. जी.), आणि मुख्य प्रेरणा घटक संरचना व्याकरण (एच. डी. पी. एस. जी. ) तसेच स्वनव्यवस्था व पदव्यवस्थेच्या व्यावहारिक अभ्यासाकरिता मर्यादीत अवस्था पध्दती (फाईनाईट स्टेट मेथड). दूसरी प्रेरणा तांत्रिक स्वरुपाची आहे. यात भाषांतर, सारांशलेखन, व्याकरण तपासणी आणि माहिती तंत्रज्ञानाचा समावेश होतो. अशा इतर विस्तारित व्यावहारिक गरजांची पूर्तता करण्याकरिता वैज्ञानिक नीतीतत्त्वांवर आधारीत तंत्रज्ञान निर्माण करणे हे सर्व फक्त भाषावैज्ञानिक पध्दतींचा वापर करुन साध्य होईल.
ऐतिहासिक वाटचाल : संगणकीय भाषाविज्ञानाची सुरुवात साधारणतः १९४९ च्या दरम्यान झाली. वॉरेन विवर या अमेरिकन गणिततज्ञाने यांत्रिक भाषांतर (मशिन ट्रांसलेशन) शक्य असल्याचे निवेदन मांडले. त्यांच्या या कार्यामुळे त्यांना यांत्रिक भाषांतराचे जनक असेही म्हटले जाते. यांत्रिक भाषांतरावर प्रथम परिषद अमेरिकेतील एम. आय. टी. या विद्यापीठात १९५२ ला भरली आणि यंत्रवत भाषांतर (मेकॅनिकल ट्रांसलेशन) या प्रथम नियतकालिकाची सुरुवात १९५४ साली झाली. त्यानंतर संगणकीय भाषाविज्ञान या शब्दाचा वापर १९६० च्या सुमारास झाला. १९६५ मध्ये यंत्रवत भाषांतर या नियतकालिकाचे नामकरण यांत्रिक भाषांतर आणि संगणकीय भाषाविज्ञान असे झाले. संगणकीय भाषाविज्ञान या शब्दाची निर्मिती डेव्हिड हेज या भाषावैज्ञानिक व संगणक वैज्ञानिकाने केली. ते नॅशनल अकॅडमी ऑफ सायन्सेसच्या स्वयंचलित भाषा प्रक्रिया सल्लागार समितीचे सदस्य होते. या समितीचा अहवाल अल्पॅक अहवाल म्हणून ओळखला जातो. संगणकीय भाषाविज्ञानाच्या क्षेत्रात या अहवालाचे अनन्यसाधारण महत्त्व आहे. १९६६ ला सादर झालेल्या या अहवालात यांत्रिक भाषांतर काही काळासाठी स्थगित करण्यात यावे अशी शिफारस करण्यात आली होती. जोपर्यंत भाषाविज्ञान आणि संगणक विज्ञान क्षेत्रात मूलभूत संशोधन होत नाही तो पर्यंत या क्षेत्रात होणारी गुंतवणूक अन्य क्षेत्रात व्हावी असा हेतू होता. १९५७ मध्ये प्रकाशित झालेल्या नोम चोम्स्की यांच्या वाक्यरचना (सिंटॅक्टीक स्ट्रक्चर) या ग्रंथामध्ये भाषेच्या नियामक प्रणालीचे विश्लेषण मांडण्यात आले आहे, जे संगणकीय प्रयोगासाठी उपयुक्त होते त्यामुळे या क्षेत्रात नव्याने संशोधनाला चालना मिळाली. संगणकीय भाषाविज्ञानाचे सुरुवातीचे पुरस्कर्ते हे भाषातज्ञ आहेत. ते सांख्यिकी तज्ञ नसल्यामुळे त्यांना यांत्रिक भाषांतरासाठी संगणकाची कार्यक्षमता ही भाषेच्या सूक्ष्म निर्दिष्ट नियमासाठी अपूर्ण आहे असे वाटत होते. समांतर कॉरपोरा (सांख्यिकी प्रणाली) व्दारे भाषेचे सूक्ष्म निर्दिष्ट नियम आखून त्याव्दारे भाषांतर शक्य आहे असे त्यांना वाटत होते. त्यामुळे सुरुवातीच्या काळात नियम निर्दिष्ट पध्दतीचा अवलंब आणि अधिक वापर करण्यात आला. उपर्युक्त कार्यामुळे संगणकीय भाषाविज्ञानात व्यावहारीक आणि प्रायोगिक रीतीने भाषाविज्ञानाच्या सिध्दांताला मूर्त औपचारिक व्याकरण प्राप्त झाले. यामुळे हेही स्पष्ट झाले की ,याकरिता भाषेच्या विश्लेषणासाठी आणि बांधणीसाठी अधिक प्रबळ औपचारिक व्याकरणाची गरज आहे, त्यासोबतच अधिक सामान्य वाक्य विश्लेषक (पार्सर), एकीकृत व्याकरण (ईंटीग्रेटेड ग्रामर) प्रणाली अशा अन्य औपचारिक आणि संगणकीकृत प्रणाली निर्माण करण्याची गरज आहे. वरील सर्व गोष्टींची निष्पत्ती म्हणून संगणकीय भाषाविज्ञानाने नावलौकिक मिळवला आहे.
साधने : संगणकीय भाषाविज्ञानाची कार्ये आणि उपयोजन करण्यासाठी ज्या भाषावैज्ञानिक प्रयोग आणि साधनांची आवश्यकता आहे ती पुढीलप्रमाणे : पाठ विभाजन, शब्दभेद विश्लेषण, वाक्य विश्लेषण, शब्द अर्थ नि:संदिग्धीकरण, अनुवर्ती प्रतिनिधान, मर्यादीत अवस्था तंत्रज्ञान, यांत्रिक शिक्षण, शब्दबंधी ज्ञानसंपादन आणि कॉर्पस भाषाविज्ञान इ.
अनुप्रयोग : भाषावैज्ञानिक सिध्दांत आणि संगणकीय प्रोग्रॅम यांच्या आधारे वरील साधनांचा वापर करून संगणकीय भाषाविज्ञानाच्या क्षेत्रात जे अनुप्रयोग निर्माण केले जातात ते पुढीलप्रमाणे : यांत्रिक भाषांतर, पाठ ते उच्चार,उच्चार ते पाठ प्रणाली, माहिती पुनर्प्राप्ती, माहिती उतारा, संवाद प्रणाली, मजकूर लेखन आणि डेटा खनन, इ.
संदर्भ : Jurafsky,Daniel , Martin, James, Speech and Language Processing Education, New Delhi, 2008.