यांत्रिक भाषांतर (Machine Translation)

मानवाच्या मदतीने किंवा मदतीशिवाय भाषांतराचे कार्य करणारे संगणकीय यंत्रप्रारूप. पाठाच्या एका नैसर्गिक भाषेतून दुसऱ्या भाषेत केल्या जाणाऱ्या कार्याचा संगणकीय अनुपयोग अशी याची व्याख्या यूरोपीय संघाने दिली आहे. स्वयंचलित भाषांतर हे यांत्रिक भाषांतराचे मुख्य लक्ष्य आहे. मानवी अनुवादक भाषांतराचे कार्य करताना विषय, संदर्भ, शैली,मजकूर संयोग इत्यादी अनेक घटक लक्षात ठेवून अनेक भाषांतरांपैकी योग्य भाषांतराची निवड करतो. परंतु योग्य भाषांतर करणे हे यंत्रासाठी (संगणकासाठी) अत्यंत कठीण कार्य आहे;कारण मूळ पाठात असणारा भाषिक, भावनात्मक आणि सांस्कृतिक भार आणि भाषेच्या गुंतागुंतीच्या असलेल्या रचनेचे आकलन आणि प्रक्रिया करणे संगणकासाठी अत्यंत कठीण कार्य आहे. असे असले तरीही यंत्र आणि संवेदना ह्या संदर्भात अनेक भाषातज्ञ या क्षेत्रात सातत्याने कार्य करीत असून अलीकडे यांत्रिक भाषांतर हा अनुप्रयोग बहुभाषास्तरांवर अधिक विकसित होताना दिसतो आहे. यंत्राव्दारे आंशिक भाषांतर करण्यात यश आले आहे. गुगल भाषांतर (गुगल ट्रान्सलेशन) आणि सी-डॅक चे मन्त्रा व टी.डी.आय.एल. चे अनुवादक्ष यांत्रिक भाषांतर प्रणाली, ही काही त्याची उदाहरणे होत.
ऐतिहासिक वाटचाल : यांत्रिक भाषांतराची सुरुवात साधारणतः १९४९ च्या दरम्यान झाली असे म्हणता येते.वारेन विवर या अमेरिकन गणिततज्ञाने यांत्रिक भाषांतर (मशिन ट्रांसलेशन) शक्य असल्याचे निवेदन मांडले. त्यांच्या या कार्यामुळे त्यांना यांत्रिक भाषांतराचे जनक असेही म्हटले जाते. यांत्रिक भाषांतरावर प्रथम १९५२ ला एम. आय. टी. येथे परिषद भरली आणि मेकॅनिकल ट्रांसलेशन (यंत्रवत भाषांतर) या प्रथम नियतकालिकाची सुरुवात झाली(१९५४). सुरुवातीच्या काळात यंत्र शब्दकोषाचा वापर करून कोणत्याही वाक्य संरचनेशिवाय शब्दशः भाषांतर करण्यात आले. त्यामध्ये एका वेळेस एक शब्द घेऊन त्याला दुभाषा शब्दकोषाच्या सहाय्याने दुसऱ्या भाषेत समानार्थी शब्द त्याच क्रमात छापला जात असे. १९५४ ला जॉर्जटाऊन युनिव्हर्सिटीच्या संशोधकांनी २५० रशियन शब्द आणि ६ व्याकरणाच्या नियमांचा वापर करुन इंग्रजीतून रशियन भाषेत यांत्रिक भाषांतर केले. अशाप्रकारे केल्या जाणाऱ्या भाषांतरावर पुढील दहा वर्षे काम होत होते ; परंतु १९६६ ला सादर झालेल्यास्वयंचलित भाषा प्रक्रिया सल्लागार समितीच्या (अल्पॅक) अहवालाच्या शिफारशीव्दारे यांत्रिक भाषांतराचे कार्य काही काळासाठी थांबविण्यात आले.१९५७ ला प्रकाशित झालेल्या नोम चोम्स्की यांच्या वाक्यरचना (सिंटॅक्टीक स्ट्रक्चर) या ग्रंथामधे भाषेच्या नियामक प्रणालीचे जे विश्लेषण मांडण्यात आले ते संगणकीय प्रयोगासाठी उपयुक्त होते, त्यामुळे या क्षेत्रात नव्याने संशोधनाला चालना मिळाली. १९६८ च्या सुमारास पिटर टोमा या अमेरिकन तज्ञाने सिस्ट्रान या यांत्रिक भाषांतराच्या यंत्राचे सफल परीक्षण केले,त्याचबरोबर लोगोस ह्या यंत्राचेही परीक्षण झाले आणि यांत्रिक भाषांतराच्या कार्याला पुन्हा एकदा चालना मिळाली. ह्या काळात आंतरभाषा (इंटरलिंग्वा) आणि हस्तांतरण (ट्रान्स्फर) ह्या पध्दतींचा वापर करण्यात आला. आंतरभाषा पध्दतीव्दारे मेटल आणि सेटा ह्या दोन प्रणालींचा विकास करण्यात आला, तर हस्तांतरण पध्दतीव्दारे टोम ह्या माँट्रियल युनिव्हर्सिटीच्या इंग्रजी – फ्रेंच यांत्रिक भाषांतर प्रणालीचा विकास झाला आहे. १९८१ ते २००१ ह्या काळात टोम-मेटिओ या हवामानाचा अंदाज घेणाऱ्या यांत्रिक भाषांतर प्रणालीचा वापर झाला, त्याच्या उच्चतम अचूकपणाचे मापण १९८५ ला ८५% इतके होते. १९८५ नंतरच्या काळात अनेक नवीन वैधानिक (फॉर्मलिझम) व्याकरणाचा प्रयोग करण्यात आला, त्यात जी.बी.(गव्हर्न्मेंड अ‍ॅण्ड बाईंडींग),एल. एफ. जी. (फंक्शनल लेक्सिकल ग्रामर) आणि टी.ए.जी. (ट्री अ‍ॅड्जोईनींग ग्रामर) इत्यादी अग्रगण्य आहेत. भारतातही सी. डॅक, पुणे व्दारे मंत्रा-राजभाषा, इंग्रजी-हिंदी व अनुवादक्ष प्रणाली इंग्रजी-मराठी आणि काही अन्य भारतीय भाषा या यांत्रिक भाषांतरांचा विकास अलिकडच्या काही काळात झाला. कृत्रिम बुध्दीच्या विकासातून या क्षेत्रात अधिक अनुप्रयोगांचा विकास होण्याची शक्यता पुढील काळात आहे.
यांत्रिक भाषांतराच्या पध्दती :यांत्रिक भाषांतराच्या विकासात अनेक पध्दतींचा अवलंब करण्यात आला त्यात पुढील तीन महत्वाच्या आहेत.
१. थेट पध्दत (डायरेक्ट मेथड): या पध्दतीमध्ये दोन भाषांना थेट शब्दकोशाच्या सहाय्याने जोडले जाते. स्त्रोतभाषा कोश आणि लक्ष्यभाषा कोश अशा दोन कोशांचा वापर केला जातो. १९६० च्या काळात या पध्दतीचा जास्त प्रमाणात वापर केला गेला. या पध्दतीमध्ये स्त्रोत भाषेचे विश्लेषण करून लक्ष्य भाषेत शाब्दिक आंतरिकीकरण केले जाते व लक्ष्य भाषेच्या वाक्य व्यवस्थेनुसार मांडणी केली जाते.
२. हस्तांतरण पध्दत (ट्रान्स्फर मेथड):या पध्दतीमध्ये स्त्रोत भाषाकोश,लक्ष्यभाषा कोश आणि द्विभाषा कोशांचा वापर केला जातो. यात शब्द आणि संरचना या दोन्हीच्या आधारे भाषेचे आंतरिकीकरण केले जाते.
३. आंतरभाषा पध्दत ( इंटरलिंग्वा मेथड) :आंतरभाषा पध्दतीमध्ये प्रथम स्त्रोत भाषेचे आंतरभाषा आणि नंतर आंतरभाषेचे लक्ष्यभाषा असे दोन भागात भाषांतर केले जाते.
दृष्टिकोन :भाषांतराचे कार्य करण्यासाठी पुढील दोन दृष्टिकोन महत्वाचे आहेत.
१. नियमाधारित दृष्टिकोन (रुल बेस्ड अ‍ॅप्रोच) :हा भाषातज्ञांद्वारे अधिक वापरला जाणारा दृष्टिकोन आहे. यात भाषेच्या कॉर्पसवर आधारित भाषावैज्ञानिक नियमांच्या आधारे भाषांतराचे कार्य केले जाते.
२. संख्याशास्त्रीय दृष्टिकोन (स्टॅटिस्टिकल अ‍ॅप्रोच) :हा संगणक तज्ञांद्वारे अधिक वापरला जाणारा दृष्टिकोन आहे. यात भाषेचे कॉर्पस व संख्याशास्त्राच्या पध्दतीचा वापर करून भाषांतराचे कार्य केले जाते.

संदर्भ :

Jurafsky,Daniel,Martin,James H,Speech and language Processing,Pearson Education,New Delhi,2008.
Mitkav,Ruslan,The Oxford Handbook Of Computational Linguistics,Oxford Uni.Press, New York,2003.

Discover more from मराठी विश्वकोश

Subscribe to get the latest posts sent to your email.

यांत्रिक भाषांतर (Machine Translation)

Discover more from मराठी विश्वकोश

This Post Has One Comment

प्रतिक्रिया व्यक्त करा उत्तर रद्द करा.

Share this:

Discover more from मराठी विश्वकोश

This Post Has One Comment

प्रतिक्रिया व्यक्त करा उत्तर रद्द करा.