डिलियम येथे इ.स.पू. ४२४ मध्ये अथेन्स आणि बोयोशिया यांच्यात झालेले युद्ध इतिहासात प्रसिद्ध आहे. ग्रीक तत्त्ववेत्ते प्लेटो यांनी आपल्या लायसिस आणि सिंपोझियम या ग्रंथांमध्ये आपले गुरू सॉक्रेटिस यांच्या लिखाणाचा आधार घेऊन त्याविषयी भाष्य केले आहे. त्याचा सारांश म्हणजे बोयोशियाचा एक सैनिक समजा रणभूमीवर आपली सीमा शत्रूच्या सैनिकांना ओलांडता येऊ नये अशा प्रयत्नात आहे. आपल्यासमोर अथेन्सचे, म्हणजे शत्रूचे अनेक सैनिक उभे असल्याची त्याला जाणीव आहे. आपण शत्रूच्या सैनिकांना आपल्या सीमेत घुसून देण्यात यशस्वी ठरलो तरी त्यात आपले प्राण जाऊ शकतात; तसेच आपला बचाव अयशस्वी ठरला तर आपण अगदी खात्रीनेच मृत्युमुखी पडू हे त्याला समजते. साहजिकच या युद्धात कोणाचा विजय होईल याचा विचार न करता तिथून पळ काढणे हा बोयोशियाच्या सैनिकापुढचा सर्वोत्तम मार्ग ठरेल. आता समजा दोन्ही बाजूंच्या सगळ्या सैनिकांनी असाच विचार केला तर सगळेच्यासगळे सैनिक रणभूमीवरून पळून जातील. अत्यंत सामान्य वाटणार्या या घटनेविषयी पुढची अनेक शतके निरनिराळ्या अंगांनी विचार झाला. १९४४ मध्ये जॉन फोन नॉयमान या गणितज्ञाने ‘थिअरी ऑफ गेम्स अॅण्ड इकॉनॉमिक बिहेव्हियर’ या आपल्या पुस्तकात त्याला आधुनिक रूप दिले. आता ‘गेम थिअरी’ म्हणून ओळखल्या जाणार्या संकल्पनेचा विकास वेगाने होत अर्थशास्त्र, राजकारण, क्रीडा अशा अनेक क्षेत्रांमध्ये तिचा वापर करण्याविषयी प्रयत्न सुरू झाले. १९९४ साली अर्थशास्त्रामधले नोबेल पारितोषिक जिंकणारे जॉन नॅश यांनी ‘गेम थिअरी’च्या संकल्पनेला अर्थशास्त्रीय परिमाण देत तिचा वापर प्रत्यक्षात करण्यासंबंधीची जाण सर्वसामान्यांना दिली.
‘गेम थिअरी’ आणि आपण ‘गेम’ म्हणून ज्या गोष्टींना संबोधतो त्यांचा खूप घनिष्ट असा परस्पर संबंध नसतो. ‘गेम थिअरी’ मधली ‘गेम’ म्हणजे एकाहून जास्त लोक/गट/संस्था यांच्यातील अप्रत्यक्ष देवाणघेवाणीची क्रिया असते. या देवाण घेवाणी मधला महत्त्वाचा मुद्दा म्हणजे यात सहभागी असलेल्यांपैकी प्रत्येकाने घेतलेल्या निर्णयाचे अनुकूल/प्रतिकूल परिणाम इतर सगळ्यांवर होतात. सहभाग नोंदविणारा प्रत्येकजण या ‘गेम थिअरी’च्या खेळामधला खेळाडू असू शकतो. असा प्रत्येक खेळाडू स्वत:चे हित जपणारा आणि आपल्या तर्कबुद्धीला अनुसरून निर्णय घेणारा असतो असे गृहीत धरले जाते. याचे उत्तम उदाहरण म्हणून ‘कैद्यांची द्विधा मन:स्थिती’ (Prisoner’s Dilemma) या संकल्पनेचा विचार करता येतो.
गुन्हेगारांच्या एका टोळीतील ‘अ’ व ‘ब’ अशा दोन व्यक्तींना पोलिसांनी अटक केलेली असून तुरुंगात त्यांची चौकशी सुरू आहे असे समजू. हे दोघे कैदी तुरुंगात स्वतंत्र कोठड्यांमध्ये डांबण्यात आलेले आहेत आणि ते एकमेकांच्या संपर्कात अजिबात राहू शकणार नाहीत अशी व्यवस्था केलेली आहे असेही समजू. अशा परिस्थितीत चौकशीदरम्यान:
- ‘अ’ आणि ‘ब’ या दोघांनी आपण निष्पाप असून गुन्हा दुसर्याने केलेला असल्याचे सांगणार असतील तर दोघांनाही कायद्याप्रमाणे प्रत्येकी २ वर्षे तुरुंगवासाची शिक्षा ठोठावली जाणार आहे.
- ‘अ’ ने गुन्ह्याची जबाबदारी ‘ब’ वर ढकलली आणि ‘ब’ने मौन पाळले तर ‘अ’ची लगेचच सुटका होईल; पण ‘ब’ला मात्र ३ वर्षे कैदेची शिक्षा होईल.
- ‘ब’ ने गुन्ह्याची जबाबदारी ‘अ’ वरढकलली आणि ‘अ’ने मौन पाळलेतर ‘ब’ची लगेचच सुटका होईल; पण ‘अ’ला मात्र ३ वर्षे कैदेची शिक्षा होईल.
- ‘अ’ आणि ‘ब’ या दोघांनी मौन पाळले तर त्यांच्यावरचा गुन्हा साक्षी अभावी सिद्ध होत नसल्यामुळे दोघांनाही प्रत्येकी १ वर्ष तुरुंगवासाची कमी शिक्षा ठोठावली जाणार आहे.
या पर्यायांची मांडणी खालील चौकटीत करण्यात आली आहे :
मानवी स्वभावातील द्वंद्वाचे प्रतीक इथे पहायला मिळते. या उदाहरणातील दोन्ही कैदी तर्कबुद्धीला अनुसरून वागले नाहीत तर ते अर्थातच गुन्ह्यामधल्या आपल्या जोडीदारानेच हा गुन्हा केला असल्याची साक्ष देऊन मोकळे होतील. यामुळे आपली निर्दोष सुटका होईल; पण आपल्या जोडीदाराला मोठी शिक्षा भोगावी लागेल असा तर्क ते लढवतील. अर्थातच प्रत्यक्षात यामुळे दोघांनाही प्रत्येकी ३ वर्षांची सगळ्यात मोठी शिक्षा ठोठावली जाईल. दोन्ही कैद्यांच्या दृष्टीने सर्वोत्तम मार्ग पूर्णपणे मौन बाळगण्याचा आहे. कारण यामुळे दोघांनाही प्रत्येकी एक वर्ष तुरुंगवासाची शिक्षा भोगून मोकळे होता येईल.
या उदाहरणामधला ठळक मुद्दा अशाच प्रकारच्या असंख्य दैनंदिन प्रसंगांमध्ये माणसांनी एकमेकांशी सहकार्य करण्याची भूमिका न स्वीकारल्यास होणार्या एकंदर नुकसानीचा आहे. यातून ‘प्रबळ धोरण’ (Dominant Strategy) आणि ‘नॅश समतोल’ (Nash Equilibrium) या संकल्पना निर्माण झाल्या. प्रबळ धोरण म्हणजे आपले प्रतिस्पर्धी कुठले धोरण अवलंबत आहेत याकडे संपूर्ण दुर्लक्ष करून आपण आपल्या हिताचेच धोरण राबवायचे. काही वेळा हे फायद्याचे ठरत असले तरी इतर खेळाडूंची धोरणेही प्रबळ असतील तर या निर्णयाचा फटका बसू शकतो. वरच्या उदाहरणामध्ये एका कैद्यानं दुसर्यावर गुन्ह्याची जबाबदारी टाकण्याचा प्रकार अशाच प्रकारचा आहे. त्यामुळे दोन्ही कैद्यांना प्रत्येकी तीन वर्षांचा तुरुंगवास होऊ शकतो. म्हणूनच सगळ्यांनाच फायदा होईल किंवा सगळ्यांचेच माफक नुकसान होईल अशा प्रकारचे नॅश समतोल धोरण स्वीकारणे सगळ्यांच्या हिताचे असते.
सहकार्याची भूमिका स्वीकारून कुठलेही काम पूर्ण करण्याकडे ‘गेम थिअरी’चा कल असतो. एखाद्या कंपनीने व्यवसाय वृद्धीसाठी योग्य भागीदार निवडणे, राजकीय पक्षांनी आघाडी उभी करणे, एकत्र काम करणार्या लोकांनी एकमेकांवर कुरघोडी न करता प्रत्येकामधल्या गुणांचा वापर करणे अशा असंख्य उदाहरणांमध्ये याचा अनुभव येतो. वस्तूंचे उत्पादन करणार्या कंपन्या या वस्तूंचे मूल्य ठरवताना ‘गेम थिअरी’चा मोठ्या प्रमाणावर वापर करतात.
वर नमूद केलेल्या संकल्पना हे ‘स्थिर’ प्रकारच्या (static) ‘गेम थिअरी’चे उदाहरण आहे. आधुनिक काळात ‘गेम थिअरी’चा आणखी एक प्रकार विचारात घेतला जातो. त्याला ‘गतिमान’ किंवा ‘बदलती’ (dynamic) गेम थिअरी असे म्हणतात. ‘स्थिर गेम थिअरी’मध्ये सगळे खेळाडू एकाच वेळी आपली मते किंवा सहभाग नोंदवतात. त्यामुळे निर्माण झालेल्या परिस्थितीची माहिती या खेळाडूंना मिळत नाही. साहजिकच त्यांनी पुढच्या चाली खेळण्याचा प्रश्नच उद्भवत नाही. ‘बदलत्या गेम थिअरी’मध्ये मात्र एका खेळाडूच्या चालीनंतर दुसरा खेळाडू आपली चाल खेळतो. त्यामुळे त्याला आधीच्या खेळाडूने रचलेल्या चालीची माहिती मिळते आणि त्यानुसार तो आपली चाल खेळतो. अशाच प्रकारे एका खेळाडूची चाल पुढच्या खेळाडूला समजत राहते आणि त्यानुसार तो खेळाडू आपली चाल खेळत राहतो. यामुळे या प्रकारामध्ये अद्ययावत परिस्थितीनुसार चाली रचल्या जातात आणि त्यामुळे त्याचे परिणाम एकदम वेगळे असू शकतात.
पहा : खेळ सिद्धांत
संदर्भ :
- Ken Binmore, Game Theory : A Very Short Introduction, Oxford University Press.
- Sylvia Nasar, A Beautiful Mind, Faber and Faber.
- Tony Crilly, 50 Mathematical Ideas You Really Need to Know, Qercus.
- https://www.youtube.com/watch?v=7szPBZxBIg4
- https://en.wikipedia.org/wiki/Game_theory
समीक्षक : डॉ . शरद साने