सहसंबंध गुणांक (Correlation Coefficient) हा दोन चलांमधील संबंधाचा अभ्यास करण्यासाठी वापरला जातो. दोन चलांची मूल्ये एकमेकांसमवेत बदलत असतात. म्हणजेच एका चलाचे मूल्य बदलले की दुसऱ्याचे मूल्यही बदलते असे जेव्हा आढळून येते तेव्हा त्या दोन चलांत सहसंबंध आहे असे म्हटले जाते. एका चलाचे मूल्य वाढले की दुसऱ्या चलाचे मूल्यही वाढत असेल आणि त्या दोघांमधील एखाद्याचे मूल्य कमी झाले की दुसऱ्याचेही मूल्य कमी होत असेल तर त्या दोन चलांत धन सहसंबंध आहे असे म्हणतात. याउलट एका चलाचे मूल्य जेव्हा वाढते तेव्हा दुसऱ्या चलाचे कमी होते आणि त्या दोन चलांधील एकाचे मूल्य कमी होते त्यावेळी दुसऱ्याचे वाढते अशी स्थिती असल्यास त्या दोन चलांत ऋण सहसंबंध आहे असे म्हणतात.  X आणि Y या दोन चलांतील सहसंबंध गुणांक \rho ने दर्शविला जातो व खालील प्रमाणे लिहिला जातो.

\rho = corr (X,Y)

सहसंबंध गुणांक नेहमी कमीत कमी -1 व जास्तीत जास्त +1 असू शकतॊ (-1 \leq \rho \leq +1).

स्वयंसहसंबंध गुणांक हा सहसंबंध गुणांकाशी निगडित आहे. स्वयंसहसंबंध गुणांक हा एकाच चलामधील कालपश्चते संदर्भात (time-lag) अभ्यास करण्यासाठी वापरला जातो. वेळ मालिकेचे/कालक्रमिकेचे (Time Series) विश्लेषण  करताना एक चल अभ्यासले जाते. या एका चलाची माहिती (मूल्ये) नियमित वेळेच्या अंतराने नोंदवली जाते. उदाहरणार्थ रोजचे तापमान, रोजचा हवेचा वेग, मासिक खर्च, एखाद्या कंपनीची वार्षिक उलाढाल इत्यादी. एकाच चलाची मूल्ये {x_1, x_2, x_3, \dots} दर्शवली जातात.

प्रत्येक h एवढ्या कालपश्चतेसाठी स्वयंसहसंबंध \rho (h) ने दर्शविला जातो. जर X_t हे t या वेळेशी निगडित चल व X_{t+h} हे (t+h) या वेळेशी निगडित चल असेल तर \rho (h)  खालील प्रमाणे दर्शविला जातो.

\rho (h) = corr (X_t , X_{t+h})

सहसंबंध गुणांकाच्या गुणधर्माप्रमाणे स्वयंसहसंबंध गुणांकदेखील कमीत कमी -1 व जास्तीत जास्त +1 असू शकतॊ (-1 \leq \rho (h) \leq +1). उदाहरणार्थ,  जर \rho (3) = 0.72, असेल तर  याचा अर्थ X  चल वापरून तीन कालपश्चता दूर असलेल्या X_tX_{t+3} या दोन स्वयंनिर्मित चलांमध्ये, 0.72 एवढा धन स्वयंसहसंबंध आहे.

समजा {x_1, x_2, x_3, \dots , x_n} ही एखाद्या कालक्रमिकेची प्राप्ती (time series realisation) आहे. तर या प्राप्तीसाठी h – कालपश्चता स्वयंसहसंबंध गुणांक (h-lag autocorrelation coefficient) खालील सूत्र वापरून काढला जातो.

\hat{\rho}(h) = \frac{\displaystyle\sum_{t=1}^{n-|h|} (x_t - \bar{x})(x_{t+h} - \bar{x})}{\displaystyle\sum_{t=1}^{n} (x_t - \bar{x})^2} ,       h = 0, 1, 2, \dots , (n-1)

वरील सूत्रात    \bar{x} = \frac{\displaystyle\sum_{t=1}^{n} x_t}{n}     हा       {x_1, x_2, x_3, \dots, x_n}  या कालक्रमिकेच्या प्राप्तीचा मध्य आहे.

कालपश्चता विरुद्ध स्वयंसहसंबंध गुणांक यांचा आलेख स्वयंसहसंबंधाबद्दल संपूर्ण  माहिती दर्शवितो. स्वयंसहसंबंध आलेखाचे स्वरूप बघून कालक्रमिकेसाठी योग्य प्रतिमान (Model) शोधण्यास मदत होते. हे प्रतिमान वापरून कालक्रमिकेची भविष्यातील मूल्यांबद्दलची माहिती देता येते. स्वयंसहसंबंध आलेख हा कालक्रमिकेबद्दल भविष्यातील अंदाज (forecasting) वर्तविणेसाठी खूप महत्त्वाची भूमिका पार पाडतो.  तसेच एखादे चल कालक्रमावर अवलंबून आहे किंवा नाही हे देखील स्वयंसहसंबंध आलेखावरून समजण्यास मदत होते.

स्वयंसहसंबंध आलेख समजून घेण्यासाठी सूर्यावरील वार्षिक डागांची 1700 ते 1988 या काळातील प्रसिद्ध कालक्रमिका अभ्यासता येईल. या कालक्रमिकेची प्राप्ती R-software मध्ये उपलब्ध आहे. या कालक्रमिकेच्या आलेखासोबत स्वयंसहसंबंध आलेखदेखील महत्त्वाची माहिती दर्शवितो.

सूर्यावरील वार्षिक डागांच्या 1700 ते 1988 या कालावधीतील 289 वर्षांच्या प्राप्तीसाठी वरील सूत्रानुसार प्रत्येक 1वर्षांपासून 288 वर्षांच्या कालपश्चतेपर्यंत (h = 1, 2, \dots , 288) स्वयंसहसंबंध गुणांक मिळतात.

उदा., खालील तक्त्यात 0 ते 5 कालपश्चता आणि  त्यांच्याशी निगडित असलेले स्वयंसहसंबंध गुणांक दर्शविले आहेत.

कालपश्चता (h) 0 1 2 3 4 5
कालपश्चता स्वयंसहसंबंध (\hat{\rho} (h)) 1.0 0.8413 0.4468 0.0428 -0.2618 -0.4076

वरील तक्ता जर 288 कालपश्चता आणि त्यांच्याशी निगडित असलेले  स्वयंसहसंबंध गुणांक यांच्यासाठी वाढवला आणि त्याचा जर आलेख काढला तर तो खालील प्रमाणे दिसतो.

या आलेखावरून भविष्यातील सूर्यावरील वार्षिक डागांबद्दल माहिती देण्यासाठी योग्य प्रतिमानाबद्दल अनुमान बांधता येईल. वरील आलेख सूर्यावरील वार्षिक डागांसाठी चक्रीय किंवा हंगामी मॉडेल वापरावे असे दर्शवितो.

संदर्भ :

  • Peter J. Brockwell; Richard A. Davis,  Introduction to Time Series and Forecasting, 2nd Edition, Springer,  2002.

 

समीक्षक : डॉ. डी. टी. शिर्के