Full text in pdf format
Diagnosis of multicollinearity: Assessment of the condition of correlation matrices used in genetic studies*
Samuel Pereira de CarvalhoI; Cosme Damião CruzeII
IDepartamento
de Biologia, Universidade Federal de Lavras (UFLA), 37200-000 Lavras,
MG, Brasil. Send correspondence to S.P.C.
IIDepartamento de Biologia
Geral, Universidade Federal de Viçosa (UFV), 36570-000 Viçosa,
MG, Brasil
ABSTRACT
Data from samples of bean plant genotypes, assessed in a trial carried out in the agricultural year 1991 /92 in Viçosa, MG, were used to study multicollinearity. Different methods to diagnose the problem were applied to correlation matrices. The adverse consequences of multicollinearity become evident as it increases, because the variance associated with the estimates of the parameters increases simultaneously, making them less reliable. For the diagnosis of multicollinearity, the informal methods give only general guidance, and a combination of methods based on the estimation of the variance inflating factors and variance splitting allows not only quantification of the intensity of multicollinearity but also identification of the variables involved.
Keywords: multicollinearity; genetic studies.
REFERENCES
Belsley, D.A., Kuh, E. and Welch, R.E. (1980). Regression Diagnostics: Identifying Data and Sources of Collinearity. John Wiley & Sons, New York, pp. 292.
Carvalho, S.P. (1995). Métodos alternativos de estimação de coeficientes de trilha e índices de seleção, sob multicolinearidade. Doctoral thesis, Universidade Federal de Viçosa, Viçosa, MG.
Cruz, C.D. and Regazzi, A.J. (1994). Modelos Biométricos Aplicados ao Melhoramento Genético. Universidade Federal de Viçosa, Viçosa, MG, pp. 390.
Ferrari, F. (1989). Estimadores viesados para modelos de regressão em presença de multicolinearidade. Doctoral thesis, Escola Superior de Agricultura "Luiz de Queiroz", USP, Piracicaba, SP.
Hayes, J.F. and Hill, W.G. (1981). Modification of estimates of parameters in the construction of the genetic selection indices (`Bending'). Biometrics 37: 483-493.
Hoerl, A.E. and Kennard, R.W. (1970). Ridge regression: Biased estimation for nonorthogonal problems. Technometrics 12: 55-68.
Iemma, A.F. (1987). Modelos lineares. Uma introdução para profissionais da pesquisa agropecuária. In: Simpósio de Estatística Aplicada à Experimentação Agronômica. 32nd Reunião da Sociedade Brasileira de Biometria, Londrina, PR, SBB, pp. 263.
Iemma, A.F. (1988). Matrizes para Estatística. Um texto para profissionais de ciências aplicadas. Escola Superior de Agricultura "Luiz de Queiroz", USP, Piracicaba, SP, pp. 339.
Kmenta, J. (1971). Elements of Econometrics. MacMillan Publishing Co., Inc., New York, pp. 655.
Lawson, C.L. and Hanson, R.J. (1974). Solving Least Square Problems. Prentice Hall, Englewood Cliffs, pp. 340.
Marquardt, D.W. (1970). Generalized inverses, ridge regression, biased linear estimation, and nonlinear estimation. Technometrics 12: 591-612.
Montgomery, D.C. and Peck, E.A. (1981). Introduction to Linear Regression Analysis. John Wiley & Sons, New York, pp. 504.
Neter, J. and Wasserman, W. (1974). Applied Linear Statistical Models. Richard D. Irwin Inc., Homewood, pp. 842.
Neter, J., Wasserman, W. and Kutner, M.H. (1983). Applied Linear Regression Models. Richard D. Irwin Inc., Homewood, pp. 547.
Pereira, T.N.S. (1984). Estimativas de parâmetros genéticos na identificação de progenitores para o melhoramento do feijoeiro-comum (Phaseolus vulgaris L.). Master's thesis, Universidade Federal de Viçosa, Viçosa, MG.
Silvey, S.D. (1969). Multicollinearity and imprecise estimation. J. of the Royal Stat. Society, Serie B. 31: 539-552. Vieira, C. (1983). Cultura do Feijão. 2nd edn. Universidade Federal de Viçosa, Viçosa, MG, pp. 146.
Webster, J.T., Gunst, R.F. and Mason, R.L. (1974). Latent root regression analysis. Technometrics 16: 513-522.
* Part of a thesis presented by S.P.C. to the Universidade Federal de Viçosa, in partial fulfillment of the requirements for the Doctoral degree.