نویسنده

عضو هیات علمی، دانشکده علوم تربیتی و روانشناسی دانشگاه شهید چمران اهواز،اهواز،ایران

10.22055/edus.2004.16016

چکیده

   مطالعه مسائل‌ اندازه‌گیری‌ به‌ منظور پیدا کردن‌ راه‌ حلهایی‌ برای‌ آنها در روانشناسی‌ و تعلیم‌ و تربیت‌ نظریه‌ای‌ به‌ نام‌ نظریه‌ آزمون‌ سازی‌ را به‌ وجود آورده‌ است‌. هدف‌ هر نظریه‌ آزمون‌ سازی‌ کمک‌ به‌ دست‌ اندرکاران‌ این‌ فن‌ است‌ تا آنها را از مدلهای‌ منطقی‌ و ریاضی‌ که‌ زیربنای‌ ساخت‌ آزمونهای‌ روانی‌ و تربیتی‌ را تشکیل‌ می‌دهند آگاه‌ سازد. در این‌ مطالعه‌ تحلیلی‌ مفاهیم‌ و مفروضه‌های‌ دو نظریه‌ مهم‌ در ساخت‌ آزمونهای‌ روانی‌ و تربیتی‌ مورد بررسی‌ قرار گرفت‌. نظریه‌ کلاسیک‌ آزمون‌ که‌ می‌توان‌ پیدایش‌ آن‌ را به‌ چارلز اسپیرمن‌ روانشناس‌ انگلیسی‌ نسبت‌ داد و امروز از آن‌ به‌ عنوان‌ یک‌ نظریه‌ قدیمی‌ در آزمون‌ سازی‌ یاد می‌شود، عمدتاً بر سه‌ مفروضه‌ اساسی‌ نمره‌ مشاهده‌ شده‌، نمره‌ واقعی‌، و نمره‌ خطا استوار است‌. این‌ نظریه‌ تاکنون‌ مبنای‌ اندازه‌گیری‌ ویژگیهای‌ رفتاری‌ مورد استفاده‌ بسیاری‌ از متخصصان‌ آزمون‌ سازی‌ قرار گرفته‌ است‌. محدودیتهائی‌ که‌ اخیراً در این‌ نظریه‌ مشاهده‌ شد موجب‌ گردید تا نظریه‌ دیگری‌ توسط‌ روانسنجانی‌ چون‌ لردونویک‌ (1968)، همبلتون‌ و همکاران‌ (1993)، وانگهارد (1994) ارایه‌ گردد. نظریه‌ سؤال‌- پاسخ‌ تأثیر مهمی‌ در ساخت‌ آزمونهای‌ روانی‌ و تربیتی‌ داشته‌ است‌. بر پایه‌ مبانی‌ نظری‌، این‌ نظریه‌ نشان‌ داده‌ است‌ که‌ هم‌ در پاسخگوئی‌ به‌ سؤالات‌ آزمون‌ سازی‌ و هم‌ ارایه‌ راهکارهای‌ مناسب‌ بر نظریه‌ کلاسیک‌ آزمون‌ برتری‌ دارد. در این‌ مقاله‌ مفروضه‌های‌ دو نظریه‌ قدیم‌ و جدید و تفاوتهای‌ موجود در مدلهای‌ ریاضی‌ آنها ارایه‌ می‌شود. درباره‌ شاخصهائی‌ که‌ این‌ دو نظریه‌ برای‌ برآورد پارامترهای‌ سؤالهای‌ آزمونهای‌ روانی‌ و تربیتی‌ استفاده‌ می‌کنند بحث‌ خواهد شد. علاوه‌ بر این‌، مزایا و محدودیتهایی‌ که‌ هر یک‌ از دو نظریه‌ در ساخت‌ آزمونهای‌ روانی‌ و تربیتی‌ دارند بررسی‌ می‌شود. در پایان‌، به‌ تفاوتها و تشابهات‌ بین‌ دو نظریه‌ و شیوه‌هایی‌ که‌ آزمونها بر اساس‌ این‌ تفاوتها و تشابهات‌ ساخته‌ می‌شود اشاره‌ خواهد گردید.  

کلیدواژه‌ها

عنوان مقاله [English]

A Comparison of Concepts and Assumptions Underlying Classical and Item-Response Theories in Constructing Psychological and Educational Tests

نویسنده [English]

  • H. Sepasi

Faculty member, Faculty of Educational Sciences and Psychology, Shahid Chamran University of Ahvaz

چکیده [English]


In order to find a reasonable solution to measurement problems in education and psychology, new test theories have recently been proposed by test specialists. The purpose of this paper is to survey the theoretical concepts and assumptions underlying the two very popular psychological and educational test theories. The classical test theory (CTT) first proposed by Spearman, the English psychologist, in early twentieth century, also called today the old theory, is based originally on three basic concepts: observed score, true score and error score. Most of the studies conducted in the field of education and psychology have used CTT in order to interpret the reliability and validity of their research data. Due to the limitations that were found in old theory (CTT), a new test theory, the item response theory (IRT), has been proposed by modern test specialists. On the basis of the assumptions of IRT, many logical interpretations could be made in solving measurement problems in constructing educational and psychological tests. In this paper, attempts have also been made to compare the basic assumptions of these two theories. A further analysis is made to clarify the similarities and differences between item parameters used by these two test theories. In addition, advantages and limitations of each theory that test constructors believe should be considered in item writing are discussed. Finally, based on the findings of this paper, it is suggested that graduate students and faculty members who are interested in measurement and evaluation of student learning or in doing research in education or psychology, should he familiar with the basics of the old theory (1T) and the new one (IRT).

کلیدواژه‌ها [English]

  • Classical test theory
  • item response theory
  • psychological and educational tests
Algina, J. & Coulson, D.B. (1978). Criterion reference testing and Measurement: A Review of technical issues and development. Review of Educational Research, 4: 11-97.
Baker, F.B. (1985). The basic of item test theory, New Hamshire, Heinemann Eductional Books. New Hamshire.
Baker, F.B. (1992). Item response theory. New York: Marcel Dekker, Inc.
Crocker, L & Algina, J. (1986). Introduction to classical & modern test theory. New York, Hull Rinehart & Winston, Inc.
Douglass, F.M. & et al (1979). A comparison of classical & latent trait item analysis procodures. Educational & Psychological Measurement, 39: 337-60.
Engelhrard, G. (1984). Throndike, Thurston, and Rasch. A comparison of their methods of scaling psychological and educational tests. Applied Psyciwlogical Measurement, 8: 21 -38.
Engeihard, G. (1994). Historical views of the concept of invariance in measurement theory, in objective measurement, (ed.). Mark Wilson New Jersey, Ablex Publishing inc.
Gullikson, H. (1950). Theory of mental tests, New York, Wiley.
Hambelton, R.K. & Cook, L.L. (1977). Latent trait models and their use in analysis of evaluation test data. Journal of Educational Measurement, 14:
75-96.
Hambelton, R.K. & et al (1993). Fundamental of item response theory. C A:
New Bry Book Inc.
Hambelton, R.K. & ET AL (1989). Developments in latent theory: Review of Educational Research. 4: 407-5 10.
Hambelton, R.k. & Jones, R.W. (1993). Comparion of classical and item response theory and their application to test development. Educational Measurement. Issues and Practive, 12: 38-47.
Hashway, R.M. (1998). Assessment and evaluation of developmental learning Westport. Conneticet.
Lord, F.M. (1977). Practcal applications of item characteristic, curve theory Journal of Educational Measurement, 2: 117-139.
Lord, F.M. & Novick, M.R. (1988). Statistical theories of mental test scores, Massachuset, Addison Wesley.
Lord, F.M. (1952). A theory of mental test scores. Psychometric Monograph 7.
Lord, F.M. (1977). Practical application of test thoery. Journal of Educational Measurement, 14: 117-138.
Lord, F.M. (1980). Application of item response theory to practical testing problems. New Jersey: Hill side Inc.
Lawley, D.N. (1950). On problems connected with item selection and test construction. Proceding of Royal Society of Edinburgh, 61: 273-287.
Lazarfield, P.F. (1954). The factorical analysis of multiple item test. Proeedings of the Royal Society of Edinburgh, 62: 74-82.
Loyd, B.H. (1988). Implications of item resoonse theory for the measurement practitioner. Applied Measurement in Education, 2: 135-55.
Loevinger J. (1965). Person & population as psychometric concepts, Psychological Review, 72:143-55.
Hillman, J & Greene (1998). The specification and development of tests of achievement and ability in R.L. Linn (ed)3: 335-66 New York, Mac Millan Inc.
Michell, Joel (1994). The relevance of the classical theory of measurement of modern psychology. In objective measurement Mark Wilson (ed) New Jersey: Ablex Publisher.
Shavelson, R.J. (1991). Statistical reading for behavior sciences, Boston, Allgni & Bacon Tinsley, H.A. (1977). Test-free person measurement with the Rasch Model Applied Psychological Measurement, 4: 483-87.
Whitney, S.E. & Dawis, R.V. (1974). The nature of object wtih the Rasch Model. Journal of Educational Measurement, 2: 1633-77.
Weiss, J. & Davison, M.L. (1986). Test theory and methods, A.nnuual Review of Psychology, 32: 629-58.
Wilson, M. (1994). Objective measurement New Jersey, Ablex Publishing, Inc.
Wright, B. & Stone, M. (1979). Best test desgin. Chicago: MESA Press.
Wright, B.D. (1977). Solving measurement problems with the Rasch Model. Journal of Educational Measurement, 2:95- 116.
Zhu, W. (1998). Test equating: what, why, how? Research Quarterly for Exercise and Sport, 1: 11-23.