عنوان
تعداد صفحات:۷۴
نوع فایل : ورد و قابل ویرایش
استفاده از فرم های مختلف یک آزمون در زمان های مختلف، در ابتدا موجب تولید و توسعه فرم های موازی یا معادل گردید. هر چند در ساخت این آزمون ها سعی بر یکسانی محتوا و ویژگی های آماری سوال است، اما در عمل وجود تفاوت در برخی از ویژگیهای آماری اجتناب ناپذیر است به ویژه آن که قدری تفاوت در درجه دشواری فرم ها، در نتایج حاصل تاثیر به سزایی می تواند داشته باشد در این صورت داده های حاصل از فرم های مختلف تست قابل مقایسه نمی باشد و نتایج تأثیر نوع فرم قرار می گیرد. برای حل این مسئله، نظریه پردازان موضوع دیگری را با عنوان همتراز سازی یا معادل سازی ارائه نمودند.
همترازسازی[۱] یا معادل سازی نمرات آزمون فرایند یافتن نمراتی از دو یا چند آزمون مشابه است که در یک سطح از توانایی یا یک صفت خاص در یک جامعه از آزمودنی ها دلالت داشته باشد. دو آزمون یا دو فرم از یک آزمون که با یکدیگر همتراز شده اند می توانند با سطح اطمینان یکسانی برای اندازه گیری توانایی خاص مورد نظر به کار برده شود. در واقع همتراز سازی یک روش یا فرایند آماری است برای تعدیل کردن نمرات روی فرم های آزمون به طوری که نمرات روی فرم های مختلف را بتوان به صورت قابل تعویض مورد استفاده قرار داد. همتراز سازی اختلاف های درجه دشواری بین فرم هایی را تبدیل می کند که با هدف یکسان بودن از نظر محتوا و درجه دشواری ساخته شده اند. معادل سازی آزمون ها، نمرات حاصل از فرم های مختلف را به نمرات یکی از فرم ها یا یک فرم مرجع به گونه ای تبدیل می کند که گویی همه افراد به سوالات یک فرم پاسخ داده اند و نمرات همتراز شده تحت تاثیر تفاوت درجات دشواری فرم ها نخواهند بود. چون همتراز سازی یک روش علمی است نیازمند طرحی برای جمع آوری داده ها و قاعده ای برای تبدیل مقیاس نمرات یک فرم به مقیاس نمرات فرم دیگر است.
همتراز سازی در معنای دقیق آن تنها زمانی میسر است که همه فرم های مورد نظر به گونه ای یکسان شاخص دقیق یک نوع خصیصه ثابت باشند، به عبارت دیگر فرم های یک آزمون باید دارای اعتبار و یا ترجیحاً دارای یک خطای استاندارد اندازه گیری برای هر زوج از نمره های معادل بوده و همه آنها نیز با شاخصی از هر خصیصه معین دیگر همبستگی ثابتی داشته باشند، به طور کلی شرایط مذکور فقط زمانی حاصل می شوند که طول همه فرم ها یکسان بوده، بین میانگین و انحراف استاندارد آنها نیز تفاوت محسوسی وجود نداشته باشد.
در پاره ای از موارد تست هایی در سطوح مختلف سنی یا کلاسی اجرا می شود که از لحاظ سطح دشواری با یکدیگر تفاوت دارد، ولی دو گروه در یک تست رابط مشترک مورد آزمایش قرار خواهند گرفت. این تست رابط ممکن است مجموعه سوالهایی باشد که در تست های مورد همترازسازی گنجانیده شده و قسمتی از آنها را تشکیل می دهد، یا ممکن است مجموعه سئوالهایی کاملاً مجزا باشد که برای معرفی یک خصیصه مکنون ثابت انتخاب شده است. اما تعبیر و تفسیر نمره های خام آزمودنی هایی که در سطوح مختلف یک تست شرکت کرده اند، امکان پذیر نیست مگر آنکه نمره های سطوح مختلف تست همتراز گردد.
در صورتی می توان فرم های مختلف را همتراز کرد که آن فرم ها به طور کامل موازی باشند. اما اگر فرم ها کاملاً موازی باشند، آنگاه همتراز سازی معنی و ضرورتی ندارد. از نقطه نظر عملی هدف همترازسازی رسیدن به یک معادله تبدیلی، تابع و یا یک جدول است به گونه ای که تبدیل واحدها از یک تست به تست دیگر امکان پذیر باشد (بدون توجه به تست هایی که روی گروه ها اجرا شده است). هرگاه گروه ها در سطح و پراکندگی توانایی متفاوت باشند، باید مطمئن بود که تست رابط ، مینیاتوری از کل تست باشد. بسیاری از روا نسنج ها معتقدند همترازسازی نمره ها تنها جنبه نظری داشته و این تنها به دلیل آن است که ارتباط واقعی بین فرم های مختلف تست هیچ گاه در عمل شناخته شده نیست و علاوه بر این هیچ گاه داده های واقعی، فرض های مدل های مختلف همترازسازی را برآورده نمی کند زیرا؛
الف) حجم نمونه به ندرت به بزرگی مورد نظر است.
ب) طرح انتخابی اطلاعات مطلوب اغلب عملی نیست.
ج) دو فرم هیچ گاه به طور کامل موازی نیستند.
در نتیجه وقتی همتراز سازی نمره ها روی دو فرم یک تست صورت می گیرد، تعیین میزان شباهت فرم ها با توجه به حجم، دشواری و اعتبار فرم ها حائز اهمیت است. اگر برای همتراز سازی دو فرم تست از تست رابط استفاده شود، نشان دادن وسعت شباهت تست رابط با تست اصلی بسیار مهم است. به عبارت دیگر شباهت در توانایی و دشواری تست رابط و تست اصلی بسیار مهم است. وقتی گروه های امتحانی بسیار مشابه یکدیگر باشند و یا دقیقاً یکی باشند، نتایج همتراز سازی چندان تحت تأثیر طول تست نیست اما اگر گروههای امتحانی مشابه نباشند، طول تست رابط روی نتایج مهم است.
واژه های کلیدی: نظریه کلاسیک اندازه گیری، مدل های سوال- پاسخ (IRT)، نظریه صفت مکنون، همترازسازی تست، انواع روش های همترازسازی
چکیده ۶
مقدمه ۸
نظریه کلاسیک اندازه گیری ۱۲
محدودیت های نظریه کلاسیک ۱۴
۱- وابستگی پارامترهای سوال به نمونه آزمونی ۱۴
۲- وابستگی پارامتر توانایی افراد به نمونه سوالات آزمون ۱۴
۳- محدودیت دیگر تعریف فرض آزمون های موازی است ؛ ۱۴
۴- خطاهای تصادفی اندازه گیری ۱۵
۵- دیگر محدوده نظریه کلاسیک به شیوه طرح و ساختن تست بر می گردد، ۱۵
نظریه های جدید اندازه گیری ۱۶
مفروضه های اصلی مدل های سوال- پاسخ (IRT) 17
۱-تک بعدی بودن ۱۷
۲-استقلال موضعی (شرطی) ۱۷
نظریه صفت مکنون و ارتباط آن با IRT 18
انواع مدل براساس تعداد پارامتر ۲۱
۱- مدل منطقی تک پارامتری (مدل راش) ۲۱
۲- مدل منطقی دو پارامتری ۲۲
۳- مدل منطقی سه پارامتری ۲۳
۴- مدل منطقی چهار پارامتری ۲۳
همترازسازی تست ۲۷
ویژگی ها و پیش نیازهای همتراز سازی ۲۸
طرح های جمع آوری داده ها برای همترازسازی ۳۱
۱) طرح تک گروهی ۳۱
۲) طرح یک گروهی با موازنه ۳۲
۳) طرح گروه های تصادفی ۳۲
۴) طرح گروه های تصادفی با سوالات مشترک ۳۳
۵) طرح گروه های غیر همسان باسوالات مشترک ۳۳
انواع روش های همترازسازی (نمرات مشاهده شده) در مدل کلاسیک ۳۵
۱- همترازسازی میانگین ۳۵
۲- همترازسازی خطی ۳۶
۳) روش همترازسازی همصدک ۳۸
منابع خطا در همترازسازی ۴۲
۱) خطای تصادفی همتراز سازی ۴۲
۲) خطای نظام دار همتراز سازی ۴۲
هموارسازی (در همترازسازی هم صدک) ۴۳
روش های همترازسازی در نظریه سوال- پاسخ ۴۴
فرآیند معادل سازی و همترازسازی نمرات حقیقی ۴۸
همترازسازی نمرات مشاهده شده در IRT 49
ارزشیابی نتایج همترازسازی ۴۹
پایایی ۵۰
روش های برآورد پایایی ۵۱
۱) بازآزمایی ۵۱
۲) اجرای آزمون های همتا یا معادل ۵۱
۳) روش دو نیمه کردن آزمون ۵۱
عوامل موثر در پایایی تست ۵۳
اعتبار ۵۳
ارزیابی هوش ۵۵
هوش چیست؟ ۵۵
نظریه های هوش ۵۵
نظریه های کلاسیک ۵۶
۱-نظریه اسپیرمن ۵۶
۲- نظریۀ تواناییهای ذهنی اولیۀ ثرستون ۵۸
۳-نظریه گیلفورد ۶۰
الگوهای سلسله مراتبی ۶۱
۱-نظریه کتل درباره هوش متبلور وهوش سیال ۶۱
۲-نظریه ورنون ۶۲
۳-نظریه کارول ۶۳
نظریه های تحولی هوش ۶۴
ظریه رشد شناختی پیاژه ۶۵
پردازش اطلاعات و نظریه های بیولوژیک هوش ۶۶
۱-نظریه جنسن ۶۷
۲-نظریه استرنبرگ ۶۷
۳-نظریه هوش های چندگانه گاردنر ۶۸
۴-نظریه داس، ناگلیری و کربای ۶۸
رابطه آزمون ها و نظریه های هوش ۶۹
بحث و نتیجه گیری ۷۰
منابع ۷۲
شکوهی یکتا، محسن. (۱۳۸۵). مبانی نظری ارزیابی و کاربرد آزمون های روانی و تربیتی. تهران: تیمورزاده طبیب.
لطف آبادی، حسین . (۱۳۷۵) . سنجش و اندازه گیری در علوم تربیتی و روان شناسی (روان سنجی سنتی و رویکردهای جدید در سنجش روانی- تربیتی). تهران: سمت.
هومن، حیدر علی (۱۳۸۰). اندازه گیری های روانی و تربیتی و فن تهیه تست. تهران: نشر پارسا
افروز، غلامعی و هومن، حیدر علی . (۱۳۷۵) روش تهیه آزمون هوش (T.8.B) . تهران: انتشارات دانشگاه تهران
سرایی ، حسن. (۱۳۷۲) مقدمه ای بر نمونه گیری در تحقیق. تهران: سمت
امبرتسون، سوزان، ایی. راین، استیون پی (۱۳۸۸). نظریه های جدید روانسنجی (IRT) برای روانسنجان (ترجمه شریفی، حسن پاشا و همکاران) تهران: انتشارات رشد.
ثرندایک ، رابرت ال (۱۳۷۵) روانسنجی کاربردی (ترجمه حیدر علی هومن) تهران: انتشارات دانشگاه تهران (تاریخ انتشار به زبان اصلی ۱۹۸۲).
بهرامی، هادی. (۱۳۷۷) آزمون های روانی: مبانی نظری و فنون کاربردی . تهران : دانشگاه علامه طباطبایی
کوپر، کالین. (۱۳۷۹). تفاوت های فردی(نظریه و سنجش) (ترجمه شریفی، حسن پاشا و همکاران)
آلن، مری جی، ویدنی ام (۱۳۷۵) مقدمه ای بر نظریه های اندازه گیری (ترجمه علی دلاور) تهران: سمت
سلیمی جهرمی، محمد حسین . (۱۳۷۷) بررسی روش های همتراز سازی آزمون ها در نظریه کلاسیک و IRT و کاربرد آن در همترازسازی آزمونهای ورودی دانشگاه های کشور. پایان نامه کارشناسی ارشد چاپ نشده. دانشگاه علامه طباطبایی.
سیف، علی اکبر (۱۳۸۵). سنجش، اندازه گیری و ارزشیابی. تهران نشر دوران
شریفی، حسن پاشا (۱۳۵۷) سنجش و اندازه گیری درآموزش و پرورش. اصفهان: انتشارات وزارت آموزش و پرورش
شریفی، حسن پاشا (۱۳۸۴). اصول روانسنجی و روان آزمایی. تهران: انتشارات رشد
اکبری و رموزیار، شیرین . (۱۳۷۸) . مقاله ویژگی های دو فرم موازی آزمون هوش کتل بر اساس نظریه های قدیم و جدید اندازه گیری. چاپ نشده. پایان نامه دانشکده روانشناسی و علوم تربیتی دانشگاه علامه طباطبایی
دلاور، علی (۱۳۸۸). احتمالات و آمار کاربردی در روانشناسی و علوم تربیتی، تهران: انتشارات رشد
هنگام پیدایش روانشناسی در نیمه دوم قرن ۱۹ دو جریان علمی متمایز از یکدیگر تکوین یافت . اولی منجر به پیدایش روانشناسی تجربی و بعدی منجر به پیدایش روانسنجی شد. روانشناسی تجربی در پی کشف قوانین کلی رفتار بود و بنابراین از تحقق در زمینه تفاوتهای فردی اجتناب میکرد . روانسنجی برعکس به اندازهگیری تفاوتهای فردی میپرداخت و سعی مینمود تا کیفیات روانی را به کمیتهای عددی و عینی تبدیل کند. چنین نگرشی لااقل دو حسن داشت:
۱) به روانسنجها اجازه میداد تا ابعاد مختلف تواناییهای روانی هر فرد را جداگانه اندازهگیری کنند و دریابند که آنان در کدام بعد قوی و در کدام بعد ضعیف هستند .
۲) هر فرد را با گروهی که متعلق به آن است مقایسه کنند و موقعیت وی را در بین سایر افراد گروه مشخص کنند .
نگرش دوم منجر به ابداع تستها و آزمونهای روانی شد . بنابراین کار روانسنجها یعنی سنجش و اندازهگیری در تعلیم و تربیت را میتوان به عنوان وسیلهای برای گردآوری یک رشته اطلاعات منظم دربارهی ویژگیهای رفتار آدمی و تجزیه و تحلیل این اطلاعات را به عنوان پایه و اساس یک رشته تصمیم گیریهای خاص تعریف کرد . بدون تردید هر اندازه این اطلاعات گردآوری شده ، منظمتر ، مناسبتر و دقیقتر باشد ، آسانتر و بهتر میتوان به تصمیمهای منطقی در مورد فرد دست یافت .
نتایج این اندازه گیریها در تصمیم گیری درباره افراد کاربرد گستردهای دارد که میتوان آن را در دو سطح عمدهی سازمانی ( مانند جایگزینی در مدارس ، پذیرش دانشگاه یا انتخاب شغل) و فردی ( درک نظر فرد دربارهی خود و دیگران) طبقه بندی کرد ( هومن ، ۱۳۸۱).
امروزه تستها و سایر ابزارهای اندازهگیری یک از ضروریات جامعه بشری است و نقش مهمی در زندگی انسانها بازی میکند . به علت کثرت تعداد کسانی که از آزمونها استفاده میکنند ، ساخت و کاربرد آن در تمام حیطه های زندگی توسعه یافته است ، بنابراین درک این که نمره آنها چگونه بدست میآید و دربردارنده چه نوع اطلاعاتی است ، اهمیت فراوانی دارد . برای پاسخ به این پرسشها ، علم تهیه تست و ابزار اندازهگیری که روانسنجی نامیده میشود توسعه یافته و نظریات و تئوریهای خاصی در آن پدیدار گشته است . برای تدوین آزمونهای روانی اساساً دو رویکرد وجود دارد . یکی از آنها نظریه کلاسیک آزمون است که در سال ۱۹۰۴ توسط اسپیرمن معرفی گردیده و سالهاست مورد استفاده روانسنجان قرار گرفته است . این نظریه یک الگوی ساده و قوی را به کار میبرد. در اینجا نمرهها به عنوان برآوردی از توانایی تلقی میشود ، این نظریه بر اساس مدل نمره حقیقی و خطا درباره نمره تست بنا شده است و سه مفهوم اصلی ، نمره مشاهده شده ، نمره حقیقی و نمره خطا [۱] را معرفی میکند . در این تئوری مدل های مختلفی فرمول- بندی شدهاند. در واقع مدل کلاسیک اندازهگیری یک مدل خطی ساده است که در آن نمره مشاهده شده برابر است با مجموع نمرههای خطا و حقیقی این مدل دارای مفروضاتی است که اکثر آنها از نظر روانسنج ها با مشکل مواجه است ، بنابراین متخصصان علم روانسنجی به این نتیجه رسیدهاند که نظریه کلاسیک دیگر قادر به حل مسائل و مشکلاتی که برسر راه ساختن تستها و مقیاسها وجود دارد نیست . مثلا این نظریه تصویر روشنی دربارهی ارتباط بین سئوالهای تست و خصیصه یا توانایی آزمودنی که به وسیله این سوال ها اندازهگیری میشود فراهم نمیآورد . اما در نظریه سئوال – پاسخ (IRT) فرض بر این است که بین توانایی آزمودنی و عملکرد مادههای آزمون یک رابطه قوی وجود دارد ، و میتوان تواناییهای آزمودنی ها را از سطح دشواری مادهها تفکیک کرد ( کالین کوپر ، ۱۹۹۷، ترجمه شریفی، ۱۳۷۷).
از این رو برای تحلیل نظری ماهیت تست و نیز رابطه بین نمره تست و جایگاه آزمودنی در خصیصه زیربنایی مورد سنجش تلاشهای بسیاری به عمل آمد . هدف عمده متخصصان آن بود که کارکرد فرد را بر حسب نوعی مقیاس مشترک توانایی بیان کنند تا پایهای برای مقایسه مجموعههای مختلفی از نمرهها در تستها ی مختلف بدست آید ومهم تر آن که به آزمودنیها متناسب با توانایی و شایستگی آنها و بدون توجه به ابزاری که برای سنجش آن توانایی به کار میرود، امتیاز داده شود .
نتیجه تلاشهای گسترده نظری و تجربی روانسنج ها ، توسعه دو تئوری جدید در اندازهگیری روانی تربیتی یعنی تئوری صفت مکنون و سنجش انطباقی است که در طول چند سال همه کارهایی را که در بارهی تهیه تست و زمینههای روانسنجی وابسته به آن انجام شده بود تحت الشعاع قرار داده است .
اصطلاح نظریه صفت مکنون شامل خانوادهای از مدل های ریاضی است که روابط تابعی بین متغیرهای مشاهده پذیر و سازههای صفات فرضی زیربنای این متغیرها را نمایش میدهد ، و هنگامی که این نظریه دربارهی تستهای توانایی یا پیشرفت به کار رود ، نظریه سوال – پاسخ نامیده میشود . در این تئوری هم نقش سوال تستی و هم پاسخهای آزمودنیها مورد بررسی قرار میگیرد .
مدل ساده و مفیدی برای اندازه گیری است. که در سال ۱۹۰۴ توس چارلز اسپیرمن[۱] ، روان شناس انگلیسی مطرح گردید و براساس نمره حقیقی و خطا درباره نمره تست بنا شده است که برای مدت زمان طولانی توسط متخصصان اندازه گیری و به خوبی به کار می رفت، فهم خود مدل ساده است و می تواند بصورت مفیدی جهت اجرای آزمون استعداد و پیشرفت به کار برده شود. پس از بوجود آمدن این مدل توانسته خدمات ارزنده ای را به کاربران ارائه دهد و بیشتر شیوه های هنجاریابی، ساخت و ارزشیابی و تفسیر آزمونها بر پایه این نظریه قرار دارند و نتایج بسیاری از آن حاصل شده است از جمله فرمول اسپیرمن براون، فرمول خطای استاندارد اندازه گیری و کودر ریچاردسون ۲۰(همبلتون، ۱۹۹۱).
نظریه ای که از آن به عنوان نظریه کلاسیک اندازه گیری یاد می شود می تواند نحوه تأثیر خطاهای اندازه گیری را بر نمرات مشاهده شده توصیف کرد. این نظریه بر مبنای مفروضاتی بنا شده است که عبارتند از :
۱- هر نموره مشاهده شده در یک آزمون از مجموع نمره واقعی یا حقیقی (T) و نمره خطا با اندازه گیری (E) تشکیل شده است. X=T+E
۲- میانگین نمرات مشاهده شده یک آزمون برابر است با نمره واقعی آزمودنی . یعنی اگر یک آزمودنی را به دفعات زیادی امتحان دهد، میانگین نمرات او برابر با نمره واقعی است.
E(X)=T
۳- نمره خطای یک آزمون با نمره واقعی همان آزمون در جامعه ای از آزمونها ناهمبسته است.
۴- نمران خطای آزمونهای مختلف با هم همبستگی ندارند. بدین معنی که نمره فردی در آزمون اول مثبت باشد ، نمی توان پیش بینی کرد که نمره خطای او در آزمون بعدی مثبت یا منفی باشد.
۵- نمرات خطای یک آزمون (E1) با نمره های واقعی آزمون دیگر ناهمبسته است.
۶- چنانچه نمره های مشاهده شده دو آزمون X و X1 مفروضات ۱ تا ۵ را دارا باشند و اگر برای هر یک از آزمودنی های T=T و باشد آزمون ها با یکدیگر موازی هستند. بنابراین در این نظریه آزمون های موازی هستند که نمرات حقیقی و واریانس یکسانی دارند.
۷- چنانچه نمرات مشاهده شده دو آزمون X و Y و مفروضات ۱ تا ۵ را دارا باشند و برای هر یک از آزمودنی های جامعه TX=TY+C باشند. (C مقدار ثابتی است). آزمون ها اساساً معادل تاو هستند. یعنی تفاوت بین نمره های حقیقی آنها در یک مقدار ثابت اضافی است. به عبارت دیگر آزمون هایی که اساساً معادل تاو هستند جز در مورد یک مقدار اضافی ثابت دارای نمره های واقعی برابرند. این آزمون ها می توانند واریانس های خطای نامساوی داشته باشند (آلن وین، ۱۹۷۹ترجمه دلاور).
[۱] – Spearman
[۱] -true-score-and-error
[۱] – equating
جهت دریافت و خرید متن کامل مقاله و تحقیق و پایان نامه مربوطه بر روی گزینه خرید انتهای هر تحقیق و پروژه کلیک نمائید و پس از وارد نمودن مشخصات خود به درگاه بانک متصل شده که از طریق کلیه کارت های عضو شتاب قادر به پرداخت می باشید و بلافاصله بعد از پرداخت آنلاین به صورت خودکار لینک دنلود مقاله و پایان نامه مربوطه فعال گردیده که قادر به دنلود فایل کامل آن می باشد .
ارسال نظر