مطالعات انجام شده درباره موضوع پژوهش
جهت ایمنی تست ها هر ساله فرم های جدیدی از آزمون زبان انگلیسی تافل[۱۲۴] به وجود می آید، این تست ها باید نمراتی به دست دهد که بتوان به صورت مبادله ای از آن استفاده کرد. برای این کار از همترازسازی استفاده می شود، این عمل تا قبل از سال ۱۹۷۸ از همترازسازی در مدل کلاسیک به دست می آمد ولی از آن به بعد از همترازسازی در مدل IRT استفاده می شود. تحقیقی با عنوان کاربرد IRT در مقیاس پردازی و همترازسازی تست تافل “صورت گرفته است که در آن مقیاس پردازی و سوال ها و نتایج همترازسازی تست متکی بر مدل های ۱ و ۲ پارامتری با نتایج متکی بر مدل ۳ پارامتری مقایسه شده است که نشان می دهد مدل ۳ پارامتری نسبت به ۱ و ۲ پارامتری بهتر است و مدل ۲ پارامتری از ۱ پارامتری بهتر است. همچنین نتایج تحقیق برای مدل ۳ پارامتری دلالت بر این دارد که همبستگی بین پارامترهای برآورد شده سوال ها متأثر از حجم نمونه است و کیفیت مدل برازندگی داده ها و کیفیت همتراز سازی برآورد شده به اندازه نمونه حساس نیست.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
در همترازسازی دو تست هوش و استعداد تحصیلی سنین ۱۱ و ۱۲ ساله با مدل IRT که توسط عبدالرضا حشمتی در سال ۱۳۷۹ (جهت اخذ مدرک کارشناسی ارشد روان سنجی) انجام شد، نتایج زیر بدست آمد:
دو تست هوش و استعداد تحصیلی از اعتبار کافی برخوردار بودند و همتراز سازی این دو تست روی ۱۱ و ۱۲ ساله ها، با توجه به همبستگی های بدست آمده امکان پذیر بوده اند. از نتایج تحقیق مشخص شد آزمودنی های با نمره خام یکسان لزوماً توانایی یکسانی ندارند، همچنین برتری مدل ۳ پارامتری IRT بر مدل های ۱ و ۲ پارامتری IRT نیز ثابت شده است.
در کاربرد IRT در همترازسازی دو تست عزت نفس کوپر اسمیت و آیزنک که توسط احد نجفی (۱۳۷۶) انجام شد، پایایی به دست آمده برای تست های مذکور، بالا بوده است و تست رابطه نیز از اعتبار کافی جهت همترازسازی برخوردار بوده است. همچنین پارامترهای c,b,a و توانایی برآورده شده و سپس معادله خطی برای همترازسازی نمرات بر اساس شیب خط و عرض از مبداء بدست آمده است.
در سال ۱۳۸۰ نیز خانم مریم واشقانی فراهانی بر روی موضوع کاربرد روش همترازسازی همصدک در معادل سازی نمرات آزمون های ورودی دانشگاه ها (کنکور سال ۱۳۷۸) کار کرده است، در این پژوهش روش های همترازسازی همصدک زمانی که گروه ها نابرابرند بررسی شده است که در آن از آزمون هایی که دارای سوالات مشترک هستند استفاده شده است و با بهره گرفتن از برآوردهای مربوط به آن سوال عمل همترازسازی انجام شده است.
هم چنین در مقایسه ویژگی های دو فرم موازی آزمون های هوشی کتل بر اساس نظریه های قدیم و جدید اندازه گیری که در سال ۱۳۷۸ توسط خانم شیرین اکبری انجام شد، برای بررسی موازی بودن دو فرم A و Bمقیاس ۲ تست هوشی کتل از روش های آماری t وابسته، تحلیل واریانس دو راهه و قاعده گالیکسن استفاده شده است، نتایج تحقیق نشان دادند که بین میانگین ها، واریانس ها و ضرایب دشواری و تمیز دو فرم بر اساس نظریه کلاسیک آزمون، تفاوت معنا دار وجود ندارد. همچنین بین پارامترهای توانایی افراد، پارامترهای سوال، مقدارآگاهی آزمون و خطای استاندارد برآورد توانایی بر اساس نظریه سوال – پاسخ معنادار نبود. بر این اساس می توان به دو فرم آزمون هوشی کتل، مقیاس ۲ ، در نظریه کلاسیک، موازی و در نظریه سوال- پاسخ، به عنوان موازی ضعیف توجه نمود.
فاطمه شاطریان محمدی در پایان نامه ای به مقایسه سه روش همترازسازی همصدک هموار نشده ، نمرۀ مشاهده شده IRT و نمره حقیقی IRT در طرح گروه های نامعادل با سوالات لنگر پرداخته است . نتایج نشان داد که دو روش همترازسازی IRT با هم تفاوت بسیار اندکی داشته و از نتایج پایا تری نسبت به روش همصدک هموار نشده برخوردار بودند . از طرف دیگر مقایسه خطای استانداردهمترازسازی سه روش نیز نشان داد که دو روش همترازسازی IRT از میزان خطای کمتری ( نه خیلی متفاوت ) نسبت به روش همصدک هموار نشده برخوردارند .
پژوهش های خارج از کشور
درسال ۲۰۰۰ بکین طی رسالۀ دکتری خود به مقایسه روش های مختلف همترازسازی در تئوری سوال- پاسخ پرداخت . پس از مقایسه همترازسازی با بهره گرفتن از مدل راش ، با همترازسازی با بهره گرفتن از مدل سه پارامتریک لجستیک به این نتیجه رسید که این مدل نتایج همترازسازی مشابهی را تولید میکنند .نتایج همترازسازی حاصل از این شیوه با نتایج همترازسازی تحت مدل سه پارامتری مقایسه شد . در اینجا هیچ تفاوت نظام داری بین دو شیوه مشاهده نشد . در پژوهش حاضر نیز شاخصهای تفاوت کمترین میزان تفاوت را بین دو روش IRT گزارش دادند
جامعه آماری
بنابر نظر اغلب محققان ، جامعه عبارت است از همه اعضای واقعی با فرضی که علاقمند هستیم یافته های پژوهش را به آنها تعمیم دهیم (دلاور ، ۱۳۷۴). به منظور کسب اطلاعات دقیق در مورد یک جامعه بررسی یکایک عناصر جامعه مطلوب به نظر میرسد . معمولاً این کار غیر ممکن یا غیر عملی است . بنابراین، تنها میتوان نمونهای از آن جامعه را مشاهده کرد (کنوور ، ترجمه پرست ، ۱۳۷۲)
جامعه مورد مطالعه این پژوهش شامل دانش آموزان پسر پیش دانشگاهی شهر سقز هستند که در سال تحصیلی ۸۹-۱۳۸۸ در مدارس دولتی به تحصیل اشتغال دارند.
نمونه و روش نمونه گیری
روش نمونه گیری در این پژوهش با توجه به ماهیت آن روش تصادفی خوشه ای میباشد و حجم مورد نظر با توجه به ماهیت پژوهش در نظر گرفته میشود که در این پژوهش ۲۰۰نفر به عنوان نمونه انتخاب شدند . بیشتر آگاهی ما در باره دنیای که در آن زندگی میکنیم از نمونه نتیجه شدهاند . در اغلب موارد نظراتی که از نمونه بدست میآوریم دقیق نیست ، ولی در بیشتر موارد نظر ما خیلی دقیق تر از موقعیتی است که نمونهای مشاهده نکردهاید و معمولاً هر قدر نمونه بزرگتر باشد نظریه ما دقیق تر است (کنوور ، ترجمه پرست ، ۱۳۷۲).
در این پژوهش ابتدا آمار جامعه از اداره آموزش و پرورش شهر سقز دریافت شد و براساس آمار دریافتی تعداد دانش آموزان پسر پیش دانشگاهی شهر سقز ۹۵۴ نفر بودند وبه علت جلوگیری از ورود به مدارس پیش دانشگاهی دخترانه فقط جنس پسر انتخاب شدند. که کل این تعداد در پیش دانشگاهی شهید باهنر در دو شیفت صبح و بعداز ظهر مشغول به تحصیل بودند.
بر همین اساس حجم نمونه از کل جامعه مورد نظر ۶ کلاس پیش دانشگاهی به میزان۲۰۰ نفر به عنوان نمونه انتخاب شدند.
با توجه به اینکه باید همه دانش آموزان به هر دو مقیاس هوشی کتل (فرم A و فرم B ) پاسخ میدادند دانش آموزانی که حتی به یکی از دو تست هم پاسخ نداده بودند از نمونه حذف شدند و همچنین افرادی که رونویسی کرده یا غایب بودند از نمونه حذف شدند و در آخر کل آزمودنی هایی که برای انجام پژوهش در نظر گرفته شدند ۱۸۰ نفر مشخص گردید.
روش پژوهش
این مطالعه از نظر نوع روش تحقیق یک مطالعه توصیفی – تحلیلی است که به منظور شناخت و آشنایی بیشتر با روش های گوناگون همترازسازی نمرات آزمون ها به روش همصدک، شرایط مفروضات هر یک از آنها و همچنین تطبیق شرایط عملی با شرایط نظری و در نتیجه انتخاب روشی مناسب براساس شرایط پژوهش انجام گردیده است.
ابزار پژوهش
ابزار مورد استفاده در این پژوهش عبارت است از:
فرم A و فرم B آزمون هوش کتل که یک آزمون هوشی غیرکلامی است و هرکدام از فرم ها شامل ۴ خرده آزمون به صورت زیر است.
الف: خرده آزمون سری تصاویر[۱۲۵]
این خرده آزمون تقریباً مانند آزمون ماتریس هاست. در هر سوال یک سری از تصاویر که براساس منطق خاصی پشت سر هم تنظیم شده اند به آزمودنی ارائه میشود. آزمودنی باید رابطه بین تصاویر را کشف کند و تصویر آخری را که جای آن خالی است از میان پاسخ های پیشنهادی انتخاب کند. آزمودنی باید ابتدا قاعده را کشف کند و آن را برای یافتن پاسخهای درست سوال های بعدی به کار ببندد. این خرده آزمون ۱۳ سوال دارد و زمان لازم برای پاسخ دادن به سوال های آن ۳ دقیقه است.
ب: طبقه بندی[۱۲۶]
در هر یک از پرسشهای این خرده آزمون ۵ تصویر نشان داده شده است که دو تا از آنها نسبت به بقیه تصاویر ناجور است؛ آزمودنی باید تصویری را که نسبت به بقیه تصاویر ناجور است و با آنها در یک طبقه قرار نمیگیرد، انتخاب کند. این خرده آزمون ۱۴ سوال دارد و زمان لازم برای اجرای آن ۴ دقیقه است.
پ: ماتریس ها[۱۲۷]
پرسشهای مطرح شده در این خرده آزمون مانند ماتریسهای آزمون ریون است. این خرده آزمون ۱۳ سوال دارد و زمان لازم برای پاسخ دادن به سوال های آن ۳ دقیقه است.
ت: وضعیت توپولوژیکی (مکان شناختی)[۱۲۸]
این خرده آزمون نوع خاصی از سوال ها را شامل می شود که بیشتر توسط کتل به کار رفته است. هر یک از پرسشهای این خرده آزمون از شش تصویر تشکیل شده است که هر یک شامل اشکال دایره، مربع یا دیگر اشکال هندسی با روابط مکانی مختلف است. در تصویر اول نقطه ای گذاشته شده است؛ که نسبت به دو یا سه شکل این الگو رابطه مکانی خاصی دارد. برای مثال نقطه در داخل دایره و در خارج مرجع جای دارد. آزمودنی باید از بین پنج شکل دیگر شکلی را نشان دهد که در آن نیز میتوانیم نقطه ای گذاشت که وضعیت توپولوژیکی آن با اشکال هندسی موجود در تصویر مانند تصویر اول باشد. در مجموع هر یک از فرم هایA و B مقیاس ۳ آزمون هوشی کتل دارای ۵۰ سوال است ، که به صورت گروهی و با محدودیت زمان اجرا میشود و آزمودنی از بین ۵ گزینه و۶ گزینه موجود در هر سال باید پاسخ صحیح را پیدا کرده و علامت بزند. شیوه نمرهگذاری برای این تست ها به این دلیل که مدل سه پارامتری IRT برای تجزیه و تحلیل استفاده شده است وبدین صورت است برای سوالاتی که آزمودنی پاسخی به سوال نداده است عدد صفر و برای سئوالاتی که دانشآموز هر کدام از گزینه های ۱ تا ۶ موجود در سوالات تست را انتخاب کرده بود همان شماره گزینه ۱، ۲، ۳، ۴، ۵ و۶ در نظر گرفته شد سپس با بهره گرفتن از کلید مربوط ، کارکرد در هر سئوال برای افراد مشخص گردید . به دلیل اینکه در IRT بایستی افرادی که نمره صفر و یا نمره ماکزیمم را کسب کردهاند از نمونه حذف شوند ، چنانچه فردی به تمام سئوالات پاسخ صحیح داده بود یا اینکه به هیچ یک از سوالات پاسخ صحیح نداده بود از نمونه حذف شد .
آزمون هوشی کتل یک آزمون نابسته به فرهنگ است که عامل G را اندازه می گیردیا به عبارت دیگر با هوش سیال درگیر است و این آزمون یک عامل را می سنجد. ویژگیهای روانسنجی مقیاس ۳ آزمون هوشی کتل نشان میدهد که در برآورد اعتبار این آزمون به روش بازآزمایی و فر م های همتا به ترتیب ضرایب ۷۰/۰ و ۷۷/۰ به دست آمده است و نتایج اعتبار به روش تصنیفی و همسانی درونی به ترتیب ۸۴/۰ و ۷۸/۰ به دست آمده است و در زمینه همبستگی نمرات آزمون هوشی کتل با سایر آزمون های هوشی نتایج تحقیقات ، همبستگی بالایی را نشان می دهد . و نتیجه کلی حاکی از آن است که آزمون هوشی کتل از اعتبار و پایایی کافی برای استفاده در ایران برخوردار است( جوکار ، ۱۳۷۲).
همچنین برخی از پژوهش ها همبستگی بین آزمون هوشی کتل و پیشرفت تحصیلی را ۳۱/۰ تا ۵۰/۰ و همبستگی بین این آزمون با سایر آزمون های هوشی از جمله وکسلر و استنفورد بینه را ۵۰/۰ تا ۸۹/۰ گزارش کرده اند . این همبستگی ها نشان می دهد که این آزمون ها عوامل مشترکی را می سنجد . بنابراین به نظر می رسد که این آزمون عامل g را اندازه گیری می کند . ( شکوهی یکتا ، ۱۳۸۵).
همچنین عملکرد آزمودنی های طبقات پایین فرهنگی – اجتماعی در آزمون وابسته به فرهنگ کتل ، بالاتر از عملکرد آنها در آزمون های کلامی است که از عامل فرهنگ تاثیر میپذیرند ولی توانایی پیش بینی تحصیلی و شغلی آزمون هوشی کتل از آزمون های کلامی کمتر است ( شریفی ، ۱۳۸۳).
پایایی[۱۲۹] و ا[۱۳۰]عتبار
در ارتباط با روش همسانی درونی دامنه ای از۷۷/۰ تا ۸۱/۰ برای فرم A و ۷۱/۰ تا ۷۹/۰ برای فرم B و با روش بازآزمایی (با اجرای بلافاصله) دامنه ای از ۵۸/۰ تا ۸۳/۰ گزارش شده است. علاوه بر این ضریب پایایی آزمون با بهره گرفتن از روش فرم های موازی دامنه ای از ۵۸/۰ تا ۷۲/۰ بوده است (سالویا[۱۳۱] و یسلداک[۱۳۲]، ۱۹۹۱).
ویژگیهای روانسنجی مقیاس ۳ آزمون هوش کتل نشان می دهد که در برآورد اعتبار این آزمون به روش بازآزمایی و فرم های همتا به ترتیب ضرایب ۷۰/۰ و ۷۷/۰ بدست آمده است و نتایج اعتبار به روش تصنیفی و همسانی درونی به ترتیب ۸۴/۰ و ۷۸/۰ به دست آمده است و در زمینه همبستگی نمرات آزمون هوش کتل با سایر آزمون های هوش نتایج تحقیقات، همبستگی بالایی را نشان می دهد. و در نتیجه کلی حاکی از آن است که آزمون هوش کتل از پایایی و اعتبار کافی برای استفاده در ایران برخوردار است.
همچنین برخی از پژوهش ها همبستگی بین آزمون هوشی کتل و پیشرفت تحصیلی را ۳۰/۰ و ۵۰/۰ و همبستگی بین این آزمون با سایر آزمون های هوش از جلمه وکسلر و استفوردبینه را ۵۰/۰ تا ۸۹/۰ گزارش کرده اند. این همبستگی ها نشان می دهد که این آزمون ها عوامل مشترک را میسنجند. بنابراین به نظر میرسد که این آزمون عامل (g) را اندازه گیری می کند (شکوهی یکتا، ۱۳۸۵).
همچنین عملکرد آزمودنی های طبقاتی پایین فرهنگی – اجتماعی در آزمون وابسته به فرهنگ کتل، بالاتر از عملکرد آنها در آزمون های کلامی است که از عامل فرهنگ تاثیر میپذیرد ولی توانایی پیش بینی تحصیلی و شغل آزمون هوشی کتل از آزمون های کلامی کمتر است (شریفی، ۱۳۸۳).
در مجموع هر یک از فرم های A و B مقایس ۳ آزمون هوش کتل دارای ۵۰ سوال است که به صورت گروهی و با محدودیت زمانی اجرا میشود و آزمودنی از بین ۵ گزینه موجود درهر سوال باید پاسخ صحیح را پیدا کرده و علامت بزند. شیوه نمره گذاری برای این سوال تست ها به این دلیل که مدل سه پارامتر IRT برای تجزیه و تحلیل استفاده شده است و بخاطر اینکه بتوانیم عامل حدس و گمان (Cg) را برای تمام سوالات در نظر بگیریم بدین صورت است که برای سوالاتی که آزمودنی پاسخ غلط به سوال داده عدد صفر و برای سوالاتی که گزینه درست را انتخاب کرده است عدد یک در نظر گرفته شده بدین ترتیب cg برای سوالات بسته به تعداد گزینه ها می باشد. سپس با بهره گرفتن از کلید مربوط، کارکرد در هر سوال برای افراد مشخص گردید. چنانچه فردی فقط به یک فرم از فرم های A و B پاسخ داده و یا به هیچ یک از سوالات پاسخ صحیح نداده باشد از نمونه حذف شد.
روش جمع آوری داده ها
شیوه اجرای آزمون: آزمون پس از معرفی و انجام اعمال مقدماتی ومعمولی به منظور مأنوس کردن آزمودنی ها با شرایط آزمایش، طرز پاسخ دادن به سوالات نمونه درهر یک از خرده آزمون ها را برای آزمودنی ها مطابق دستورالعمل توضیح داده و در این مورد آموزش لازم به آنها داده میشد. طرح مورد استفاده در این پژوهش طرح تک گروهی است و برای اجرای آزمون از آن استفاده شد . در این طرح دو فرم Aو B بر روی گروه واحدی از پاسخگویان اجرا شد . گروه نمونه به طور تصادفی به دو گروه الف و ب تقسیم شدند و هریک از دو فرم A و B بر روی گروه مجزایی از پاسخگویان اجرا شد . ابتدا فرم A بر روی گروه الف و فرم B بر روی گروه ب و سپس برعکس آن اجرا شد . فرض شد که این گروه ها به طور تصادفی انتخاب و معادل شده اند . .بعد از پایان اجرا و جمع آوری داده ها، پاسخنامه ها طبق کلید پاسخنامه آزمون تصحیح شدند.
لازم به ذکر است که این آزمون با محدودیت زمانی و به صورت یک آزمون سرعت مطابق با دستورالعمل اجرا شده است.
روش تجزیه و تحلیل داده ها
در این پژوهش برای تجزیه و تحلیل داده ها از نرم افزار SPSS،EXCELو BILOG- MG استفاده شده است. با بکارگیری برنامه SPSS برای بررسی اعتبار و پایایی ضریب آلفای کروبناخ و برای نشان دادن اینکه بین میانگین و انحراف استاندارد اختلافی وجود ندارد، از آزمون T گروه های وابسته استفاده میشود. سپس بااستفاده ازBILOG ، براساس مدل سه پارامتری و روش بیشینه احتمال و همچنین با دشواری، شیب و حدس هر سوال و توانایی آزمودنی ها برآورد گردید.
به طور خلاصه تجزیه و تحلیل داده های پژوهش حاضر به ترتیب زیر انجام گرفته است.
- اجرای آزمون T وابسته برای بررسی تفاوت بین میانگین تست
- استفاده از روش های همترازسازی کلاسیک ( میانگین ، خطی و همصدک) و همترازسازی IRT
(نمره مشاهده شده و نمره واقعی)
- محاسبه همبستگی پیرسون بین دو فرم A و B
- برآورد ضریب پایایی از طریق محاسبه ضریب آلفای کرونباخ
- برآورد پارامترهای سوال و توانایی افراد با بهره گرفتن از BILOG -MG
- برآورد پارامترهای هر سوال و توانایی افراد در فرم B براساس پارامترها و توانایی افراد در فرم A با بهره گرفتن از برنامه-MG BILOG
مقدمه
در این فصل داده های حاصل از همترازسازی نمرات فرم A و B آزمون کتل (مقیاس ۳) در دانش آموزان پیش دانشگاهی شهر سقز با بهره گرفتن از مدل کلاسیک و IRT مورد تجزیه و تحلیل قرار گرفته است . لازم به ذکر است که تمامی مراحل تجزیه و تحلیل داده ها ، توصیف و تفصیر استنباطی آن ها با بهره گرفتن از نرم افزارهای SPSS و BILOG-MG انجام گرفته است . ابتدا فراوانی و ویژگی های توصیفی جامعه آماری در دو فرم A و B به دست آمده است . در مرحلۀ بعد برای تجزیه و تحلیل داده ها و پاسخ به سه سوال پژوهشی در نرم افزار SPSS با بهره گرفتن از آزمون های ضریب همبستگی پیرسون ، آلفای کرونباخ ، آزمون T وابسته ، آزمون تحلیل واریانس استفاده شده است در مدل کلاسیک از همتراز سازی میانگین و همصدک استفاده وبا هم مقایسه شده اند و در IRT در نهایت برای پاسخ به سوال چهارم در نرم افزار BILOG-MG پارامترهای ضریب دشواری ، ضریب تشخیص ، حدس و گمان و توانایی آزمودنی ها محاسبه شده است .
داده های توصیفی
جدول۴-۱ : توصیف آماری فرم A وB