MML، احتمال مشاهده یک الگوی پاسخ را در جامعه مدلسازی می کند. برای هر الگوی پاسخ منحصر به فرد میتوان یک احتمال یعنی Xp را مدلسازی کرد. افرادی که این الگو را ایجاد می کنند. به عنوان مکرر یا همتا تلقی میشوند. تعداد افرادی که دارای این الگو هستند با np نشان داده میشوند. برای یک سطح صفت خاص θq، احتمال یک الگوی پاسخدهی را میتوان با بهره گرفتن از مدل IRT مانند معادله۳‑۱۶ محاسبه کرد. اگرچه سطوح صفت برای افراد مشاهده شده نامعلومند، ولی فرض می شود احتمالهای سطوح مختلف یعنی p(θq) مشخصاند. ممکن است از پیش معلوم باشد که توزیع نمرهها نرمال و دارای میانگین واریانس مشخص است و یا ممکن است یک توزیع به صورت تجربی از داده های آزمون محاسبه شود. در هر دو صورت، برای سطوح مختلف صفت احتمالها مشخص میشوند. برای مثال، فرض کنید احتمال هر سطح صفت را میتوان از روی توزیع جامعه تعیین کرد و در این صورت، احتمال مشاهده یک الگوی خاص پاسخ در یک نمونه تصادفی از جامعه، یعنی p(Xp|β)، شامل موارد زیر است.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت nefo.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
احتمال الگو تحت θq
احتمال مشاهده سطح صفت در جامعه، P(θq)
سطوح صفت گسسته احتمالی به صورت معادله۳‑۲۱ جمع می شود.
معادله۳‑۲۱ |
فرض کنید توزیع جامعه از ۵ سطح گسسته ۲-، ۱-، ۰، ۱، ۲ به ترتیب با احتمالهای ۰۵۵/۰، ۲۴۴/۰، ۴۰۳/۰، ۲۴۴/۰ و ۰۵۵/۰ تشکیل شده است. در این صورت، درستنمایی یک الگوی خاص پاسخ (مانند یک الگوی پاسخدهی ART که در آن ۰، ۰، ۰، ۱، ۰، ۱، ۱، ۱، ۱، ۱ =Xs است) در جامعه به صورت زیر است.
در آن احتمال هر الگوی پاسخدهی، از مدل IRT مانند معادله۳‑۱۶ محاسبه می شود. البته منطقیتر است به جای آن که توزیع صفت را به صورت مجموعه ای از اندازه های گسسته در نظر بگیریم، فرض کنیم سطح صفت در جامعه یک متغیر پیوسته و به شکل توزیع نرمال است. در عمل، روشی که به انتگرالگیری گاووسی معروف است برای یافتن اندازه های مورد انتظار به کار میرود.
روش انتگرالگیری گاووسی شبیه تقسیم یک توزیع نرمال به بخشهایی با یک اندازه معرف (یعنی نقطه انتگرالگیری ) و احتمال وقوع (یعنی وزن) است. شکل ۳‑۱۰ یک توزیع نرمال سطح صفت را که به ۵ بخش تقسیم شده است نشان می دهد. اگر حدود فواصل بخش را تعریف کنند، مانند آنچه که در شکل ۳‑۱۰ نشان داده شده است، احتمالهای منحنی نرمال مربوطه به پنج بخش که به ترتیب ۰۶۷/۰، ۲۴۱/۰، ۳۸۳/۰، ۲۴۱/۰ و ۰۶۷/۰ است، به وزنهای انتگرالگیری نزدیکاند. با افزایش تعداد نقاط انتگرالگیری، وزنها به طور دقیق تری به احتمالهای توزیع نرمال استاندارد نزدیک میشوند. به طور رسمیتر، احتمال به دست آوردن یک بردار پاسخ خاص Xp، در یک نمونه تصادفی از جامعه، از طریق انتگرالگیری از پیش بینی مدل IRT در سرتاسر دامنه سطح صفت در معادله۳‑۲۲ محاسبه می شود. در این معادله چگالی احتمال ، یعنی توانایی مکنون است.
معادله۳‑۲۲ |
شکل ۳‑۱۰ : انتگرالگیری گاووسی با پنج نقطه.
درستنمایی داده ها
درستنمایی داده ها را میتوان بر اساس حاصلضرب درستنماییها الگوی پاسخ در بین آزمودنیها به دست آورد. MML مدل کل جامعه برای الگوهای خاص پاسخهای مشاهده شده است. لگاریتم درست نمایی داده ها در MML، مجموع احتمالهای کناری الگوهای پاسخدهی (از معادله۳‑۲۱) است که در فراوانی های شان ضرب شده اند(np) و به صورت معادله ۳‑۲۳ است.
معادله ۳‑۲۳ |
لازمه MML آن است که سطح توزیع صفت مشخص شود. مطابق معمول، توزیع به صورت نرمال مشخص می شود. اما لزومی ندارد که توزیع از قبل مشخص باشد. اگر حجم نمونه کافی در دسترس باشد، میتوان توزیع صفت را از روی داده ها برآورد کرد و یا توزیعهای غیر نرمال دیگر را، در صورتی که مناسب باشند، میتوان مشخص کرد.
روش: روش MML بک و ایتکن (۱۹۸۱)، الگوریتم EM را برای برآورد پارامترهای سوال به کار میبرد. الگوریتم EM از آن جهت به این نام شناخته می شود که دارای یک مرحله مورد انتظار (E) و یک مرحله بیشینهسازی (M) است. در مرحله مورد انتظار، تعداد افراد مورد انتظار در هر سطح صفت (که توسط نقاط انتگرالگیری مشخص می شود) و همچنین تعداد افراد مورد انتظاری که به هر سوال خاص پاسخ می دهند،محاسبه می شود. سپس، با بهره گرفتن از این اندازه های مورد انتظار در معادلههای برآورد، پارامترهای سوال برآورد می شود، به گونه ای که درستنماییها را در مرحله بیشینهسازی به حداکثر برسانند. آنگاه در دومین مرحله مورد انتظار، پارامترهای سوال برای محاسبه مقادیر مورد انتظار جدید به کار می رود و در مرحله بیشینهسازی دیگر درستنمایی داده ها بر اساس مقادیر مورد انتظار جدید بیشینه میشوند. وقتی که اندازهها همگرا شدند، با بهره گرفتن از روش نیوتن-گاوس برآوردهای نهایی پارامتر سوال و خطاهای استاندارد به دست می آید.
ارزیابی: MML دارای چند مزیت است. نخست، MML را برای تمام انواع مدلهای IRT، از جمله مدل های چند بعدی به آسانی میتوان به کار برد. دوم،MML برای هر دو نوع آزمونهای طولانی و آزمون های کوتاه کارآمد است. سوم، برآوردهای MML از خطاهای استاندارد سوالها را میتوان به عنوان تقریب خوبی از واریانس نمونه گیری مورد انتظار برآوردها توجیه کرد. چهارم، برای نمره های کامل نیز برآوردهایی به دست میآیند. هیچگونه اطلاعاتی درباره آزمودنیها از بین نمیرود زیرا پاسخهای کامل نیز دارای فراوانی نسبی مورد انتظار هستند. لازم نیست که سوالها اصلاح شوند،به ویژه اگر بتوان توزیع پارامترهای سوالها را نیز مشخص کرد. پنجم: درستنمایی داده های MML را میتوان برای توجیه فرضیه آزمایی و شاخص های برازش به کار بست. اگر یک مدل زیر مجموعه ای از یک مدل بزرگتر باشد، آزمون نسبت درستنمایی مجذور کای می تواند مشخص کند که آیا مدلها به گونه معنیداری با هم تفاوت دارند یا ندارند.
البته MML چند نقطه ضعف دارد. نخست، برنامه ریزی برای یک الگوریتم کارآمد به منظور برآورد MML دشوار است. برنامه های کارآمد کامپیوتری باید هم از نظرمحاسباتی و هم از نظر عددی پیشرفته باشند. اما برخلاف این نقطه ضعف، در حال حاضر برنامه های IRT برای مدلهای جدیدتر و پیچیدهتر، به طور فزاینده ای در مورد MML به کار میروند. دوم، باید برای سطح صفت یک توزیع فرض شود، در نتیجه برآورد پارامترها به مناسب بودن این توزیع مفروض بستگی خواهد داشت. اما این نکته که آیا این یک نقطه ضعف بزرگ است یا نه کاملاً روشن نیست. لازم نیست توزیع فرض شده نرمال باشد و در واقع میتوان آن را از داده ها برآورد کرد. توزیعهای مختلف سطح صفت که کجی یا کشیدگی غیرنرمال دارند را نیز میتوان با تعیین وزنهایی با مدلهای IRT انطباق داد. علاوه بر این به نظر میرسد که برآوردهای پارامتر سوال، در مواردی که توزیع نمرهها با توزیع نرمال تفاوت متوسط دارند، از این تفاوت چندان تاثیر نمیپذیرند، بنابراین توزیعهایی که نامناسب تشخیص داده شده اند چندان مهم نیستند.
بیشینه درستنمایی شرطی (CML)
در برآورد CML، سطوح صفت نامعلوم را با بیان احتمال الگوی پاسخدهی بدون گنجاندن پارامترهای سطح صفت می توان بررسی کرد. این کار در صورتی امکان پذیر است که برای برآورد سطح صفت یک آماره مکفی در داده ها موجود باشد. در مدل راش، نمره های کل افراد در سوالها آمارهای مکفی برای محاسبه سطح صفت به شمار میرود. آماره مکفی به این معناست که برای برآورد پارامترها به هیچ اطلاعات دیگری درباره داده ها نیازی نیست. در نتیجه، افرادی با نمره کل یکسان (یعنی، آماره مکفی)، صرف نظر از اینکه به کدام سوالها پاسخ درست دادهاند، برآورد سطح صفت یکسانی را دریافت می کنند. در مدلهای پیچیدهتر، مانند ۲PL و ۳PL، نمره کل یک آماره مکفی برای برآورد سطح صفت محسوب نمی شود. در این مدلها برآوردهای سطح صفت به این بستگی دارد که به کدام سوالها پاسخ درست داده شده است. بنابراین، چون CML برای برآورد سطح صفت نیازمند آماره های بسنده است، این روش تنها در مورد مدل راش و زیر شاخه های آن به کار میرود. همانند برآورد JML، پارامترهای شخص به عنوان اندازه های ثابت محسوب میشوند.
درستنمایی الگوی پاسخ
درCML، درستنمایی الگوی پاسخدهی p(Xs |θ , β)، به گونه ای صورت بندی مجدد می شود که به جای سطح صفت نامعلوم شخص یعنی θs ، کل نمره را شامل شود. اکنون در الگوی پاسخ یعنی Xs به طور ضمنی دو نوع آگاهی وجود دارد: به تعداد معینی از سوالها پاسخ درست داده شده است که نمره کل rs را به دست می دهد و سوالهای خاصی که درست یا غلط پاسخ داده شده اند. در CML، دومین نوع آگاهی که از الگوی پاسخدهی گرفته می شود، به برآورد سطح صفت بیارتباط است؛ نمره کل یک آماره مکفی است.
روش برآوردCML بر پایه تحلیل بردار پاسخ p(Xs |θs , β) به دو عبارت استوار است. (الف) احتمال نمره کل، با داشتن سطح صفت و پارامترهای سوال P(rs , , θs , β) و (ب) احتمال یک الگوی خاص پاسخدهی، با داشتن نمره کل و پارامترهای سوال یعنی p(Xs |rs , β)، این معادله به صورت زیر بیان می شود.
معادله ۳‑۲۴ | p(Xs |θs , β)= p(rs |θx , β) p(Xs |rs , β) |
احتمال الگوی پاسخدهی در عبارتهایrs و پارامترهای سوال با تنظیم مجدد معادله ۳‑۲۴ به صورت زیر است.