در شیوه‌ی انتخاب سؤال بیشینه‌ی پسین (MPP)، سؤالی انتخاب می‌شود که بیشترین کاهش را در واریانس توزیع پسین توانایی ایجاد کند. این روش به منظور تشخیص برآوردهای موقتی توانایی که دارای خطا هستند، ایجاد شده است. بنابراین، سؤالات براساس توزیع کامل پسین توانایی به جای یک نقطه‌ی برآورد، انتخاب می‌شوند. ممکن است که سؤالی که انتخاب می‌شود در آن سطح توانایی یا سطوح دیگر توانایی، بیشترین آگاهی را نداشته باشد. درعوض، سؤال انتخاب شده، سؤال متعادلی است که در طول سطح چگالی توزیع پسین، اندازه‌گیری مناسبی انجام می‌دهد. این رویکرد ماهیت محافظه‌کارانه‌ای دارد و اغلب نتایج خوبی ایجاد می‌کند. با این وجود، رویکرد MPP نمی‌تواند بر اساس جدول آگاهی عمل کند و بنابراین، از لجاظ محاسباتی سخت‌تر از رویکرد MI می‌باشد. در این شیوه، به طور مداوم سؤالات ارائه نشده‌ی کل بانک سؤال جستجو می‌شود تا سؤالی که حداکثر کاهش را در واریانس پسین ایجاد می‌کند، پیدا شود. این فرایند برای خزانه‌های سؤالی که نسبتاً بزرگ هستند، بی‌نهایت زمان‌بر می‌باشد (پارشال، اسپری، کالن و دیوی، ۲۰۰۲).
پایان نامه
۳). شیوه‌ی انتخاب سؤال به روش آگاهی وزن‌دار
روش آگاهی وزن‌دار، شیوه‌ای از انتخاب سؤال است که در آن وزن‌هایی از توزیع پسین توانایی جدید آزمودنی به ستون‌هایی از جدول آگاهی وارد می‌شود. در طول انتخاب سؤال، مقادیر آگاهی فراهم شده براساس هر سؤال در هر سطح توانایی در این وزن‌ها ضرب و سپس جمع می‌شود. سؤالی با بیشترین آگاهی وزن‌دار برای اجرا انتخاب می‌شود. شباهت روش WI به روش MPP در این است که در هر دو روش فرض می‌شود که برآوردهای موقتی همراه با خطا هستند. با این وجود، با اینکه از لحاظ محاسباتی به سادگی روش MI نمی‌باشد، ولی ساده‌تر از روش MPP می‌باشد. این شباهت به دلیل است که تقریب اوون[۱۱۸] (۱۹۶۹ و ۱۹۷۵) به توزیع پسین توانایی، می‌تواند برای محاسبه‌ی وزن‌ها به کار رود (پارشال، اسپری، کالن و دیوی، ۲۰۰۲).
قواعد اتمام آزمون
روش‌های اجرای CAT در دو طبقه‌ی اساسی قرار می‌گیرند. این طبقه‌بندی بر اساس قواعد اتمام آزمون تعریف می‌شود. آنها یا دارای طول ثابت هستند و یا دارای طول متغیر. در آزمون‌های CAT با طول ثابت، تعداد یکسانی سؤال برای هر آزمودنی اجرا می‌شود. بنابراین، آزمودنی‌های متفاوت ممکن است با سطوح متفاوتی از دقت سنجش شوند، دقیقاً همانند آنچه در آزمون‌های غیر انطباقی مرسوم می‌باشد. اگر آزمونی که برای آزمودنی‌ها انتخاب می‌شود، مناسب باشد و به آسانی مورد هدف سنجش قرار گیرد، به دلیل این‌که، پاسخی که این نوع آزمودنی به آزمون خواهند داد، قابل پیش بینی خواهد بود و یا به دلیل اینکه توانایی آنها در نقطه‌ای قرار می‌گیرد که خزانه‌ی سؤال غنی است، بسیار دقیق‌تر از آزمودنی‌هایی که به خوبی مورد هدف سنجش قرار نمی‌گیرند، مورد اندازه‌گیری قرار می‌گیرند. در مقابل، در آزمون‌های CAT که طول متغیر دارند، هر آزمودنی به سطح ثابتی از دقت می‌رسد، و اگر نیاز باشد، تعداد متفاوتی سؤال برای آزمودنی‌های مختلف اجرا می‌شود. در این نوع CAT، آزمودنی‌هایی که به خوبی مورد هدف سنجش قرار می‌گیرند، آزمون کوتاهتری نسبت به آزمودنی‌هایی که به طور ضعیفی مورد هدف سنجش قرار می‌گیرند، دریافت می‌کنند (پارشال، اسپری، کالن و دیوی، ۲۰۰۲).
مجموعه قواعد توقف آزمون
یکی از عنصرهای تعیین کننده و مهم در CAT تصمیمی است که برای توقف آزمون گرفته می‌شود. اگر آزمون خیلی کوتاه باشد، این امکان وجود دارد که برآورد توانایی همراه با خطا باشد. همچنین، اگر آزمون طولانی باشد، باعث به هدر رفتن زمان و منابع می‌شود و سؤالات غیر ضروری به آزمودنی‌ها ارائه می‌شود. آزمودنی خسته می‌شود و سطح عملکردش افت می‌کند، در نتیجه، اعتبار نتایج از بین می‌رود (لیناکر، ۱۹۹۹).
آزمون‌های CAT زمانی متوقف می‌شود که؛
خزانه‌ی سؤال خالی شود: این مورد زمانی اتفاق می‌افتد که خزانه‌ی سؤال کوچک باشد، و همه‌ی سؤالات برای آزمودنی اجرا شود.
به حداکثر طول آزمون برسیم: طول آزمون از قبل تعیین شده باشد.
مقیاس توانایی با دقت کافی برآورد شود: هر پاسخ، اطلاعات آماری در مورد میزان توانایی فراهم می‌کند. افزایش آگاهی با کاهش خطای استاندارد همراه است، که به دنبال آن دقت آزمون افزایش می‌یابد و زمانی که اندازه‌گیری به اندازه‌ی کافی دقیق باشد، آزمون متوقف می‌شود.
مقدار توانایی به اندازه کافی دورتر از ملاک قبول-رد باشد: در سنجش‌هایی از CAT که آزمودنی در برابر سطح قبول یا رد ارزیابی می‌شود، آزمون زمانی متوقف می‌شود که تصمیم قبول یا رد از لحاظ آماری معین باشد و زمانی اتفاق می‌افتد که برآورد توانایی ۲ واحد S.E دورتر از سطح ملاک باشد، و یا زمانی که سؤالات کافی وجود نداشته باشد، در نتیجه، آزمون برای آزمودنی متوقف می‌شود تا تصمیم قبول-رد تغییر کند.
آزمودنی رفتاری خارج از آزمون نشان دهد: برنامه‌های CAT این توانایی را دارند نظم الگوی پاسخ را کشف کنند، مانند انتخاب‌های نامربوط به گزینه‌های پاسخ یکسان یا الگوهای پاسخ نامربوط. همچنین، نحوه‌ی پاسخ‌دهی به سرعت و یا به کندی را نیز کشف می‌کنند. در این مواقع سیستم CAT آزمون را متوقف می‌کند (لیناکر، ۲۰۰۰).
برآورد توانایی یا شیوه‌ی نمره‌دهی
تقریباً در همه‌ی سنجش‌های انطباقی کامپیوتری، از طریق برآورد توانایی، به فرد نمره داده می‌شود. چون این مولفه‌ی CAT به مقدار زیادی بر انتخاب سؤال، طول آزمون، دقت اندازه‌گیری و نتیجه‌ی آزمون اثر می‌گذارد، یکی از مولفه‌های مهم CAT درنظر گرفته می‌شود. در اغلب موقعیت‌های سنجش انطباقی کامپیوتری، برآوردهای پارامتر سؤال بر اساس IRT می‌باشد، و فرض بر این است که مقادیر این برآوردها بدون خطا و معلوم هستند و در خزانه‌ی سؤال ذخیره شدند. بنابراین تنها پارامتری که در طول اجرای سنجش انطباقی باید برآورد شود، توانایی مکنون آزمودنی یعنی،  می‌باشد. برآوردهای توانایی به دنبال هر پاسخ سؤال جدید برآورد می‌شود تا بهترین برآورد برای توانایی واقعی آزمودنی بدست آید. برآوردهای متوالی توانایی همچنان که آزمون اجرا می‌شود به‌دست می‌آید و برآورد موقت نامیده می‌شود. این قضیه این واقعیت را منعکس می‌کند که هر برآوردی تنها روی آنچه در مورد آزمودنی در آن نقطه از فرایند سنجش معلوم است، تکیه دارد. چندین روش برای محاسبه‌ی برآوردهای موقت در ادبیات مربوط به CAT وجود دارد که هریک دارای مزیت‌ها و مشکلاتی هستند. سه روش مشهور توانایی عبارتند از؛ برآورد بیشینه‌ی درست نمایی[۱۱۹] (MLE)، پسین مورد انتظار[۱۲۰] (EAP)، بیشینه‌ی پسین[۱۲۱] (MAP). این دو روش آخر، مربوط به رویکرد بیزین هستند و به ترتیب می‌توانند به عنوان رویکردهای میانگین بیز و مد بیز نامیده شوند. این دو روش از نظر محاسباتی به یکدیگر شباهت بسیاری دارند و دارای زیربنای یکسانی هستند (پارشال، اسپری، کالن و دیوی، ۲۰۰۲). این سه روش به دو رویکرد کلی روش‌های بیزین (لرد، ۱۹۸۰) و روش‌های بیشینه درست نمایی تقسیم می‌شوند. روش بیشینه‌ی پسین (MAP)، را روش بیزین اوون نیز می‌نامند، و در اغلب برنامه‌های CAT نیز مورد استفاده قرار می‌گیرد (اوون، ۱۹۶۹؛ ۱۹۷۵)، از این‌رو، از روش‌های بیزین تنها روش بیزین اوون یا بیشینه‌ی پسین در این فصل شرح داده‌ می‌شود.
شیوه‌ی برآورد توانایی اوون (برآوردهای بیزین)
روش برآورد توانایی متوالی بیزین اوون (۱۹۶۹)، به عنوان بخشی از برنامه‌ریزی سنجش انطباقی توسط او پیشنهاد شده است. در این رویکرد سؤالاتی انتخاب می‌شود که مقدار مورد انتظار واریانس پسین بیزین را به حداقل برساند. در هر صورت این شیوه‌ی برآورد توانایی با بهره گرفتن از ملاک‌های دیگر انتخاب سؤال، در برنامه‌ریزیCAT مفید درنظر‌گرفته ‌می‌شود.
درواقع، روش بیزین اوون با یک توزیع پیشین توانایی شروع می‌کند. در این روش فرض بر این است که آزمودنی عضوی از جامعه‌ای با توزیع نرمال توانایی با میانگین و واریانس شناخته ‌شده می‌باشد. بعد از هر سؤال، میانگین و واریانس با بهره گرفتن از یک روش آماری مناسب اصلاح می‌شود. در این روش آماری، اطلاعات توزیع پیشین با نمره‌ی مشاهده شده (صحیح یا غلط) در سؤالی که اخیراً پاسخ داده‌شده و پارامترهای مدل IRT تست ترکیب می‌شود و توانایی جدید را برآورد می‌کند. مقادیر تجدید‌نظر شده‌ی پارامترهای توزیع توانایی، توزیع پسین را تعیین می‌کنند، این مقادیر به عنوان توزیع پیشین برای سؤال بعدی به‌کار‌می‌رود. این فرایند تا آنجا ادامه می‌یابد که آزمون به پایان برسد. در آن نقطه (پایان آزمون)، میانگین پسین به عنوان برآورد توانایی آزمودنی به کار می‌رود. معادله‌ی (۲-۳)، برآورد اوون برای اصلاح میانگین پیشین را نشان می‌دهد:
(۲-۳)
اوون (۱۹۷۵)، نشان داد که بعد از هر سؤالی که اجرا می‌شود، برآورد  و  برابرند با:
(۲-۴)
(۲-۵)
: پاسخ سؤال می‌باشد، زمانی که سؤال صحیح پاسخ داده‌می‌شود  و زمانی که پاسخ سؤال غلط می‌باشد
: تابع چگالی احتمال نرمال استاندارد
: تابع چگالی تجمعی نرمال استاندارد
و
(۲-۶)
که در معادله (۲-۶)،  و  بصورت زیر تعریف می­شوند:

نمره‌دهی آزمون سنجش انطباقی به روش اوون، تنها یک پاسخ را در یک زمان درنظر‌می‌گیرد. همه‌ی اطلاعات قبلی در پارامترهای توزیع پیشین وارد می‌شود و بعد از هر سؤال تغییر می‌کنند. به دلیل اطلاعات پیشین اضافه‌شده، در شیوه‌های بیزین این مزیت وجود دارد که نسبت به MLE خطاهای استاندارد کوچکتری در تعداد یکسانی از سؤالات اجرا‌شده دارند. با این وجود، استفاده از یک پیشین نادرست، باعث می‌شود که برای بهبود برآورد، به تعداد سؤالات بیشتری نیاز داشته‌باشیم، و بازگشت به سمت میانگین در برآورد توانایی رخ‌دهد. با این وجود، کاربرد روش بیزین اوون برای برآورد توانایی پایانی، به دلیل وابستگی به ترتیب ارائه‌ سؤالات توصیه نمی‌شود (پارشال، اسپری، کالن و دیوی، ۲۰۰۲).
شیوه‌ی بیشینه‌ی درست نمایی
برآورد بیشینه‌ی درست نمایی توانایی از طریق جستجوی مقدار بیشینه‌ی تابع درست نمایی تعیین می‌شود. از این شیوه‌ی برآورد، زمانی که پارامترهای سؤال معلوم باشند، به کار می‌رود. در این روش فرض بر این است که یک آزمودنی با الگوی پاسخ  که به طور تصادفی انتخاب می‌شود، به مجموعه‌ای n سؤالی پاسخ می‌دهد. اگر  پاسخ صحیح به سؤال  باشد و  پاسخ غلط به سؤال  باشد. بر اساس مفروضه‌ی استقلال موضعی، احتمال مشترک مشاهده‌ی الگوی پاسخ برای این آزمودنی برابر است با؛ حاصلضرب احتمال‌های مشاهده شده‌ی پاسخ‌های او. معادله‌ی (۲-۷) این حاصل را نشان می‌دهد:
(۲-۷)
با در نظر گرفتن  و  ، تابع درست نمایی می‌تواند به صورت معادله‌ی (۲-۸) نوشته شود:
(۲-۸)
حال اگر الگوی پاسخ مشخص باشد، یعنی  باشد، دیگر کاربرد احتمال مناسب نخواهد بود، لذا در این شرایط معادله‌ی احتمال مشترک را تابع درست نمایی می‌نامیم و آن را با معادله‌ی (۲-۹) نشان می‌دهیم:
(۲-۹)
از آنجا که تابع درست نمایی حاصل‌ضرب کمیت‌هایی است که بین صفر و یک قرار دارد، بنابرین، حاصلضرب مقدار فوق بسیار کوچک می‌شود، مقیاس سازی بهتری از آن این است که از تبدیل لگاریتمی استفاده شود. معادله‌ی (۲-۱۰) این تبدیل لگاریتمی را نشان می‌دهد:
(۲-۱۰)
حال مقدار  که تابع درست نمایی یا لگاریتم تابع درست نمایی یک آزمودنی را بیشینه سازد، به عنوان برآورد بیشینه‌ی درست نمایی  برای آن آزمودنی تعیین می‌شود (همبلتون، سوامیناتان و راجرز، ۱۹۹۱). برآورد بیشینه‌ی درست نمایی برای آزمون‌های کوتاه با ثبات نیست و تا زمانی‌که آزمودنی در الگوی پاسخ خود پاسخ صحیح یا غلط نداشته باشد مقدار نامحدود بدست می‌آید. MLE مقدار اریب نسبتاً کمی دارد. ولی یکی از مشکلات آن این است که گاهی اوقات چندین نقطه‌ی بیشینه خواهد داشت. این روش به محاسبات طولانی‌تری نسبت به روش‌های بیزین نیاز دارد (پارشال، اسپری، کالن و دیوی، ۲۰۰۲).
مواجهه‌ سؤال[۱۲۲]
در کل، اغلب روش‌های انتخاب سؤال، برخی از سؤالات را بیشتر از سؤالات دیگر، به دلیل، صفات برتر اندازه‌گیری یا ویژگی‌های مطلوب سؤال ترجیح می‌دهند. در نتیجه، برخی از سؤالات بیشتر از حد مجاز برای آزمودنی‌ها اجرا می‌شوند. این امر ممکن است باعث فاش شدن سؤال شود، که روایی نمرات آزمون را از بین می‌برد (وایس و کینگسبری[۱۲۳]، ۲۰۰۰). به عبارت دیگر، برخی از سؤالات نیز کمتر مورد استفاده قرار می‌گیرند که این امر هم باعث اتلاف سرمایه‌ها می‌شود. بنابراین، انتخاب راهبردی برای کنترل مواجهه‌ سؤالات برای آزمودنی‌ها، بخش جدایی‌ناپذیر طراحی آزمون است (داویس و داد[۱۲۴]، ۲۰۰۳).
یکی از اولین روش‌هایی که برای برخورد با مسائل کنترل مواجهه ایجاد شده است، روش ۵-۴-۳-۲-۱ ( هتر و سیمپسون، ۱۹۹۷؛ مک‌برید و مارتین[۱۲۵]، ۱۹۸۳) که در CAT-ASVAB به کار رفت، می‌باشد. کینگسبری و زارا[۱۲۶] (۱۹۸۹)، و تامسون[۱۲۷] (۱۹۹۸) روش‌های متفاوت تصادفی را برای کاهش نرخ مواجهه‌ کلی طراحی کردند. روش‌های چرخشی خزانه‌ی سؤال (وای[۱۲۸]، ۱۹۹۸، وای و استفان[۱۲۹] و اندرسون[۱۳۰]، ۱۹۹۸، آریل، ولدکمپ و وندرلیندن، ۲۰۰۴ ) و CAST (لانچ و نانگستر[۱۳۱]، ۱۹۹۸)، به منظور توزیع سؤالات در تست‌های متفاوت از طریق یک قیاس ایجاد شدند تا دردسترس بودن انتخاب سؤالات را کاهش دهند. با این وجود، در صنعت CAT، روش کنترل مواجهه‌ سؤال مبتنی بر روش سیمپسون و هتر، (۱۹۸۵) به‌طور وسیعتری به کار می‌رود.
روش کنترل مواجهه‌ سیمپسون-هتر
روش کنترل مواجهه سیمپسون – هتر (S-H) یکی از رایجترین شیوه‌های انتخاب مشروط سؤال است. در این روش به هر سؤال یک مقدار پارامتر کنترل مواجهه اختصاص داده‌ می‌شود، که بر اساس فراوانی انتخاب سؤال که در یک شبیه‌سازی چرخشی CAT تعیین می‌شود، استوار است. به سؤالاتی با فراوانی‌های اجرای زیاد، پارامترهای کنترل مواجهه کوچکتری اختصاص داده‌می‌شود، که دامنه‌ی آن از ۰ تا ۱ می‌باشد. در طول اجرای آزمون، پارامتر کنترل مواجهه‌ سؤال انتخاب شده با عدد یکنواخت تصادفی که دامنه‌ی آن نیز بین ۰ تا ۱ است، مقایسه می‌شود. اگر پارامتر کنترل مواجهه بزرگتر از عدد تصادفی باشد، سؤال اجرا می‌شود، و اگر کوچکتر باشد، سؤال به خزانه‌ی سؤال بازگردانده می‌شود. به همین صورت، فرایند یکسانی برای بهترین سؤال بعدی صورت می‌گیرد. پارامتر کنترل مواجهه مشابه آستانه[۱۳۲] می‌باشد. با کنترل آستانه‌ی روش (S-H) اجرای سؤالاتی که به‌طور‌فراوانی در CAT استفاده می‌شوند، محدود می‌شود و نرخ بیشینه‌ی مواجهه‌ سؤال برای سؤالاتی که اغلب کمتر مورد استفاده قرار می‌گیرند را تضمین می‌کند. معمولاً پارامترهای کنترل مواجهه در روش (S-H) به‌وسیله‌ی مجموعه‌ای از شبیه‌سازی‌های چرخشی اجراهای واقعی CAT تنظیم می‌شود. به عبارت دیگر، این پارامتر، نسبت نرخ مواجهه‌ هدف برای احتمال انتخاب سؤال در آزمون می‌باشد. این شیوه به صورت زیر عمل می‌کند:
فرض کنید که  انتخاب سؤال  را برای یک آزمودنی که به‌طور تصادفی نمونه‌گیری شده را نشان می‌دهد، همچنین فرض کنید که  اجرای آن سؤال را نشان می‌دهد. نرخ مواجهه‌ سؤال  می‌تواند به‌صورت  تفسیر شود، یعنی احتمال اجرای سؤال  برای آزمودنی که به‌طور تصادفی نمونه‌گیری شده است. روش (S-H) سؤالاتی را که اجرا شده از سؤالاتی که انتخاب می‌شود، از طریق رابطه‌ی احتمال  جدا می‌کند و  را از طریق کنترل  یعنی نسبت انتخاب‌هایی که به اجرا منجر می‌شود، کنترل می‌کند. برای هر نرخ مواجهه‌ معین  ؛  ، می‌تواند از طریق تعیین  به‌دست آید. اگر  معلوم باشد، یا بتواند تقریب زده ‌شود، این روش می‌تواند به آسانی از طریق ایجاد یک متغیر تصادفی یکنواخت  اجرا شود.
روش (S-H) به‌طور مؤثری، نرخ‌های مواجهه‌ همه‌ی سؤالات را محدود می‌کند. با این‌ وجود، چون سؤالاتی که انتخاب نشدند، نمی‌توانند اجرا شوند، سؤالاتی با احتمالات انتخاب کوچک، نرخ‌های مواجهه کوچکی خواهند داشت؛ بنابراین، روش (S-H) نرخ‌های مواجهه را برای سؤالاتی که کمتر مواجهه می‌شوند را نمی‌تواند افزایش دهد. بعلاوه، تا زمانی‌‌که مواجهه‌ یک سؤال در میان سطوح  ‌بتواند کنترل شود، میزان کنترل یکسانی برای آزمودنی‌ها در سطح توانایی ویژه‌ای صورت نمی‌گیرد. برای مثال، حتی اگر مواجهه‌ یک سؤال کنترل شود، به‌طوری‌که آن سؤال برای بیش از %۳۰ از آزمودنی‌های همپوش اجرا نشود، آن سؤال ممکن است برای آزمودنی‌هایی با توانایی بالا در %۱۰۰ دفعات اجرا شود. بعلاوه، اجرای این روش به شناخت  نیز نیاز دارد، که آن هم به شکل توزیع  جامعه‌ی آزمودنی وابسته است. از‌این‌رو، باید توزیع پیشین پارامتر  تعیین شود و سپس مقدار  از طریق شبیه‌سازی تقریب زده شود (سیمپسون و هتر، ۱۹۸۵).
انواع بسیاری از روش‌های (S-H) ارائه شده‌اند. پارشال و دیوی و نرینگ[۱۳۳] (۱۹۹۸)، روش (S-H) شرطی[۱۳۴] را که در آن پارامترهای کنترل مواجهه براساس سطح توانایی مشخص می‌شود را ایجاد کردند. همچنین تامسون (۱۹۹۵) نیز شیوه‌ای از کنترل مواجهه‌ شرطی را روی توانایی آزمودنی ایجاد کرد. در رویکردهای سیمپسون – هتر شرطی، ماتریسی از پارامترهای مواجهه‌ سؤال با پارامترهای مواجهه‌ متفاوت برای هر سؤال در هریک از سطوح توانایی مجزا ایجاد می‌شود که با توانایی آزمودنی‌ها رابطه دارد. استوکینگ و لوئیس (۱۹۹۵) روشی برای استفاده از مدل چند جمله‌ای ایجاد کردند. همچنین نوع دیگری از این روش که جایگاه‌های پارامتر کنترل مواجهه نه تنها فراوانی سؤالی که انتخاب می‌شود، بلکه سطح  را نیز درنظر می‌گیرد را ارائه کردند (استوکینگ و لوئیس، ۱۹۹۸). این روشی که به روشS-H اضافه شده است (اغلب به عنوان روشS-H شرطی زمانی که مدل چند جمله‌ای به‌کار نمی‌رود، شناخته می‌شود)، به دلیل مزایای زیادی که برای روش S-H از طریق ایجاد یک پارامتر کنترل مواجهه برای هر سؤال در تعداد متفاوتی از سطوح  ایجاد می‌کند، مطلوب است. همچنین، روش دیوی – پارشال، روی سؤالاتی که قبلاً در طول اجرای یک CAT معین اجرا شده شروطی قرار می‌دهد (دیوی و پارشال، ۱۹۹۵؛ پارشال، دیوی و نرینگ، ۱۹۹۸). روش “hybrid” یا “Tri-Conditional” این رویکردها را ترکیب می‌کند و روی هر سؤال، توانایی آزمودنی و زمینه و بافتی که این سؤالات قبلاً اجرا شده است، شرط قرار می‌دهد (نرینگ، دیوی و تامسون، ۱۹۹۸؛ پارشال، هوگارتی[۱۳۵] و کرومری[۱۳۶]، ۱۹۹۹).
استفاده از پارامترهای کنترل مواجهه
سیمپسون و هتر (۱۹۸۵) مبحث کنترل مواجهه‌ سؤال را بر اساس یک روش احتمالی بنا کردند. در این روش پارامتر کنترل مواجهه بر اساس رفتار سؤالات در شبیه‌سازی‌های مکرر طرح تست بر روی نمونه‌ای که از توزیع موردنظر توانایی بدست می‌آید، برآورد می‌شود. در این شیوه، یک آزمودنی را که به‌طور تصادفی از یک گروه مورد نظر آزمودنی‌ها نمونه‌گیری می‌شود را درنظر می‌گیرد، همچنین، بین احتمال  ، یعنی، احتمال اینکه یک سؤال از یک لیست مرتب ‌شده‌ای براساس یک الگوریتم انتخاب سؤال CAT به عنوان بهترین سؤال برای اجرا انتخاب شود، و بین  ، یعنی احتمال اینکه یک سؤال مشروط به اینکه انتخاب شود، اجرا شود، تمایز قائل می‌شوند. این شیوه در جستجوی کنترل مواجهه‌ سؤال یعنی  یا احتمال کلی که یک سؤال اجرا شود، است. معادله‌ی (۲-۱۱) این احتمال را محاسبه می‌کند:

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...