数学建模论文快速评卷策略word模板 g168
78模板网分享数学建模论文快速评卷策略模板
快速评卷策略
第二组
摘要:竞赛后的评阅试卷过程往往需要很大的人力物力,如何评阅最少的试卷与最少的评分误差就能将优胜者选出是本文解决的关键问题。
首先我们对系统偏差进行定义,根据现实生活中的改卷情况,构建系统偏差模型。考虑系统偏差与改卷数量和改卷的顺序有关,还与评这份试卷的人数多少有关。阅卷人数与系统偏差假设呈线性关系,在一次评阅中首先根据这一次评卷的人数确定因人数而造成的评分误差 ;评卷过程中的评分误差按照先减小到最小值再因评卷疲劳增大的趋势所确定的函数值 ,二者之和构成了系统偏差。通过每次分组方案的评卷过程中产生的系统偏差最大值 与第三名的成绩来确定删除分数线,从而筛选出一定数量的试卷,统计试卷总数后,按照剩下的试卷数确定下一轮的评分方法。通过对整个评卷过程系统偏差的值进行累加求和,得到评分的总偏差除以评卷次数为这种方案下的平均评分偏差。并可以算出阅卷人最小的阅卷份数。
采用列举法将一些方案列出,根据计算机不断模拟打分,计算出各个方案的评卷次数和系统偏差之和,取各方案中此两个值均较小的方案作为最佳评卷策略。
根据模拟出的结果,进行分析之后得出分组方案还与试卷分数的方差有关,分数离散度越大评卷的次数越小,分数越集中评卷的次数越大。
关键词:系统偏差 计算机模拟 评卷次数
1 问题重述
在确定像数学建模竞赛这种形式比赛的优胜者时,常常要评阅大量的答卷,比如说,有P=100份答卷。一个由J位评阅人组成的小组来完成评阅任务,基于竞赛资金,对于能够聘请的评阅人数量和评阅时间的限制,如果P=100,通常取J=8.
理想的情况是每个评阅人看所有的答案,并将它们一一排序,但这种方法工作量太大。另一种方法是进行一系列筛选,在一次筛选中每个评阅人只看一定数量的的答卷,并给出分数。为了减少所看答卷的数量,考虑如下的筛选方法:如果答卷是排序的,则在每个评阅人给出的排序中排在最下面的30%答卷被淘汰;如果答卷没有排序,而是打分(比如说从1分到100分),则某个截止分数线以下的答卷被淘汰。
这样,通过筛选的答卷重新放在一起返回给评阅小组,重复上述过程,人们关注的是,每个评阅人看的答卷总数要显著地小于P。评阅过程直到剩下W份答卷时停止,这些就是优胜者。当P=100通常取W=3。
你的任务是利用排序、打分及其他方法的组合,确定一种筛选方法,按照这种方法,最后选中的W份答卷只能来自“最好的”2W份答卷(所谓“最好的”是指,我们假定存在着一种评阅人一致赞同的答卷的绝对排序)。例如,用你给出的方法得到的最后3份答卷将全部包括在“最好的”6份答卷中,在所有满足上述要求的方法中,希望你能给出使每个评阅人所看答卷份数最少的一种方法。
注意在打分时存在系统偏差的可能,例如,对于一批答卷,一位评阅人平均给70分,而另一位可能给80分。在你给出的方法中如何调节尺度来适应竞赛参数(P,J和W)的变化?
2 假设与符号
模型假设:
1. 评委的评分具有相对客观性,每份卷子得分的系统偏差是由评委评阅卷子的数量造成的疲劳和每位评委的偏好引起的。
2. 卷子是密封的,评委不会知道评阅的卷子来自那里
3. P份试卷客观上存在优劣,加上得分的系统偏差,逼近客观分,就可以按一定的原则决定是否筛选。
4. 每位评卷老师只对分得的卷子评阅一次,不存在回头重新打分。
5. 每一组里每一份试卷的编号是随机的,等可能性的
6. 抽样出来的试卷,不记到评委评卷的数量中
7. 系统偏差的大小就可以反映本次评分的客观,公平程度和确保最好的试卷一定会被评选出来,且有效的减少了评委的工作量。
8. 评委有可能评同一份试卷不止一次。
符号说明:
:第 阶段,每一个小组的评委数;
:第 阶段的小组数;
:第 阶段时还剩的试卷数;
:给个评委评卷数量;
:系统偏差基值;
其他符号见文中说明
3 模型的建立与模型的建立
3.1 模型的准备
名词解释:
该份卷子的客观分数:所有评卷人看完该份卷子给出的分数相加除以评卷总人数J。
系统偏差:该份卷子的实际分数与客观分数之间的差异。
系统偏差的基值a:J位评卷人对一份试卷评分的最大值与最小值的差。
系统偏差的基值a的求法:
通过对P份试卷先进行随机抽样n份,这n份试卷J位评委都要看,记录评委对每一份试卷的打分; =这份试卷评分的最大值与最小值的差,则
3.2 问题的分析:
减少评委工作量可行性分析
由于最后要选出W份最好的试卷,且P份试卷客观上存在优劣,则对评委的打分加以修正得到一个得分的区间(试卷的真实分数就在这个范围),再把试卷汇总按得分区间进行统计、筛选,剩下的试卷开始下一轮的评分和筛选,且满足最好的W份答卷在下一轮的评卷过程中。每一轮的评分后,试卷数量不断减少,以此达到减少评委工作量的优化工作。
系统偏差模型的建立
一方面,每一份卷子得分的系统偏差 与x个评卷人是否看过该卷子有关,当x=J时,(理想情况),不妨设此时的 =0;x=1时, =a,多少人评阅该份卷子造成的系统偏差不妨设存在一个线性关系,则有:
化简得
,
另一方面,每一份卷子得分的系统偏差 与评委评阅卷子的数量n有关,评阅第一份试卷时,由于没有参照标准且根据我们的假设又必须打出一个分数,则这个分数会存在较大的误差,随着卷子的增多,评阅卷子的个体误差会越来越少,不妨假设评委评完所分卷子的一半时,评卷的误差最小,之后这个误差又会因为评卷的疲劳而逐渐加大,容易想到
这个函数。因为考虑 时,有 , ; , ; , ,满足我们的假设规律:中间小,两端大。
构造这种形式的函数 , 其中A(N)为这一评委评阅N份试卷存在的最大偏差,A(N)这个函数与每位评委的工作能力有关,N较小时,A(N)也较小,随着N的增大,A(N)会趋向一定值 。
需满足:n=1时 =0; 时 = ; 时 = ,由于有三个已知条件构造:
得
取N=6,A(6)=1, 的图像如下:
对于函数A(N)的确定,由于达到某一N时,A(N)会趋向一定值
这里我们考虑 这个形式的函数,此函数具有随着x的增大 最后函数值趋近于1,对于我们的分析随着N的增大,最后函数值趋近于 可得
,u为我们发生指数递减变化的基值,不妨设u=10,即评委每多评10份试卷就会发生指数递减变化。
的估计值,对于一百分的卷子,我们认为一份卷子有10分的误差就很大了,所以 =10综上分析得:
函数图像如下:
则一份卷子总的得分系统偏差
3.3 模型的建立
多阶段逐步优化问题
有P份试卷,J名评委,最后确定W份最好的试卷,这一过程显然要分为m个阶段,每一阶段每个评分小组分到 名评委,每一阶段有: 个小组;每一阶段每个小组分到 ,份答卷,i=1时, 份;i为其他时 份试卷,在这个过程中每名评委评卷的最少数量为: ,且不存在两个评委打分相差很大,还要再互相交换评选的情况。
由 ,这一评卷过程的极限的系统偏差为10,则这一批试卷评卷分数的最大误差为A(N),对排列出来的卷子进行排序后取第W名卷子的成绩减去A(N),得到我们的删去分数sq,w为第W名试卷到删去分数线上保留的试卷数。
由上面的分析,m和 确定了评分过程的精确度 ,定性分析为m和 越大, 越小,
求解他们之间的定量关系
由上面系统偏差的分析pc是关于x和每一阶段评卷数量 的函数,每一阶段的评分误差
目标函数
3.4 模型求解:模拟试探法找出最优方案
P=100份,J=8人,W=3份,由上面的分析经过m轮评卷可以得到最好的W份试卷,当J=8时,为了使每个小组的评委人数相等, 只能取1,2,4,8,依次被分成8组,4组,2组,1组。则本题的分组数目是有限的。
方案的一种情况:(方差较大)
第一轮评卷时,如果一个小组两名评委,因评委差异造成的误差为 = ,N=25时,A(N)=9.24,得删去分数线sq=cj(W)-A(N)。由于评委差异造成的误差a在这一批卷子中广泛存在,对每一个评分小组不予考虑,但对所有试卷的评分误差应当考虑。用计算机编程模拟一次可得按这种方式评卷第一轮后剩下的试卷,结果如下:
每组模拟评卷平均值
第一组 50.4586 50.5179 52.5638 54.3846 61.8498 64.0093 64.0298 64.6009 65.4395
69.3904 69.4423 70.0738 71.4944 71.8256 72.2867 76.5207 79.9103 83.703
84.3747 85.0668 91.2128 91.3471 91.3851 94.1773 96.7922
第二组 55.9356 57.5809 58.8794 60.3263 62.4102 64.0292 67.1366 69.4564 70.9323
72.1643 72.3855 73.9499 74.3238 75.9283 79.1304 80.37 82.1491 82.5952
84.6652 88.1262 90.4984 92.8246 94.8507 95.708 98.5792
第三组 50.1702 52.7608 57.1149 57.9622 57.985 58.1832 59.9765 60.3827 61.6532
62.9578 66.4536 66.9585 70.3921 71.4943 81.1194 81.1536 81.8465 88.7509
88.9076 89.2249 89.8705 90.0938 95.7175 98.879 99.2625
第四组 51.1657 51.3103 56.96 58.1384 59.1115 62.6464 65.8099 68.3016 69.7578
72.3051 73.3734 75.5917 76.0091 76.4902 78.8495 79.5508 82.6154 84.0492
84.2207 84.3644 92.5676 93.3986 93.5495 93.578 97.9657
删去分数线:第一小组: =91.3851-9.24=82.15分
第二小组: =94.8507-9.24=85.61分
第三小组: =95.7175-9.24=86.48分
第四小组: =93.5495-9.24=84.31分
经过这样的评卷方式后,一轮后只剩下28份试卷。(红色标记的为进入下一轮评选的试卷)平均每份试卷的评分误差由 为 +4.8
第二轮评分过程:经过一轮筛选后,由于剩下28份试卷,每组两名评委,因评委差异造成的误差为 = 则需分成4组,每组7份试卷,当N=7时,A(N)= 6.6819同第一问的处理得到删去分数线
用计算机编程模拟一次可得按这种方式评卷第一轮后剩下的试卷,结果如下:
每组模拟评卷平均值
第一组 63.4597 65.7096 70.2225 71.0916 86.6559 88.3193 91.0578
第二组 61.2026 61.5768 69.1897 79.8025 84.1169 85.9179 93.8273
第三组 63.538 75.0732 75.3545 76.0177 76.3117 90.7006 95.6564
第四组 61.027 78.4762 79.7356 82.4587 96.8678 99.3031 99.7591
删去分数线:第一小组: =86.6559-6.6819=79.974分
第二小组: =84.1169-6.6819=77.435分
第三小组: =76.3117-6.6819=69.6298分
第四小组: =96.8678-6.6819=90.1859分
经过这样的评卷方式后,第二轮后只剩下16份试卷。平均每份试卷的评分误差由 为 +3.9
第三轮评分过程:经过一轮筛选后,由于剩下16份试卷,每组四名评委,因评委差异造成的误差为 = 则需分成2组,每组8份试卷,当N=8时,A(N)= 6.8997同第一问的处理得到删去分数线
用计算机编程模拟一次可得按这种方式评卷第一轮后剩下的试卷,结果如下:
每组模拟评卷平均值
第一组 74.5262 75.6896 75.8029 79.0829 79.1385 86.2502 90.4667 90.937
第二组 81.3512 84.8966 87.8069 89.3473 94.6489 95.6097 95.8003 96.9931
删去分数线:第一小组: =86.2502-6.8997=79.3505分
第二小组: =95.6097-6.8997=88.71分
经过这样的评卷方式后,第三轮后只剩下8份试卷。平均每份试卷的评分误差由
为 +4
第四轮评卷:当剩下的试卷较少时,八位评委同时评判评这些试卷,选出前三名,误差为0。
则一名评委在这评卷过程中最少判了 ,判分平均误差为每一阶段判分平均误差相加除以判分阶段,得( +4.8+ +3.9+ +4+0)/4= +3.2
方案的另一种情况:(分差较小)
每组模拟评卷平均值
第一组 60.0068 60.6767 61.3358 62.0474 62.7297 62.8169 64.8335 66.2297 66.6474
68.253 69.1905 70.069 70.7405 72.2999 74.63 75.4464 79.1466 79.828
80.215 81.7503 81.8153 84.5068 86.1155 88.146 88.9237
第二组 61.7843 62.821 64.705 67.5835 70.349 70.4173 70.6315 71.7485 72.4906
73.4984 74.0993 78.896 79.525 79.6905 81.5524 81.858 82.2692 82.2893
84.984 85.4403 86.0746 86.5207 88.1938 88.653 88.7464
第三组 60.0012 61.15 61.7456 63.9371 65.5347 66.8231 67.5503 69.4119 69.7675
69.8365 71.4023 72.9897 73.5672 73.6718 74.1677 74.8462 75.2454 76.2656
79.6795 83.6077 85.2715 85.6559 85.8926 86.5944 86.9841
第四组 61.9594 63.0893 64.0223 64.7495 64.9026 67.5807 70.2618 71.2057 71.2543
73.7222 74.5207 74.5919 74.8818 75.7111 76.9719 77.5466 78.2926 78.357
82.8378 83.9761 84.1859 85.2958 85.7336 86.513 89.0838
删去分数线:第一小组: =86.1155-9.24=76.8755分
第二小组: =88.1938-9.24=78.9538分
第三小组: =85.8926-9.24=76.6526分
第四小组: =85.7336-9.24=76.4936分
经过这样的评卷方式后,一轮后只剩下40份试卷。平均每份试卷的评分误差由 为 +4.8
第二轮评分过程:经过一轮筛选后,由于剩下40份试卷,每组两名评委,因评委差异造成的误差为 = 则需分成4组,每组10份试卷,当N=10时,A(N)= 7.3106 同第一问的处理得到删去分数线
每组模拟评卷平均值
第一组 65.7746 67.1855 70.0174 71.7169 74.6968 75.3412 78.964 79.0103 79.6375 84.6064
第二组 66.2302 66.6595 67.3959 70.1043 71.4845 76.0737 78.6587 80.154 80.9249 88.3307
第三组 67.3989 71.2276 74.3573 75.8757 80.7375 81.0419 84.9598 86.9577 88.1219 89.5285
第四组 66.6173 66.7012 68.633 69.288 72.1086 74.2701 78.1871 78.6202 78.6411 85.9094
删去分数线:第一小组: =79.0103-7.3106 =71.6997分
第二小组: =80.154-7.3106 =72.8434分
第三小组: =86.9577-7.3106 =79.6451分
第四小组: =78.6202-7.3106 =71.3096分
经过这样的评卷方式后,第二轮后只剩下24份试卷。平均每份试卷的评分误差由 为 +4.2
第三轮评分过程:经过一轮筛选后,由于剩下24份试卷,每组2名评委,因评委差异造成的误差为 = 则需分成4组,每组6份试卷,当N=6时,A(N)= 6.4566同第一问的处理得到删去分数线。An =6.4566
每组模拟评卷平均值
第一组 72.4099 72.6794 80.2947 86.4802 87.6957 89.2727
第二组 70.9658 77.5391 77.603 78.0278 78.2558 78.4199
第三组 73.2596 77.4813 83.4032 84.973 88.1467 89.2368
第四组 70.7712 77.4462 79.0847 81.2486 85.8557 85.9046
删去分数线:第一小组: =86.4802- 6.4566 =80.0236分
第二小组: =78.0278- 6.4566 =71.5712分
第三小组: =84.973- 6.4566 =78.5164分
第四小组: =81.2486- 6.4566 =74.792分
经过这样的评卷方式后,第三轮后只剩下18份试卷。平均每份试卷的评分误差由 为 +4.6
第四轮评分过程:经过一轮筛选后,由于剩下18份试卷,每组4名评委,因评委差异造成的误差为 = 则需分成2组,每组9份试卷,当N=9时,A(N)= 7.1095同第一问的处理得到删去分数线
每组模拟评卷平均值
第一组 68.3527 70.552 74.7274 76.5126 82.1811 87.1373 90.7125 90.8709 92.0494
第二组 69.1919 69.839 72.3709 83.0395 83.1237 89.5809 91.4946 91.9276 94.3576
删去分数线:第一小组: =90.7125-6.4566=84.2559分
第二小组: =91.4946-6.4566=85.038分
经过这样的评卷方式后,第四轮后只剩下8份试卷。平均每份试卷的评分误差由 为 +4.8
第五轮评卷:当剩下的试卷较少时,八位评委同时评判评这些试卷,选出前三名,误差为0。
则一名评委在这评卷过程中最少判了 ,判分平均误差为每一阶段判分平均误差相加除以判分阶段,得( +4.8+ +4.2+ +4.6+ +4.8+0)/5= +3.68
通过上面的分析每一轮评选剩下的试卷数量,直接影响评委的工作量,若这批卷子质量都较好,分数较近。则被保留的的试卷较多,评委需经过多轮评分才能评出最后的W份。
若这批卷子分数相差很大,则被保留的的试卷较少,评委经过较少的评分就能评出最后的W份。
模型的最优解具有很大的随机性,直接与计算机模拟出来的分数的方差有关。
参考文献:
1. 宋来忠、王志明《数学建模与实验》科学出版社 2005年出版
链接: https://pan.baidu.com/s/111GLYy7DR5lpj6tSQrjzwg 提取码: x86q
扫描二维码推送至手机访问。
版权声明:本文由爱一流网发布,如需转载请注明出处。
免责声明:本站所有资源搜集整理于互联网或者网友提供,仅供学习与交流使用,如果不小心侵犯到你的权益,请及时联系我们删除该资源。