关于大学生作业查重与成绩评定若干问题的思考

发布时间 2023-09-24 16:28:19作者: Flash_Hu

写在前面

为什么更这样一篇非技术向的博客?

大学三年以来,见证了许许多多的事情,有些事情更是亲身经历。它们引发了学生与学生、与老师、与校方制度的一系列矛盾,并且这样的矛盾在不同的时间、不同的课程也常常重复地上演。

这样的矛盾也冲击着我的认知体系,促使着我不断反思自己的态度和行为。

本文试着追根溯源,从成绩评定的公正性原则出发来探讨这些问题。

成绩评定的公正性原则

成绩评定是对学生学习效果的一种衡量。

我们希望成绩评定遵循公正性原则,也就是学会了的同学给更高的分。

这样做的意义在于对学生认真学习起促进作用,引导学得好的同学继续保持,不好的同学反思问题。

学校和老师制定一系列机制来维护这样的公正性,比如学术诚信规定、每门课的评分细则等。

然而机制总有失灵的时候,比如作业查重常常引起一些争议性的问题。

关于作业查重的扣分评定

分享作业行为的部分合理性

抄袭作业是一种屡见不鲜的行为。我们引入学术诚信规定,对作业进行查重,对写出重复度过高的作业的同学做出扣分等处罚。

什么是学术诚信呢?我认为指的是尊重上文提到的成绩评定原则的公正性原则,不会为了提高成绩而做出有悖原则的行为,比如抄袭作业、抄袭论文、考试作弊等。

我反思了自己:我给过其他同学自己的作业,也向其他同学要过作业。

我因为给作业被抄袭而扣过分,但从没有因为抄袭其他同学作业而扣过分。

究其原因,是我尊重成绩评定的原则,在认真学习并理解其他同学作业思路之后,根据理解写出自己的答案,而并非直接复制他人的答案。如果没有学会,则一定不会抄上去。

这样的话,分享作业等效于交流学习思路。实际上也确实如此,我会因为不愿因为交流占用同学时间而选择直接索要作业,也会在时间充足的时候选择与同学交流而不是直接给作业。

因此,我认为分享作业本身并不是一种不合理的行为,相反这是交流思路的一种形式。只有贪图通过直接复制答案而获得分数的行为才应该得到惩罚。

在学术诚信规定中有提到禁止分享作业,我觉得这一规定是出于威慑性考虑,让向他人分享作业的同学三思而后行。

但我三思之后还是觉得可以分享作业,不过应该多做一件事:确认一下被分享同学的作业看起来是不是抄袭,这样也是尊重成绩评定原则,对自己和他人负责。

查重的机制设计

事实上,作业查重也只能分辨出直接抄袭的作业,分辨不出通过他人作业学习思路的作业。

在有一定可能出现两个独立完成作业的同学作业相似度高的时候,单凭作业相似度高我们也无法认定抄袭。

查重的流程一般是这样的:发现一对疑似抄袭的作业,通知学生有一次argue的机会,如果argue,学生需要证明作业是自己所写,老师和助教会问作业中的细节问题,来考察学生是否熟悉作业的思路。

但是否选择argue,argue的表现会影响扣分。目前不同课程的这个扣分机制很不一样。

选择不argue直接承认的话,有的课只扣当题或者当次作业的分数,有的可能更严重,有的考虑主动与被动承认;

argue成功的话不扣分,但失败了可能会扣更多的分,甚至直接挂科。

学习了赵登吉老师的算法博弈导论课程后,我们可以从机制设计的角度来分析这个问题。

一个好的机制需要具有激励相容(IC)性质,即同学汇报各自的真实情况是占优策略。

在argue中,我们更需要唯一的占优策略,也就是汇报虚假情况不能同时是占优的。

因此需要满足不抄作业比抄作业更优、如果抄了承认比argue更优、如果没抄argue更优。

那么至少要满足不能只扣涉嫌抄袭的题的分数,不然在抄袭也有可能蒙混过关的情况下,抄袭是占优策略;

至少要满足如果抄袭了,argue失败了要比承认扣的分更多,不然argue成了占优策略。

但你校有一个奇葩规定导致了扣分少不一定比扣分多更优,那就是不挂科不能重修。

因为抄袭了无论如何都会导致被扣分,绩点降低,所以有一部分同学希望重修来让绩点变得更好。但是不挂科不能重修,所以他们有可能宁愿选择更恶劣的方式来扣更多分导致挂科,而不是扣较少的分却没挂科。

目前可能的解决方案是请求教务处修改与重修相关的规定,比如重修等级最高C+。

关于黑盒机制

有些课的扣分机制是公开的,但有些课没有公开,有同学对黑盒机制表示了不满。

我认为公开的机制更好。

如果不公开,那么涉嫌抄袭的同学无法确定自己该做出怎样的策略,除非强行相信机制的IC性质。并且机制也是人制定的,可能助教还是会透露,然后有一部分同学得知以后做出了最优策略,导致机制失去了公平性。

关于被判定抄袭但能顺利理解思路的情况

有一个问题是,如果有同学先是抄袭,之后掌握了思路,并且通过了argue的问题考验,如何扣分?

从实践来看,除了作业、代码完全一模一样的极端情况,查重很难将这种情况与未抄袭区别开来,因此算放过了。

从成绩评定原则的角度,掌握了学习思路,虽然迟了,还是可以部分肯定的。

关于主动抄袭和被动抄袭同罪

我校在对新同学的学术诚信教育中,非常强调被抄袭与抄袭同罪这一点,比如说代码放在公开的Github仓库里被抄了,有被抄袭者的责任;甚至代码在不知情的情况下被复制走了,还是有被抄袭者的责任,说要记得锁屏。

虽然学术诚信规定是这么说的,但我认为被抄袭但通过argue某些情况下不需要扣分。

原因之一,为了遵循同罪规定去让同学们被迫不能放公开仓库、小心翼翼锁屏,无疑表明同罪规定带来了负面影响,为何不换负面影响更小的。

原因之二,被抄袭者是掌握学习思路的,从成绩评定公正性的角度来看无可厚非。

原因之三,如果同罪,那么机制就不IC了,因为被抄袭者在不知道抄袭者策略的情况下无法确定最优策略:如果抄袭者argue蒙混过关,那么被抄袭者argue更优,但抄袭者承认了或者argue失败了则被抄袭者承认更优。现实中时常发生被抄袭者准备argue,但抄袭者直接承认了的情况,不得不说十分尴尬。

总体而言,我虽然理解同罪规定的威慑意义,但也有负面影响,如果强行落实肯定会导致没有让他人抄袭主观故意的被抄袭同学的强烈不满。所以在实际操作时,我认为有两种可行方案:

  • 调查清楚事件来龙去脉,判断被抄袭者是否存在不负责任的分享作业行为:

    • 被动分享的,比如不知情的情况下被复制走了,被抄袭者不扣分;

    • 主动直接分享的,比如发代码给别人,被抄袭者扣分;

    • 主动非直接分享的,比如代码放在公开的Github仓库里被抄了,得分情况了,我觉得当学期的作业内容就不该主动分享了,但如果真是以前写的东西刚好和当学期作业撞题了,应该不扣分。

  • 如果调查的精力成本不可接受的话,就放过通过argue考验的人算了

配合查重的题目设计

思维和过程的多样性

前面提到单凭作业相似度高我们也无法认定抄袭,这出现在选择、填空等客观题和非常简单的证明、代码题中。

概括起来,决定我们能否认定的因素是题目本身思维和过程的多样性。查重只能应用在多样性高的题目中。

反过来说,为了测出抄袭行为,我们要尽可能出多样性高的题目。

但这无疑增加了老师和助教批改的负担,因为多样性高的题评分标准往往会更复杂。

然而编程题算是个例外,目前只有编程作业的查重形成了成熟的体系,其它形式作业的查重还是太依赖人工精力了。

原题与创新题

抄袭的另一个来源是这门课以及其他来源的以前出现过的真题答案。

如果想要避免这些来源的抄袭可能,就得避免出原题,而是发明新的题目。

创新题的问题之一是,很多时候都不如经典老题那样更加易懂易学、启发思考,并不是学生上手学习的最佳选择。

创新题的问题之二是,需要助教们的大量精力用在发散思考、造测试数据等方面,还并不能保证有稳定高质量的产出。

就我当过助教的SI100、CS100、CS101、CS110课程中,助教们都在努力出创新题,但还是时常有题意不清、题目太难、数据错误等问题给同学带来麻烦;

而在很多课程中(尤其是应用数学类课),由于知识领域本身的限制,加上助教人手不足,更是难以出创新题,只好经常复用老题。

这与学生们对历年课程内容透明共享的期待产生了矛盾。

我们有一个iTechX平台,由学生自发支持维护,共享历年课程的课件、作业、试卷等资料,便于我们更好地理解学习、考试内容。

但在某些任课老师的强烈不满下,那些课程的资料被永远移除了,这肯定是原题给老师带来的困境。

也许,这永远是一个两难的问题。