黑蓝论坛

标题: 第六届评委们的集体打分情况 [打印本页]

作者: 文沁可人    时间: 2007-8-4 13:25
标题: 第六届评委们的集体打分情况
最后的打分情况:
马骥因病弃权,宇文光因为是被评者之一,不参与打分。
           《何时种下隐疾》    《过年》
流马          80          85
赵松          80          85
洪洋          84          79
凌丁          90          80
七格          80          100
鲁毅          60          40
陈舸          75          85
顾耀峰         90          80
恐怖爱丽丝    87          83
每位被评者去掉一个最高分,去掉一个最低分,取平均分。
  《何时种下隐疾》    《过年》
     82.29                82.43
作者: 凌丁    时间: 2007-8-4 13:25
确实是险胜啊。如果是按票选,宇文光就输了,如果算总分,宇文光也是输9分,但去掉最高分最低分之后,宇文光就反超1分。实在惊险。


[此贴子已经被作者于2005-4-3 15:06:03编辑过]

作者: 黑天才    时间: 2007-8-4 13:25
残酷!
作者: 七格    时间: 2007-8-4 13:25
这种算法不合理。
每个评委对分数的感觉不一样。由于没有标准评分格式,这样不一样的感觉将在百分制里放大感觉差异,也就是说,明明两个人都觉得A比B要好两倍,但是,A给的分数是100,50,B给的,却是10,5。这样,绝对数字就差了45分。即便有最高最低分扣除,仍旧不能避免以上弊端。因为比如,要是有人的评分是100,99,意思是两人差异很细微,这和评分为85,80的意思差不多,但更靠近,可是,按照目前这算法,这两个分数都将作为最高分被排除掉,然而,其实它们应该在85,80里面,应该是不能排除掉的。


正确算法应该是每个评委各自的分数按相对比例统一到一个基数上。
这样,以宇文光的分数为基数100进行去除分数感觉差异处理,则调整后的数字列表为:

流马          94         100
赵松          94         100
洪洋          106         100
凌丁          113         100
七格          80         100
鲁毅          150         100
陈舸          88         100
顾耀峰       113         100
恐怖爱丽丝 105         100

此时,在左栏里,就可以看出,谁的比例值差异最大,如果去掉最大的和最小的各一个,则
最后结果是:

《何时种下隐疾》    《过年》
102                       100

如果按照本次规则,去掉的分数得是4个,则需要是去掉最大和最小各两个,则最后结果是:

《何时种下隐疾》    《过年》
102                        100

因此,最后的胜利者应该是双瞳。

很遗憾,我事先不知道委员会是这样计算打分的,所以现在提出异议可能已经晚了,但无论如何,从逻辑上来说,我这么计算的结果是合理的,虽然这么做也说明不了谁的确比谁更好,只是出于程序正确上的原因,我必须把这点说清楚。


请评委会仔细考虑,我个人建议,修正本次得奖人选,应该是双瞳获奖。
对不起,宇文光,下次我请你吃饭。
作者: 文沁可人    时间: 2007-8-4 13:25
终于,七格提出了这个问题。
这确实是个问题。昨天在分数打出来的时候我就有这种疑问,可是时间实在仓促——我们已经比规定的时间推迟了两天——一时没想出办法来怎么解决。凌丁顾耀峰等评委也发现这个憋端,大家就这个问题讨论了一天,在发这个贴子之前,还在讨论。毛病原因在于打分制根本就无法合理上。即是象七格这种算法也难以合理。因此,要依此修改,也是不合理的。
宇文光获得此届小说奖,是完全按着即定程序进行之后的结果,它不能改变。——如要改变,也得是在新的规则之下才行。但此届依据的还是原有的规则。这种情况下,改变对宇文光也是不公平的。你说是不是呢,七格?因此这个结果,有效。

黑蓝小说评委会正在修改评奖制度,以使它更加完善。
黑蓝小说评委会们为自身制度的不合理向双瞳致以最诚挚的歉意,并且在想办法补救。
谢谢大家。
作者: 陶北    时间: 2007-8-4 13:25
比官方小说奖公正多啦。赞成完善评奖制度
作者: 宇文光    时间: 2007-8-4 13:25
hehe,给双瞳我也没意见,本来我投的就是双瞳
我有一个疑问,洪洋给的分数有没有弄错啊,票选时他投的是我嘛。。。嘎嘎
作者: 七格    时间: 2007-8-4 13:25
改变当然对宇文光不公平,但我要是宇文光就会要求改变。这个世界上没有什么能够凌驾合理性,包括合法性。
因为规则是人定的,没有什么不可追溯的理由,判了人死刑,枪决了都要改判,怎可下不为例?当合法性和合理性发生冲突时,我们究竟是要维护哪一样?发现弊端,竟然为了追时间而就这么推出,这也是有问题,我自己也要承担部分责任,没有及时回复终评结果,也没有更积极地去询问打分机制,这是我的不是。

而且,我想知道我那算法的不合理之处在哪里?任何算法总有不合理之处。但第一,要明示,第二,要看它是否比原先的要进步,如果进步,那么就相对合理。

当然,最后评委会可以引用权威资源,拒绝改变,我也会遵从。但在逻辑上,我没有被说服。
作者: 文沁可人    时间: 2007-8-4 13:25
亲爱的七格先生,您的不合理之处在于您加大了评委们打分高低之间的差。而这个差并不是评委们的真实反映,如果本着这个差的比例系数不变——偶尔想的到,而且我还试着找了找在系数不变的情况下的算法——而能把他们归到同一基数下来算,可能就更合理一点。
我承认您的算法要比原算法科学的多,也就是相对合理,但是我们追求的不是相对的合理呀,而是要在尽可能的情况下做到绝对合理。——不过世上有没有绝对合理的事?
打分制会被全完放弃。而采用投票制,只要保持评委单数,这方法就是最科学的。



[此贴子已经被作者于2005-4-4 14:58:43编辑过]

作者: 凌丁    时间: 2007-8-4 13:25
举个例子来说,假如我在百分制的情况下给了3分和2分,其实这表明两个意思,第一,两篇文章都得低分,第二,前一篇文章只比后一篇文章高1分,之间是差值关系,而不是倍数关系。假如按比例换算成150:100,则非我所愿,我可能觉得101:100更符合我的本意,等等。
用打分来评价文章的做法并不可取。要做的应是放弃打分制而不是修正算法以继续沿用打分制。
作者: 七格    时间: 2007-8-4 13:25
凌丁和文沁可人:我就是不同意评分中含有差值关系,所以才会发贴提出疑问。

我的思路是这样的:跳水比赛时评委会也是打分制,但是,他们的评分方法是:

首先,确定难度系数。
将跳水动作分为6组:面对池向前跳水、面对板或台向后跳水、面对池反身跳水、面对板或台向内跳水、转体跳水和臂立跳水,然后,将空中姿势又分为:直体、屈体、抱膝、翻腾兼转体的任意姿势,最后,根据动作组别、竞赛项目、动作姿势、器械高度、翻腾转体周数决定难度系数。

其次,裁判主观打分:
失败 0分
不好 0.5~2分
普通 2.5—4·5分
较好 5~6分
很好 6.5~8分
最好 8~10分

这里开始含有差值关系,但是,即便如此,这个差值也有客观标准:助跑、起跳、空中动作、入水动作都是可分解的,比如,要是运动员助跑平稳,起跳有力,角度优美,高度不错,空中优美,翻腾紧凑,转体快速,入水垂直,压水花技术出色,则分数就高。

最后,将5名裁判员打出分数以后,先删去最高和最低的无效分,余下3名裁判员的分数之和乘以运动员所跳动作的难度系数,便得出该动作的实得分。

可见,这套体系也是尽可能压低差值关系,而且它没有用100分这样从上面压下来的数字,而是向上开放的,之所以这么做,是因为每个人对数字的大小感觉差异太大。
反过来,我们在一百分里打分时,心里有没有一套对什么是好的小说的标准体系?或者说,事先黑蓝有没有提供一套现成的打分依据?如果没有,就这么凭感觉打,准会出入很大。所以,如果存在那种差值关系,也必须消除掉,因为它本身就不合理。
但是,在两篇或以上的小说里互相比较,就会产生相对好相对坏的感觉,这个感觉是存在的,要是换算成数字,那就不是绝对数值而是相对数值。
因此,凌丁举的例子里,第一层的意思必须被放弃,只保留第二层的意思,并放大这第二层的意思,即便那样不符合打分者的本意。--那样子做,其实走向极端之后的就是放弃打分制,而是非此即彼的单数评委的二元投票制。但要那样,结果仍旧需要更改。

但既然这样等于宣告打分数本身就不合理,那么在逻辑上我也放弃要求重新打分的建议。
不过我想评委会应该有其他措施来弥补这些由于程序本身的缺陷造成的不公平。
并希望下次打分时,采用文沁可人你说的单数评委二元投票制,如果再发生这样事情的话。
作者: 凌丁    时间: 2007-8-4 13:25
黑蓝确实没能也没有必要提供一套现成的对文章的打分依据。
感觉上的东西很难精确量化,也不宜量化。应尽量避免数字,除了统计票数,呵呵。

正在筹措建立新的机制。

“但既然这样等于宣告打分数本身就不合理,那么在逻辑上我也放弃要求重新打分的建议。
不过我想评委会应该有其他措施来弥补这些由于程序本身的缺陷造成的不公平。
并希望下次打分时,采用文沁可人你说的单数评委二元投票制,如果再发生这样事情的话。


很高兴得到这样的共识。
作者: 文沁可人    时间: 2007-8-4 13:25
不错。还有一种情况下得考虑。
这次宇文光因为是作者之一,不参与打分,马骥因病不参与打分并评选,所以,参与评选的评委还是单数。但下次如果也遇到这种情况,也就是说出现并列且作者之一是评委,不同条件是换马骥参与评选并打分,这种的情况下,最后投票的评委是十个人,又是双数了,怎么办?
作者: 凌丁    时间: 2007-8-4 13:25
可以设置机动评委一到两名,以保证评委人数为单数。这些细节正在考虑。新的机制拟定后可以先把草案贴出,请大家献计献策,都来当当诸葛亮。最后再确定。
作者: 七格    时间: 2007-8-4 13:25
哈哈这还不简单,我下一次不参加评委了就是,这叫未雨绸缪!
作者: 文沁可人    时间: 2007-8-4 13:25
不许!程序上不允许任何一位在前期都参与评选最后决定胜负的时候离开,无论是主动的还是被动的,一旦开了这个先河,绝对会乱套。倒是凌丁说的设机动评委的办法可行。
作者: 陈卫    时间: 2007-8-4 13:25
后面的讨论涉及两个问题:1、评选规则的漏洞,2、已经评出的结果是否有效。
第1点,根据大家的发现,已经得到肯定。但是,发现评选规则的漏洞是否意味着已经评出的结果的无效呢?答案是否定的。
这是因为,发现规则的漏洞的时间,在结果评出之后——这个时间非常重要,它意味着对规则的漏洞的发现,已经过了第六届季度奖的有效期。
而衡量已经评出的结果是否有效,依凭两点:有效期内的评选规则和对它的执行。
首先,评选规则是完全有效的。它不是一个秘密文件,它从本届季度奖开始即已公布于众,直至结果得出并且公布的那一刻,没有任何人包括任何评委对它提出异议,这意味着大家始终接受它的有效性(包括它没有被发现的漏洞)。
其次,所有的执行不仅没有出现任何规则之外的操作,而且完全按照规则办事,——无疑它是有效的。
而在有效期之后,各种各样的质疑、探讨、争论、包括提出新的更为合理的理解,首先都是好事,但它们不能影响已经评出的结果的有效性;有效期后的“更合理”,已经在大家原先接受的“游戏规则”之外,并且几乎每个“更合理”之后仍有另一个“更合理”,所以趋于边界无限;“更合理”的愿望只能建立在对未来的设想,而过去则无法也不必修改。
很简单的同类例子是:几乎所有的体育比赛的规则也在不断修改、完善,但不能因为每次修改、完善而否定前面比赛的结果。
所以,我们必须限定事情的边界来确定它的有效性。事后对季度奖评选规则漏洞的发现、修改、完善等所有事宜,实际上已经是另一个问题,它代表了我们的认真和对未来的要求,但确实和本届季度奖的结果无关。
结论:
1、已经得出的第六届黑蓝小说季度奖结果完全遵守有效规则执行评选,因此它是有效、并且是惟一有效的。
2、尽管每届都在完善,但第六届黑蓝小说季度奖的评选规则在评选结束之后被发现仍旧有漏洞——这是我们的疏忽,这疏忽给双瞳等朋友带来损伤,我们深感愧疚和不安,可是这无疑不是我们的希望,毕竟有些经验只能在错误中成长。接下来数日我们将再次仔细考察季度奖的评选规则,接受已经收到的各种意见和建议,对它作出新的完善,以期在以后的季度奖中至少不发生曾经的遗憾。

无论如何,七格的认真严谨和凌丁、文沁可人,以及所有评委的尽心尽力,都是黑蓝小说季度奖走向更加完善更加公平和公正的保证,也是季度奖的动力,我们充满感激。所以也盼望所有朋友继续提出宝贵意见,我们一定认真考虑。
作者: 七格    时间: 2007-8-4 13:25
弄了贴回好像失败了,再贴一次。

原先那个以宇文光为100做基准也是有问题,因为那是有偏的相对比较,要做无偏,应该以每个评委自己的两个分数的距离和距离中值的比值来做,比如(80-100)/100,这样连最高最低都不要去,因为每个评委自己的分数距离的比值是相对好多少差多少的反映。

这样计算下来,双瞳高2%。
作者: 文沁可人    时间: 2007-8-4 13:25
这个算法,偶昨天算来着,因为结果一样,偶就没贴出来,要是相反,偶就会贴出来反驳你了。:-(
你们这帮家伙呀,定规则的时候数学和哲学头脑都哪去了?宇文光学哲学的,凌丁是理科的基础,七格理科不说还特迷哲学和数学,当时你们都哪去了?规则贴了那么长时间怎么没人想想这里的漏洞?
作者: 宇文光    时间: 2007-8-4 13:25
可以这样,通常投票是每个评委一票,投给某一选手1票,投给另一选手0票。现在为了避免平局(我想这也是打分制的初衷),将投票制稍微改动一下,每个评委仍然一票,但可投小数票,比如投一选手0.4票,投另一选手0.6票,即两票加起来必须等于1,以保证每个评委的权力相等。

如果嫌小数不舒服,可以对此方法略加修改,比如每个评委有两票,可以都投给一人,也可各投一票。

总之这个方法乃是取消了打分制,将投票制细化,只取相对差异,不管绝对价值。缺点是,比起单数评委投票制,仍然有可能产生平局(对此可以提高精度以降低其概率);优点是,不必保证评委一定单数。
作者: 文沁可人    时间: 2007-8-4 13:25
不错,这样可以免设机动评委。但依然无法绝对避免平局的可能啊。
作者: 七格    时间: 2007-8-4 13:25
要还平局,那就是天意了,天意不可违,并列第一便是~:-p
作者: 双瞳    时间: 2007-8-4 13:25
这么麻烦啊。我的英文名字本来叫Hungry(夯格瑞),现在正式改成Sorry(梭瑞)。我就不具体看你们到底探讨什么了。可能因为我是新人,各位评委在打分时可能手下留情了,才让我有机会进入最后评选,再次谢各位。当然,更谢耐心看完我小说的朋友。写出来,被阅读,能交流,或许会有进步的可能,是最重要的。
作者: 赵松    时间: 2007-8-4 13:25
实际上问题就出在不该用打分的方式来解决票数相等的问题。还是要以投票的方式来解决票数相等的问题。而且要保证有奇数的评委,不允许弃权,这就可以了。
作者: 凌丁    时间: 2007-8-4 13:25
机动评委其实是可行的。也不难操作。陈卫或者马骥来顶这个缸就行,只在持平并且评委人数为偶数时献身。即使4名并列也不要紧,多投两次,总能确定一个。

宇文光的算法确实也不错,但0.6和0.4也不易把握。
我觉得,相对好点的就是满分,相对差点的就是零分,要么是1,要么是0,都二进制表示,这样更方便一些。

古人云:世界上只有10种人,一种是懂二进制的人,一种是不懂二进制的人。:)
作者: 双瞳    时间: 2007-8-4 13:26
咦?昨天我下线之前看到一个巨幽默的帖子被删掉了:(
作者: 双瞳    时间: 2007-8-4 13:26
我还想今天来把这段保存下来,网上从来没找到过《永别了武器》的电子版。请昨天跟帖的朋友(时间匆忙我没记住你叫啥[em25]),,能不能偷偷告诉我你从哪里来的这一段?
作者: 文沁可人    时间: 2007-8-4 13:26
那家伙叫凉拖。我删的,因为我觉得他贴错了版面。
作者: 文沁可人    时间: 2007-8-4 13:26
扣了吗?一开始我是每样误加了四十分,然后我又扣掉了,是不是没加上反而扣掉了呀?下一次给你补过来噢。




欢迎光临 黑蓝论坛 (http://www.heilan.com/forum/) Powered by Discuz! X2.5