萌战吧 关注:950,602贴子:31,328,790

关于评分标准的确立与评价体系的构建

只看楼主收藏回复

在bangumi上浏览《歌剧少女》评论的时候发现一个用户表示总体赞赏却只打了5/10星,于是好奇点进该用户主页,发现有对其评分尺度有如图解释。
本来我是不热衷于在评价作品时用打分数的方式来表示的,因为我认为一维的绝对的数字并不能有效地映射综合艺术所包含的众多维度指标的高低,然而逐渐我也发现仍然要有一个易于量化的相对标准,才能更好地与别人交流对作品的评价。
于是我抽空量化了出了我原本的相对评价体系,分成十个等级映射到bgm上的最低1星最高10星的十分制上,并在bgm上把我看过的绝大多数作品条目打上了星数,标准如图所示。
现在想和大家交流一下,关于各位的评分体系是怎样构建的,是否会在比较作品时使用打分机制,是如何映射分数区间的等等问题,包括对bgm自带的评分指导意见(1: 不忍直视~10: 超神作)的理解,是否会参考指导词打分。


IP属地:北京来自iPhone客户端1楼2021-09-26 21:22回复
    首先,详细或举例解释一下我的标准,我以我这辈子看过的所有作品中最差的一部作品为最低基准,相对的最好的一部为满分基准,中间按照正态分布模型将作品质量折合成近似标准分数的形式等分成10个等级,也就是说按此标准应用到现存所有作品中,五六分的作品数量应最多。


    IP属地:北京来自iPhone客户端2楼2021-09-26 21:30
    回复
      最低一档是四星制的零星,也就是bgm上的1~2星。
      一星:精神污染,指看完之后会对观众的心理健康产生破坏作用,质量低至有害的程度,这个等级的作品在日本动画届目前我还找不出一个我看过的例子,一定要举动画的例子的话,大概《雷锋的故事》可以算作此中代表。
      二星:一无是处,如果说上一个等级是负分,那这个等级就是真正的零分,指从上到下都找不到任何可以称赞甚至容忍的部分,这个等级我也找不到我看过的合适的例子,因为到这个级别了,我一般会在查阅评价之后选择不看。


      IP属地:北京来自iPhone客户端3楼2021-09-26 21:34
      回复
        我的评分以6为基础线,但结果是以7为中心的正态分布;构建方法是作品之间的横向比较,我认为这样会比较准确,不会出现我认为A比B好但是评分却是B的高这种情况。PS:这用户我看到好多回了,每次看他写一堆溢美之词结果却打个五星六星实在是不好受。


        IP属地:浙江来自Android客户端4楼2021-09-26 21:38
        回复
          理论上讲如果每个人的打分数量都足够多,那么彼此的评分标准不一样并不会影响各番剧的平均分排位啊


          IP属地:黑龙江5楼2021-09-26 21:41
          收起回复
            接下来是四星制的一星,也就是bgm上的3~4星。
            三星:罄竹难书,指作品的问题多到数不过来,而优点屈指可数,目前达到这个等级的动画已经是我看过的里面最难看的一批了,本季的重制人生就在此等。
            四星:一言难尽,指作品的问题已经严重到明显压倒了作品的可取之处,在我看过的作品中此等的代表有魔禁3,邦邦1。


            IP属地:北京来自iPhone客户端6楼2021-09-26 21:42
            回复
              10分制本身就是个很不合理的设计,5分制顶天了,对应极差,差到平庸,平庸,平庸到优秀,优秀已经足够了。
              整个10分这么大的区间完全是冗余设计,反而让人难以把喜好映射过去。


              IP属地:上海7楼2021-09-26 21:42
              收起回复
                然后是四星制的两星,也就是bgm上的5~6星。
                五星:庸碌之辈,指优点缺点相抵,或干脆就挑不出任何优点,但也没什么大毛病。这一档和下一档构成了所有作品中数量最多的一个等级,我评价体系中归到这一等的作品有突击莉莉和目前的八集魔纪2。
                六星:差强人意,及格的一档,和上一档区别在于这个等级的作品的问题均处在可以接受的范围内,或者可以做到瑕不掩瑜。魔法纪录第一季在这一档。


                IP属地:北京来自iPhone客户端8楼2021-09-26 21:52
                回复
                  作为玩家,我对评价体系是非常不看好的。一是评价终究是主观的问题;二是不同类型的作品评价标准需要特化,这一步很难操作,当像素游戏和3d大作共用同一套标准时,我就觉得评分没有任何价值了


                  IP属地:重庆9楼2021-09-26 21:52
                  收起回复
                    四星制的三星,bgm上的7~8分,构成了我实际上给出最多的分数段,因为我不是随机看任意作品,而是会先浏览评价并以此做出我是否要观看的决策,因此筛掉了大部分我可能会给差评的作品。
                    七星:水准之上,在及格的基础上有足够多的优点,较高的完成度和没有明显的问题。基本上大家都喜闻乐见的优秀作品都会出现在这里,比如LL虹学会。
                    八星:出类拔萃,在上一档的基础上在某些方面有重大突破,或有足够独特的魅力,值得我反复观看以及向别人推荐的一类作品。从这一档开始我个人的审美取向就有了更大的权重,典型例子包括少女歌剧和歌剧少女。


                    IP属地:北京来自iPhone客户端10楼2021-09-26 22:06
                    回复
                      四星满分最高档,bgm上的9~10星,依据我的标准,我很少给出这个档位的分数,不过相比于最低的两档还是多一些。
                      九星:至臻化境,指做到了近乎完美的标杆级作品,在多项指标上有超凡脱俗的成就,几乎会锁定当年的年度最佳,有着极高的完成度。近两几年只有2部作品被我打到了这一分数段,分别是小南极和佐贺1。
                      十星:名垂青史,这个就不用多解释了,在我看过的两百多部日本电视动画中,只有两部被我打了满分,新世纪福音战士和白箱。没有提及的作品并不代表我不认为它有多好,而很可能因为我暂时还没有看过。


                      IP属地:北京来自iPhone客户端11楼2021-09-26 22:18
                      回复
                        标准描述完毕,那么我按照这个标准审视我们现在能看到的一些作品,就会发现很多关于质量争论,在此标准下无非只有一分的区别,比如超级巨星。在此要强调一下,我不会在没有看完的时候就打分,我仅推测,如果按照目前的水平延续到结局,预计我会给星团6分,和水团第一季一致(2我没看)。而我给缪两季和虹都是7分,尽管这几部作品之间的质量是有鲜明的距离的,但放在我这完整的评价尺度,当中并不构成什么悬殊的差距。


                        IP属地:北京来自iPhone客户端12楼2021-09-26 22:31
                        回复
                          按指导词打分,以追求标准的统一,使得分数尽可能有意义


                          IP属地:湖北来自Android客户端13楼2021-09-26 22:34
                          收起回复
                            我几乎不打分,打分也只给想推荐的作品打个满分
                            过度执着于打分只会走火入魔,bgm和豆瓣这样的人太多了


                            IP属地:陕西来自Android客户端14楼2021-09-26 22:53
                            收起回复
                              我觉得就应该直接用标准分制


                              IP属地:广东15楼2021-09-26 22:54
                              收起回复