日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

SRFC“能力指數(shù)”車手評(píng)分系統(tǒng)升級(jí)為2.0

 弓道自然_改名 2020-02-03

概述:

我們的能力指數(shù)RRI系統(tǒng)自從2017年12月運(yùn)行至今半年有余,期間逐步的發(fā)現(xiàn)了一些問題,針對(duì)這些問題,本文作者進(jìn)行了潛心研究后對(duì)本系統(tǒng)提出了新的計(jì)算規(guī)則。
Elo評(píng)分系統(tǒng)
簡(jiǎn)單回顧:

Elo評(píng)分系統(tǒng)是由一個(gè)叫Arpad Elo的人提出的一種實(shí)力評(píng)分系統(tǒng),最早用于國(guó)際象棋的排名,現(xiàn)在也廣泛地被運(yùn)用到各種游戲中。

單拿寶可夢(mèng)來說,無論是PS,PO還是實(shí)機(jī)排位,其分?jǐn)?shù)排名系統(tǒng)都是Elo系統(tǒng)。

相信大多數(shù)經(jīng)常打以上三個(gè)游戲玩家,都至少有這么個(gè)感性認(rèn)識(shí):

在這個(gè)系統(tǒng)里,和分?jǐn)?shù)比自己高的人比賽,贏了自己能加更多的分,輸了則會(huì)扣相對(duì)較少的分;反之亦然。

在Elo系統(tǒng)中,一個(gè)確定的分?jǐn)?shù)差對(duì)應(yīng)著一個(gè)確定的勝率。比如1950對(duì)1850的勝率是64%,1200對(duì)1100的勝率也是64%。反過來看,如果A對(duì)B的勝率大約是64%,那么他們的實(shí)力評(píng)分差約100分,如果A對(duì)B的勝率約76%,那么他門的實(shí)力評(píng)分大約差200分。

理論上,Elo系統(tǒng)可以用來關(guān)公戰(zhàn)秦瓊,兩個(gè)不同時(shí)期的玩家,可以通過直接比較Elo分來比較其水平強(qiáng)弱。另一方面,K的取值只影像分?jǐn)?shù)調(diào)整的快慢,并不影響分差和勝率的對(duì)應(yīng)關(guān)系。

Elo系統(tǒng)
的主要問題:

Elo系統(tǒng)的一大特點(diǎn)就是并非根據(jù)時(shí)間加減積分,這杜絕了一輪游也可以漲分的怪相,但卻暴露了另外的缺陷——并不考慮長(zhǎng)時(shí)間遠(yuǎn)離賽場(chǎng)后撲朔迷離的競(jìng)技狀態(tài),其問題在于無法確定選手評(píng)分的可信度。

假設(shè)兩名評(píng)分均為1700的選手A、B在進(jìn)行一場(chǎng)對(duì)戰(zhàn)后A獲得勝利,在Elo系統(tǒng)下(K=32時(shí)),A選手評(píng)分將增長(zhǎng)16,對(duì)應(yīng)地B選手評(píng)分將下降16。但是假如A選手是已經(jīng)很久沒玩,但B選手每周都會(huì)玩,那么在上述情況下A選手的1700評(píng)分并不能十分可信地用于評(píng)定其實(shí)力,而B選手的1700評(píng)分則更為可信。思考得出以下結(jié)論:

(1)A選手的評(píng)分增長(zhǎng)值應(yīng)該大于16分,因?yàn)樗?700評(píng)分作為初始值并不可信,同時(shí)擊敗一個(gè)穩(wěn)定在1700評(píng)分的選手表明他的實(shí)力很可能高于1700;

(2)B選手的評(píng)分減少值應(yīng)該小于16分,因?yàn)樗膶?shí)力已經(jīng)被很精準(zhǔn)地定位在1700附近,而他輸給了一個(gè)評(píng)分并不可信的對(duì)手,那么B選手的實(shí)力評(píng)定其實(shí)從該場(chǎng)對(duì)戰(zhàn)中并不能有多少“學(xué)習(xí)”。

Glicko
評(píng)分系統(tǒng)

Glicko系統(tǒng)正是針對(duì)上述情況進(jìn)行改進(jìn)。第二版RRI'能力指數(shù)'評(píng)分系統(tǒng)是基于Glicko評(píng)分系統(tǒng)打造的。Glicko評(píng)分系統(tǒng)是Mark Glickman發(fā)明的,本質(zhì)上是對(duì)Elo系統(tǒng)的一種改進(jìn)。

Glicko系統(tǒng)在給玩家一個(gè)評(píng)分時(shí),同時(shí)還需要給出一個(gè)標(biāo)準(zhǔn)差(既正態(tài)分布中的均值和標(biāo)準(zhǔn)差,也可以理解為范圍或者可信度),例如玩家A的評(píng)分是 (1600, 50),玩家B的評(píng)分是(1650, 100)。這樣,我們?cè)谠u(píng)估一個(gè)剛剛進(jìn)入系統(tǒng)的玩家時(shí),就可以給出一個(gè)很大的標(biāo)準(zhǔn)差來避免其實(shí)際實(shí)力與暫時(shí)的分?jǐn)?shù)不符的問題。而通過玩家不斷地進(jìn)行對(duì)戰(zhàn),調(diào)整其分?jǐn)?shù)的同時(shí),一定程度地減小其標(biāo)準(zhǔn)差,也既是慢慢地精確定位玩家的實(shí)際實(shí)力。Glicko系統(tǒng)中,需要設(shè)定一個(gè)實(shí)力均值以及一個(gè)最大標(biāo)準(zhǔn)差值(我們?cè)O(shè)定的均值為1500,最大標(biāo)準(zhǔn)差為350),同時(shí),一個(gè)沒有任何對(duì)局的新玩家的評(píng)分就是(1500, 350)

Glicko
評(píng)分系統(tǒng)基本計(jì)算步驟:

步驟1 為所有選手設(shè)定一個(gè)初始評(píng)分和RD值

(a) 如果選手未分級(jí),設(shè)定評(píng)分 = 1500,RD值 = 350;

(b) 否則,用選手最新的評(píng)分,同時(shí)根據(jù)RDold用以下公式計(jì)算新的RD值:

t是自最近對(duì)戰(zhàn)后,現(xiàn)在已經(jīng)是第幾個(gè)周期(例如選手上次對(duì)戰(zhàn)就是在剛過去的一個(gè)評(píng)分周期,則t=1);c是用于衡量隨時(shí)間增長(zhǎng)不確定度的常量(后續(xù)會(huì)給出如何選擇c值的方法)。上述公式可以保證在評(píng)分周期開始,未頂級(jí)選手的RD值不會(huì)超過350。

步驟2 分別為每一個(gè)選手執(zhí)行下述公式計(jì)算:

假定在評(píng)分周期初始,選手的評(píng)分為r,評(píng)分偏差為RD。設(shè)定m個(gè)對(duì)手在評(píng)分周期初始的評(píng)分分別為r1,r2,r3,……rm,其評(píng)分偏差分別為RD1,RD2,RD3,……RDm,同時(shí)設(shè)s1,s2,s3,……sm為其對(duì)戰(zhàn)各個(gè)選手的結(jié)果(在SRFC對(duì)戰(zhàn)結(jié)果只有2種:勝、負(fù),分別對(duì)應(yīng)的s值為1、0)。注意:與同一對(duì)手對(duì)戰(zhàn)多局,其使用的評(píng)分和RD值與對(duì)戰(zhàn)多個(gè)對(duì)手相同。

使用r’、RD’表示在評(píng)分周期過后選手新的評(píng)分和RD值,則相關(guān)的更新公式如下:

其中

上述公式在評(píng)分周期的末尾對(duì)每個(gè)選手進(jìn)行一次計(jì)算。

實(shí)例

為了對(duì)上述步驟2進(jìn)行計(jì)算,假定一個(gè)評(píng)分為1500的選手對(duì)戰(zhàn)3個(gè)選手評(píng)分分別為:1400,1550和1700,戰(zhàn)斗結(jié)果分別為勝、負(fù)、負(fù),同事該選手RD值為200,而對(duì)手的RD值分別為30,100和300。我們可以得出:

得出:

d = 231.67

從而得出:

r’ = 1464,RD’ = 151.4

【演算過程略。。。】

關(guān)于C值

評(píng)分算法步驟1中的c值可以由數(shù)據(jù)分析決定,當(dāng)然就需要非常復(fù)雜的計(jì)算過程。另外一個(gè)方法是決定過多少個(gè)評(píng)分周期后,一個(gè)沒再進(jìn)行過評(píng)分對(duì)戰(zhàn)的正常選手的評(píng)分變得如一個(gè)未評(píng)分選手一樣不可信。為了示范計(jì)算該種方法,假設(shè)一個(gè)正常選手的RD值為50,評(píng)分周期持續(xù)2個(gè)月,并且假定5年(60個(gè)月)過后該選手評(píng)分如未評(píng)分選手一樣不可信,此時(shí)時(shí)間已經(jīng)過去了t = 30個(gè)評(píng)分周期(30*2個(gè)月)。我們可以用以下公式解出c:

在該例中,c = 63.2。

一個(gè)實(shí)際應(yīng)用過程中會(huì)遇到的問題是,當(dāng)一個(gè)選手過于頻繁地進(jìn)行匹配對(duì)戰(zhàn)時(shí),他的評(píng)分變化不再明顯,因?yàn)榇藭r(shí)他的RD值非常小。當(dāng)選手的實(shí)力確實(shí)有了提高時(shí),這種情況會(huì)阻止選手的評(píng)分發(fā)生實(shí)質(zhì)性的變化。因此設(shè)定一個(gè)從不會(huì)低于某值(例如30)的RD值,這樣選手的評(píng)分在一個(gè)相對(duì)短的時(shí)間內(nèi)也可以明顯地發(fā)生變化。

SRFC能力指數(shù)(RRI)
2.0版計(jì)算規(guī)則簡(jiǎn)介:

我們以10場(chǎng)對(duì)戰(zhàn)(假設(shè)1場(chǎng)比賽有15人參加,那么每位參加的車手都經(jīng)歷了14場(chǎng)對(duì)戰(zhàn))為一個(gè)計(jì)算周期,C值設(shè)定為若缺席超過300個(gè)計(jì)算周期,這RD值變回初始值(如同新手一樣不可信)。

設(shè)定車手評(píng)分變動(dòng)為2倍的RDnew以內(nèi)。

退賽的情況:當(dāng)車手未完成3圈時(shí)不參與計(jì)算。之后退賽的話,和所有退賽車手之間都算平局,和所有完賽車手之間都算失敗,以此規(guī)則進(jìn)行計(jì)算。

目前2.0版RRI評(píng)分系統(tǒng)已經(jīng)上線并已開始測(cè)試,地址為:http://www./app/RRI_SEARCH2.php?name='車手中心ID'。

能力指數(shù)RRI查看頁面
簡(jiǎn)介:

條形圖表示車手每場(chǎng)比賽后的能力指數(shù)(即r),折線圖表示車手每場(chǎng)比賽之后計(jì)算得出的穩(wěn)定系數(shù)(即RD)

一位車手的RRI應(yīng)表達(dá)為r±RD。

如上圖,GTR1994的以截圖時(shí)最新的RRI為1978±89.83,那么他的能力值為上限2067.83,下限1888.17的區(qū)間內(nèi)某一個(gè)值。

穩(wěn)定系數(shù)的中位數(shù):離最低穩(wěn)定系數(shù)值越接近,則車手評(píng)級(jí)表現(xiàn)越穩(wěn)定,反之越不穩(wěn)定。

參考文獻(xiàn):https://en./wiki/Glicko_rating_system

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多