日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

我一般不發(fā)大招,但這篇高分解讀你不看會后悔

 么么公主khu9a0 2016-12-29

第二屆“登峰杯”全國中學(xué)生數(shù)據(jù)挖掘競賽

高分解讀

如何在數(shù)據(jù)挖掘競賽中摘金奪銀

 

1

競賽簡介

“登峰杯”全國中學(xué)生數(shù)據(jù)挖掘競賽由中國科學(xué)技術(shù)大學(xué)承辦,是面向全國高中生開展的數(shù)據(jù)挖掘競賽活動,旨在提高中學(xué)生運(yùn)用數(shù)據(jù)挖掘知識解決實(shí)際問題的能力,培訓(xùn)中學(xué)生的創(chuàng)新合作精神、編程能力和論文寫作能力。

數(shù)據(jù)挖掘競賽根據(jù)現(xiàn)實(shí)中的熱點(diǎn)事件提出開放性的問題,考察學(xué)生利用所學(xué)知識思考和解決實(shí)際問題的能力。競賽題目涉及到對實(shí)際生活中數(shù)據(jù)的挖掘與分析,及對問題的探索性思考,需要一定的數(shù)學(xué)能力,編程能力和論文寫作能力。

2

競賽賽題

奧運(yùn)會獎牌榜排名預(yù)測

2016年里約熱內(nèi)盧奧運(yùn)會剛剛落下帷幕,來自世界各地的207支國家和地區(qū)代表隊(duì)參與了本次盛會,中國代表隊(duì)取得了金牌榜第三,獎牌榜第二的好成績。奧運(yùn)會期間,獎牌榜排名成為了最熱門的話題。對于這個問題,不同的人可能會有不同的預(yù)測結(jié)果。如何讓預(yù)測結(jié)果更加準(zhǔn)確,這就是數(shù)據(jù)挖掘所關(guān)注的。請你利用自己所學(xué)的知識,通過實(shí)踐研究,就奧運(yùn)會獎牌榜排名預(yù)測問題,從以下角度做出探討。


問題 1:縱向討論,討論如何利用歷屆奧運(yùn)會的歷史成績與本次奧運(yùn)會成績之間可能存在的關(guān)聯(lián)性做出預(yù)測。


問題 2:橫向討論,除了歷史成績可以幫助預(yù)測,國家綜合實(shí)力也是影響奧運(yùn)會成績的重要因素,討論國家綜合實(shí)力會怎樣影響預(yù)測結(jié)果。


問題 3:在問題 1 和 2 解答的基礎(chǔ)上,思考除了歷史成績與國家綜合實(shí)力,其它可能的影響因素。


問題 4:結(jié)合以上討論內(nèi)容,對下一屆奧運(yùn)會的獎牌榜前十名給出你自己的預(yù)測結(jié)果,并闡述理由。


3

競賽任務(wù) 

數(shù)據(jù)挖掘競賽考察學(xué)生從現(xiàn)實(shí)生活中收集數(shù)據(jù)的能力、對實(shí)際問題的科學(xué)分析能力及對所學(xué)知識的熟練應(yīng)用能力。競賽共分為三個部分,分別是數(shù)據(jù)收集部分、模型設(shè)計部分和拓展思考部分。

1、數(shù)據(jù)收集部分旨在培養(yǎng)學(xué)生的信息檢索與過濾能力。學(xué)生可以通過查閱文獻(xiàn)資料、網(wǎng)絡(luò)搜索等途徑尋找解決問題所需要的各種原始數(shù)據(jù),進(jìn)而通過對原始數(shù)據(jù)內(nèi)容的甄別、過濾,獲取有效信息并最終運(yùn)用到自己設(shè)計的模型中。對于動手能力較強(qiáng)的學(xué)生,還可以動手編寫網(wǎng)絡(luò)爬蟲以自動收集大量互聯(lián)網(wǎng)信息。

2、模型設(shè)計部分旨在培養(yǎng)學(xué)生的推導(dǎo)分析與建模能力。學(xué)生需要針對題目給出的實(shí)際問題進(jìn)行建模,并利用已收集的數(shù)據(jù)進(jìn)行求解。學(xué)生可以利用已有的數(shù)學(xué)算法、數(shù)據(jù)挖掘技術(shù)或者設(shè)計新的方法來解決問題,其中可能需要一定程度的數(shù)學(xué)推導(dǎo)和計算機(jī)編程。對于有余力的同學(xué),還可以對得到的結(jié)果做出分析,比如如果結(jié)果不好,可能是什么原因?qū)е碌?;如果結(jié)果很好,能否說明模型的有效性?

3、拓展思考部分旨在拓寬學(xué)生的思維范疇,培養(yǎng)學(xué)生的創(chuàng)新能力。競賽題目中會包含一定程度的拓展問題,學(xué)生不需要對此類問題做出詳細(xì)求解,但需要就此類問題提出自己的見解。

4

競賽要求及成績評定標(biāo)準(zhǔn)


       數(shù)據(jù)挖掘競賽將根據(jù)現(xiàn)實(shí)中的熱點(diǎn)事件提出問題,學(xué)生在得到問題后,需要主動收集數(shù)據(jù)(問題所需要的主要數(shù)據(jù)將是很易于收集的),分析問題并進(jìn)行建模,并利用已有數(shù)據(jù)進(jìn)行求解,最后進(jìn)行可能的模型評估和拓展思考。
       學(xué)生需要按照規(guī)定,提交完整版論文作品及附加材料。其中附加材料里必須要包含學(xué)生收集并過濾后的數(shù)據(jù),如果在論文中提到了程序,也應(yīng)當(dāng)一并添加到附件中。
      競賽將從數(shù)據(jù)收集部分,模型設(shè)計部分和拓展思考部分三個部分對學(xué)生的作品進(jìn)行打分,分別占20%、60%和20%的比重。具體評分細(xì)則如下:
1、數(shù)據(jù)收集(占總分的20%)
此部分將會根據(jù)學(xué)生收集到的數(shù)據(jù)質(zhì)量做出評分,學(xué)生收集的數(shù)據(jù)越全面越詳細(xì),得分也將越高,同時對原始數(shù)據(jù)的篩選和處理也將被計入評分之中。若是能采用編程等方法獲取到大量有用信息,可以得到額外加分。
2、模型設(shè)計(占總分的40%)
此部分主要評估學(xué)生對問題的建模及求解能力,對學(xué)生采用的模型或方法的分?jǐn)?shù)評估將包括但不限于以下幾個方面:

· 采用的模型或方法是否具有理論依據(jù)

· 對問題影響因素的考慮是否周全

· 模型是否有過擬合的可能

· 模型求解算法的時間和空間復(fù)雜性


3、結(jié)果評估(占總分的20%)
此部分將根據(jù)學(xué)生求解得到的結(jié)果進(jìn)行打分,結(jié)果的準(zhǔn)確性僅是得分的一部分,如果能對結(jié)果進(jìn)行合理的解釋,可以獲得額外的加分。比如如果模型得到的結(jié)果不夠好,學(xué)生最好可以解釋出不好的原因在什么地方,可以做出怎樣的改進(jìn)。
4、拓展思考(占總分的20%)
競賽包含一定程度的思維拓展內(nèi)容,此部分考察學(xué)生對于問題的拓展能力及創(chuàng)新能力,如果學(xué)生能提出合理的新穎觀點(diǎn),可以得到額外加分。



 

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多