Kaggle 一個神奇的網(wǎng)站
今天向大家介紹一下Kaggle,感覺上面實在是太好玩了。。。所以一定要安利,安利,安利(重要的事情說三遍)
Kaggle是一個數(shù)據(jù)建模和數(shù)據(jù)分析競賽平臺。企業(yè)和研究者可在其上發(fā)布數(shù)據(jù),統(tǒng)計學者和數(shù)據(jù)挖掘?qū)<铱稍谄渖线M行競賽以產(chǎn)生最好的模型。這一眾包模式依賴于這一事實,即有眾多策略可以用于解決幾乎所有預(yù)測建模的問題,而研究者不可能在一開始就了解什么方法對于特定問題是最為有效的。Kaggle的目標則是試圖通過眾包的形式來解決這一難題,進而使數(shù)據(jù)科學成為一場運動。2017年3月8日谷歌官方博客宣布收購Kaggle。
Kaggle 的官網(wǎng)網(wǎng)站:
Slogan: Making Data Science a Sport
Kaggle中組織一場競賽的過程如下。
競賽主持人準備數(shù)據(jù)和問題的描述。Kaggle對這一過程以及競賽的建構(gòu)、數(shù)據(jù)的匿名化以及集成最終獲勝的模型提供咨詢服務(wù)。參與者通過不同的方法進行實驗,相互競賽以獲得最優(yōu)的模型。對于大多數(shù)的參與者,他們的提交會根據(jù)預(yù)測精度被立即評分,并在實時的積分榜上顯示。在截止時間過后,競賽主持人為“全球性的,永久性的,不可撤銷和免版稅地使用獲獎作品”支付獎金。亦即競賽獲勝者的算法、軟件和相關(guān)的知識產(chǎn)權(quán)是非排他性的,除非特別指明。除了公開競賽以外,Kaggle還向活躍參與者提供私下的比賽,以及為大學團體提供Kaggle-in-Class項目。
根據(jù)Kaggle官方提供的數(shù)據(jù),Kaggle在全球范圍內(nèi)擁有將近20萬名數(shù)據(jù)科學家,專業(yè)領(lǐng)域從計算機科學到統(tǒng)計學、經(jīng)濟學和數(shù)學。Kaggle也曾經(jīng)和NASA、維基百科、德勤和好事達合作舉辦競賽。其中的一項獎項高達300萬美金的競賽是Heritage Health Prize,目的是通過病人看病及吃藥住院等數(shù)據(jù)預(yù)測明年病人住院的天數(shù)。另一項與微軟合作的競賽則旨在提高Kinect的手勢識別精度。
Kaggle的競賽在艾滋病研究、棋牌評級和交通預(yù)測方面取得了成果。基于這些成果產(chǎn)生了一系列的學術(shù)論文。產(chǎn)生這一結(jié)果的原因是實時積分榜促使參加者不斷改進以試圖超越當前的最佳實踐。獲勝的方法常常在Kaggle的博客No Free Hunch上展示。

目前的話,我正在看這位大神DanB | Kaggle的文章,感覺寫的很通俗易懂。是不是看著很可愛,哈哈哈

有興趣的也可以參考@a2Mia姐的回答
1. Titanic(泰坦尼克之災(zāi))
中文教程: 邏輯回歸應(yīng)用之Kaggle泰坦尼克之災(zāi) 英文教程:An Interactive Data Science Tutorial2. House Prices: Advanced Regression Techniques(房價預(yù)測)
中文教程:Kaggle競賽 — 2017年房價預(yù)測 英文教程:How to get to TOP 25% with Simple Model using sklearn3. Digital Recognition(數(shù)字識別)
中文教程:大數(shù)據(jù)競賽平臺—Kaggle 入門 英文教程:Interactive Intro to Dimensionality Reduction我保證你不會后悔的。
掃描二維碼推送至手機訪問。
版權(quán)聲明:本文由財神資訊-領(lǐng)先的體育資訊互動媒體轉(zhuǎn)載發(fā)布,如需刪除請聯(lián)系。