為進一步培養學生創新精神和實踐能力,鼓勵學生運用統計學模型、機器學習模型等數據科學專業知識,協助解決經濟社會領域中的實際問題,由四川省教育廳主辦,紅寶石hbs平臺登錄網址與四川新網銀行承辦,四川省普通本科高等學校統計學類專業教學指導委員會、四川省統計學會協辦的2022年四川省大學生數據科學與統計建模競賽正式啟動,現將有關事項通知如下:
一、主題
數字科技 創領未來
二、舉辦單位
主辦:四川省教育廳
承辦:紅寶石hbs平臺登錄網址 新網銀行
協辦:四川省普通本科高等學校統計學類專業教學指導委員會、四川省統計學會、字節跳動
三、大賽內容
1.本科生賽道A題目:小微風控算法大賽-早期風險識別
賽題介紹:本賽道需要選手基于所提供的數據構建模型準確預測小微客戶早期風險,數據既包含經過脫敏處理的小微企業法人基本信息、歷史借貸信息、申請行為信息、工商司法信息以及貸款申請后的早期風險表現數據,期望選手開發模型,對客戶早期風險進行識別,幫助金融機構進一步提升模型在小微企業信貸風控中的信用風險識別和防范能力。
2.研究生賽道B題目:小微風控算法大賽-長期風險識別
賽題介紹:本賽道需要選手基于所提供的數據構建模型準確預測小微客戶長期風險,數據既包含經過脫敏處理的小微企業法人基本信息、歷史借貸信息、申請行為信息、工商司法信息以及貸款申請后的長期風險表現數據,其中部分數據提供了更細顆粒度的數據記錄,并提供了小微以外其他產品的樣本,期望選手充分挖掘和探索,開發模型對小微客戶長期風險進行識別,幫助金融機構進一步提升模型在小微企業信貸風控中的信用風險識別和防范能力。
四、參賽對象
全國在校大學生(本科、碩士/博士生)均可按對應賽道報名參加,本科生僅能參加本科生賽道A,碩士/博士生僅能參加研究生賽道B。每支隊伍由不超過4名參賽選手及1名指導老師組成,指導老師必須是參賽選手所屬院校在職教師,1名學生至多加入一支隊伍,鼓勵同學們跨學校、跨年級、跨專業組隊參賽。
五、參賽流程
1.報名(即日-11月2日)
報名方式:參賽選手于報名規定時間內在DataCastle大數據競賽平臺完成注冊和報名。
賽道A(電腦端):小微風控算法大賽-早期風險識別 https://challenge.datacastle.cn/v3/cmptDetail.html?id=745
賽道B(電腦端):小微風控算法大賽-長期風險識別 https://challenge.datacastle.cn/v3/cmptDetail.html?id=746
2.初賽(即日-11月8日)
(2)初賽于DataCastle線上進行,選手需在DataCastle下載數據,在本地進行算法調試,并在DataCastle提交結果,提交數據文件為 .csv格式,utf-8編碼。
(2)客觀提交分公榜、私榜兩部分,公榜成績將在每次完成提交后計入評分系統并及時出分。每天成功提交次數上限5次,提交文件格式錯誤將不計入當日成功提交次數內。私榜成績將在團隊選擇提交公榜文件后(如未選擇,則系統默認選取公榜最優成績文件+最后一次提交文件提交至私榜),公榜截止后公布私榜排名。
公榜客觀提交時間為即日至2022-11-08 17:00:00;
私榜選擇文件時間為2022-11-07 17:00:00至2022-11-08 17:00:00。
3.復賽(11月15日-11月19日)
(1)各賽道私榜排名前20名參賽團隊進入復賽,進入復賽的隊伍需在2022年11月14日24:00前提交選手身份證明材料和主觀評審材料。
(2)主觀評審材料。進入復賽的隊伍需提交與私榜出分情況相同的模型和研究報告(包括報告正文、編程源代碼)至組委會郵箱。報告文件夾名為:隊號-隊長姓名-比賽階段(第X隊-張三-復賽),組委會提供報告固定格式。
(3)報告正文統一為word或pdf格式,可附其余支撐材料。所有提交材料請打包壓縮成zip格式,壓縮包大小不超過300MB,壓縮包命名格式為:隊號-隊長姓名-比賽階段。
(4)組織專家進行線上評審,各賽道選拔5支隊伍進入決賽。
(5)組委會將于11月19日公布進入決賽的隊伍名單。
4.決賽(11月27日)
(1)各團隊根據各自指導教師意見完善研究報告,并在2022年11月23日24:00之前將修改后的電子版研究報告提交到組委會郵箱。報告文件夾名為:隊號-隊長姓名-比賽階段(第X隊-張三-決賽)。
(2)決賽以答辯的形式開展,答辯主要包括對研究報告的陳述和答疑兩個環節,團隊推選1名隊員進行研究報告的陳述。專家、觀眾提問,參賽選手答疑。
(3)決賽時間:2022年11月27日。
六、評分規則
1.初賽成績評定
根據初始最終私榜隊伍排名(AUC)換算成績,換算公式如下:
初賽評分 = MAX(100 - 初賽評分排名,0)
初賽設置公私榜,初賽結束后線上排名由公榜切換為私榜排名。
2.復賽成績評定
復賽評分 = 80%* MAX(100 - 初賽評分排名,0) + 20%*主觀評審成績
其中:主觀評審成績總分100,包含以下維度:報告完整性(20%) ,代碼規范性(20%) ,問題分析和探索(30%),方案創新性(30%) ,每項維度打分,分為5個檔次,優秀90-100分,良好80-89分,中等70-79分,及格60-69分,不合格 60分以下。
3.決賽成績評定
決賽評分 = 60%*復賽成績 + 40%*答辯成績
答辯成績總分100,評價維度如下:現場陳述(20%) ,現場問答(20%),問題分析和探索(30%),方案創新性(30%) ,每項維度打分,分為5個檔次,優秀90-100分,良好80-89分,中等70-79分,及格60-69分,不合格60分以下。
七、參賽獎勵
1.以進入復賽的各賽道有效隊伍為基數,設置獎項如下:
一等獎:10%/賽道
二等獎:20%/賽道
三等獎:30%/賽道
2.進入決賽答辯的隊伍將角逐由新網銀行提供的競賽獎金(稅前):
數據菁英獎:12,000元,1隊/賽道
數據英才獎:6,000元,2隊/賽道
數據人才獎:3,000元,2隊/賽道
3.各獲獎隊伍將獲得證書及獎金,數據菁英獎、數據英才獎隊伍的指導教師獲得優秀指導教師證書。證書由承辦單位蓋章,四川省教育廳發布獲獎通知。
八、聯系方式
統計學院辦公室:王老師 吳老師 何老師
聯系電話:028-87092272 028-87092207 028-87092018
楊薦文(本科生賽道學生負責人):17313296231
本科生賽道QQ交流群:654636886
康璐(研究生賽道學生負責人):17318907031
研究生賽道QQ交流群:110435951
組委會郵箱:stat@swufe.edu.cn
四川省大學生數據科學與統計建模競賽組委會
二○二二年九月三十日