文章出處
文章列表
作者:Esquirrel
鏈接:https://zhuanlan.zhihu.com/p/24674409
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。
筆者是在醫療AI領域奮斗的博士go,假期一直在信號領域探索前沿,閱讀很多時間序列/信號處理領域的paper,不管是做股票預測的、還是音樂推薦、疾病診斷、方法上都有很多類似之處,順手收錄了一些公開的數據集,分享給大家測試自己的算法,歡迎交流、轉發,謝謝。
#UCR Time Series
時間序列界的“Imagnet”,發文章必跑數據集,由某大牛課題組維護 (不過15年之后貌似就沒怎么維護了)
www.cs.ucr.edu/~eamonn/time_series_data/
Yanping Chen, Eamonn Keogh, Bing Hu, Nurjahan Begum, Anthony Bagnall, Abdullah Mueen and Gustavo Batista (2015). The UCR Time Series Classification Archive. URL

#音樂數據庫
目前我找到的最大的音樂公開數據庫(Million),做音樂推薦、分類的朋友應該會喜歡
http://labrosa.ee.columbia.edu/millionsong/
The Million Song Dataset is a freely-available collection of audio features and metadata for a million contemporary popular music tracks.

http://grh.mur.at/sites/default/files/mir_datasets_0.html
#臨床監護數據
MIMIC Critical Care Database
MIMIC-II to MIMIC-III
MIMIC is an openly available dataset developed by the MIT Lab for Computational Physiology, comprising deidentified health data associated with ~40,000 critical care patients. It includes demographics, vital signs, laboratory tests, medications, and more.

#股票數據
1990-2016年股票數據:鏈接:http://pan.baidu.com/s/1i44IQ3N 密碼:o9hj
鏈接:https://zhuanlan.zhihu.com/p/24674409
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。
筆者是在醫療AI領域奮斗的博士go,假期一直在信號領域探索前沿,閱讀很多時間序列/信號處理領域的paper,不管是做股票預測的、還是音樂推薦、疾病診斷、方法上都有很多類似之處,順手收錄了一些公開的數據集,分享給大家測試自己的算法,歡迎交流、轉發,謝謝。
#UCR Time Series
時間序列界的“Imagnet”,發文章必跑數據集,由某大牛課題組維護 (不過15年之后貌似就沒怎么維護了)
www.cs.ucr.edu/~eamonn/time_series_data/
Yanping Chen, Eamonn Keogh, Bing Hu, Nurjahan Begum, Anthony Bagnall, Abdullah Mueen and Gustavo Batista (2015). The UCR Time Series Classification Archive. URL

#音樂數據庫
目前我找到的最大的音樂公開數據庫(Million),做音樂推薦、分類的朋友應該會喜歡
http://labrosa.ee.columbia.edu/millionsong/
The Million Song Dataset is a freely-available collection of audio features and metadata for a million contemporary popular music tracks.

http://grh.mur.at/sites/default/files/mir_datasets_0.html
#臨床監護數據
顱內腦電癲癇數據
UPenn and Mayo Clinic's Seizure Detection Challenge | Kaggle
UPenn and Mayo Clinic's Seizure Detection Challenge
MIMIC Critical Care Database
MIMIC-II to MIMIC-III
MIMIC is an openly available dataset developed by the MIT Lab for Computational Physiology, comprising deidentified health data associated with ~40,000 critical care patients. It includes demographics, vital signs, laboratory tests, medications, and more.

#股票數據
1990-2016年股票數據:鏈接:http://pan.baidu.com/s/1i44IQ3N 密碼:o9hj

以上只是很小很小的一部分,后續不定期更新ing
歡迎轉發!!!
(大家有知道其他相關數據集可以評論區留言,萬分感謝)
之前發表的【醫學影像開源數據集-持續更新中】知乎專欄
原文:https://zhuanlan.zhihu.com/p/24674409
文章列表
全站熱搜