Kaggle社区是一个数据科学竞赛平台,所有人都可以发布关于数据分析的竞赛项目,感兴趣的用户可以通过完成特定的分析任务来争取高排位以赢得奖品。因为Kaggle中的大部分竞赛项目来自于数据领域的相关企业或研究机构,分析任务都很有挑战性和应用价值,加之奖金丰厚,所以该平台向来卧虎藏龙高手云集,是绝佳的数据分析试炼场。笔者从Kaggle上百个竞赛数据集当中精心挑选了6个实际案例,希望在简单易懂且具有教学意义的数据竞赛项目中,挖掘出适合分享给R语言初学者学习实践R语言的最佳案例。需要说明的是,笔者不会面面俱到地分析这些案例,而是仅对具有代表性的分析方法进行介绍。在下面的案例集中,笔者对R语言中的数据清洗、处理、可视化R包当中的常用函数的使用方法(readr、readxl、reshape2、stringr、dplyr、data.table、ggplot2)都进行了使用。基本上,读者在工作中经常用到的函数,在案例中都有概括。设置案例篇的目的是希望引导读者更好地实践R语言。