在与经验丰富的技术人员讨论R语言时,技术人员通常会指出该语言存在的两大劣势。
● 陡峭的学习曲线。
● 难以处理大型数据集。
上述两个劣势确实是这门语言的两大缺点。本书作者不会刻意地美化R语言,而是给出克服这些劣势的方法。事实上,可以认为第一大劣势是暂时性的,至少针对不同个体是这样的。因为读者一旦迈过了R语言学习的“绝望谷”,就再也不会被这一劣势所困扰。什么是绝望谷呢?此处用图1-11来进行说明。
图1-11
众所周知,个体在学习全新且足够复杂的事物的过程中,都会经历3个阶段。
● 蜜月期:在这个阶段,学习者会喜欢上这样的新事物,并且非常有信心能够掌握它。
● 绝望谷:在这个阶段,所有事情都变得困难重重,让人陷入绝望。
● 接下来的阶段:学习者开始对新事物有更深入的理解,对它的掌控能力提高,自信心也越来越强。
在谈到第二大劣势时,不得不说,R语言在处理大型数据集方面存在的困难实际上是这门语言本身具有的结构性问题。因此需要在结构上对其做出一些改变,需要将其与其他工具进行战略性合作。在1.6.1节和1.6.2节中,将针对这两大劣势进行更加详细的讨论。