大数据技术是从各种类型的数据中快速获取有价值的信息的技术,是目前的研究热点之一。其中,数据采集是进行数据分析的前提和必要条件,在整个流程中占据重要地位。
本章使命是介绍目前常用的数据采集及数据预处理的基本方法,以某网站药品数据为例实现数据的获取及预处理。 I+xWe4obHkKDfE7ea7768G8HZ/fGJa7z98t5Q5kxbvP4NkhkLSUagS66cBy/Pi1U