在训练数据集上拟合并选择模型后,使用测试数据集来评估模型在从未见过的新数据上的表现,从而估计所谓的泛化误差。如果对模型的性能满意,那么可以使用这个模型预测新的未来数据。需要注意的是,上述过程涉及的所有参数,包括特征缩放和特征降维使用的参数,都必须仅从训练数据集中获得。在测试数据或新的待预测数据上要用相同的参数处理或转换数据,否则,模型在测试数据上的性能会被高估。 NjKpUlQRikRPtjw7dA+fMyAmGlvRI61a7xmYm3EbzjGRlnQAZwlJj3lRx2oGN+tV