python – 分类:使用sklearn进行PCA和逻辑回归
发布时间:2020-09-01 08:19:24 所属栏目:Python 来源:互联网
导读:第0步:问题描述我有一个分类问题,即我想基于数字特征的集合,使用逻辑回归和运行主成分分析(PCA)来预测二进制目标.我有2个数据集:df_train和df_valid(分别是训练集和验证集)作为pandas数据框,包含特征和目标.作为第一步,我使用了get_dummies pandas函数将所
第0步:问题描述 我有一个分类问题,即我想基于数字特征的集合,使用逻辑回归和运行主成分分析(PCA)来预测二进制目标. 我有2个数据集:df_train和df_valid(分别是训练集和验证集)作为pandas数据框,包含特征和目标.作为第一步,我使用了get_dummies pandas函数将所有分类变量转换为boolean.例如,我会:
我现在想应用PCA来减少问题的维数,然后使用sklearn中的LogisticRegression训练并获得我的验证集的预测,但我不确定我遵循的程序是否正确.这是我做的: 第1步:PCA 我的想法是,我需要以与PCA相同的方式转换我的训练和验证设置.换句话说,我不能单独执行PCA.否则,它们将被投射到不同的特征向量上.
第二步:Logistic回归 这没有必要,但我更喜欢将事物保存为数据帧:
现在我进行逻辑回归
我认为第2步是正确的,但我对第1步有更多疑问:这是我应该链接PCA,然后是分类器的方式吗? 最佳答案 为此目的,sklearn中有一个pipeline. (编辑:十堰站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
相关内容
- python – 将numpy.array中的每个元素与numpy.array中的每个
- python – SqlAlchemy在保存之前将UTC DateTime转换为本地时
- python – FTPES – 需要会话重用
- Django:如何在内联formset中显示每个模型对象的表单错误
- python实现将元祖转换成数组的方法
- 如何使用PIL(python-imaging)创建透明的gif(或png)
- python – 什么是func_dict?
- python – matplotlib.pyplot.imshow:在使用属性“sharex”
- Python中的defaultdict模块和namedtuple模块的简单入门指南
- 在python中公开C函数并在C中嵌入python