逻辑回归算法提示算法不收敛

来源：9-8 OvR与OvO

luluoverflow

2021-12-17

样本特征为5个，标签有6种，使用多项式逻辑回归，多项式次数degree设置为5，L2正则化，OvO多分类，运行的时候警告线性算法没有收敛，而且分类准确度很低（百分之45左右，kNN可以达到80）,。是数据太复杂了维度太多了吗？degree设置为10后，直接超出10000的迭代次数限制了。
老师我想问一下，在网格搜索合适的degree、C的时候，搜索范围设置在多少比较合适？造成算法预测准确度这么低的原因会有哪些？图片描述

写回答

1回答

liuyubobobo

2021-12-18

数据量大概多大？

==========

如果你有 5 个特征，degree = 5，就意味着有 5^5 = 3125 个特征了。这个特征量就已经远远大于你现在的数据量了。而如果 degree = 10，就生成了 9765625 个特征，这个特征量太大了，妥妥的维度灾难。（3125 个特征已经肯定维数灾难了。）

要想获得较好的结果，在大多数情况下，至少数据量要大于特征量，最好的情况下，数据量应该是特征量的 10 倍乃至 100 倍以上。（对比你说获得比较好的效果，degree = 2，就是有 25 个特征，1400 的数据量是 25 的 56 倍左右。）

如果你想要使用多项式特征，就要增大数据量。增大到什么地步？请参考上面我计算出的特征数。

从这些数据，你也可以看出来，实际上在大多数时候，多项式特征都不是一个好的特征工程方式。即使使用，degree = 3 撑死了。（对于诸如图像数据这种高维数据，连 degree = 2 都没有用。）多项式特征是一个极好的介绍“过拟合”概念的方式（所以这个课程在介绍完多项式特征以后，马上介绍过拟合。）但它不是一个好的特征工程方式。

继续加油！：）

liuyubobobo

luluoverflow

意味着在你的数据和方法下，不要正则化项，得到的结果更好。但这不代表正则化没有意义。你的代码没有验证数据集，所以有蛮高的概率最终的结果对测试数据集过拟合了。请使用验证数据集再试一下。切记，机器学习的目标不是活的最大的测试得分，而是在顾及泛化的效果上，准确度越高越好。不讨论泛化，准确度没有意义。因为理论上，任何数据，一定能找到一个模型，做到 100% 的准确。但关键是，遇到新的数据，结果怎么样。请再仔细体会一下这一小节：https://coding.imooc.com/lesson/169.html#mid=10031 甚至是这一章整体和具体算法无关的内容（什么叫泛化，什么叫验证数据集，什么叫交叉验证，为什么引入他们（包括我们到底为什么引入了正则化这个概念））。毫不夸张的说，对于机器学习来说，这些概念比具体的算法要重要。继续加油！：）

2021-12-18

共7条回复

Python3入门机器学习经典算法与应用

Python3+sklearn，兼顾原理、算法底层实现和框架使用。

5985 学习 · 2456 问题

查看课程

相似问题

mnist 逻辑回归不收敛

回答 1

问下逻辑回归中的“逻辑”是什么意思，为什么叫逻辑，是怎么来的？

回答 1

回归方法的类型

回答 1

线性回归需要用train_test_split和Scaler来提高性能吗？

回答 1

ConvergenceWarning

回答 1

打开慕课网App查看更多内容