sigmoid应该有很多形式吧,为什么选择了这个形式?
来源:9-5 决策边界
神经旷野舞者
2018-03-13
就是如下图的形式 1 / (1+e^t)可以作为逻辑函数吗,是不是只要能把一个值映射到(0, 1)区间上即可,这应该有很多种函数吧,为什么只选了sigmoid呢?
写回答
1回答
-
不仅要满足映射到0,1,还要满足:当x = 0时;y正好为0.5;且x=负无穷和x=正无穷的时候,y分别趋近于0和1。另外,sigmoid函数是连续可导函数,为我们计算带来了方便。是的,理论上满足这些的条件的函数都可以。sigmoid是最简单的满足这样条件的函数:)
如果你去深入翻阅一些资料,会看到一些解释,认为sigmoid函数更“自然”,并且有一些数学上的解释——满足最大似然估计的结果。印象里PRML上就有相关证明,就是这本非常著名的机器学习的教材( https://book.douban.com/subject/2061116/)。但是,也必须承认,sigmoid是不是最优的,其实在学术界也是有争论的。不过这些讨论完全不在这个课程的范畴里。有兴趣可以参阅PRML:)
加油!:)
032018-03-13
相似问题