关于多层感知器
来源:7-2 MLP实现非线性分类
好好加油学习
2020-10-27
老师您好,我想问一下关于我理解的多层感知器是否正确。
多层感知器是不是就是使用了多层感知器的模型架构,然后用比如课程中的例子中那样的图片数据来训练模型,最终得到分类。然后其中模型中又实用了逻辑回归类似的表达式和函数来模拟神经网络?是这么理解的吗?
还有就是老师您能稍微讲一下它的原理?为什么通过这个模型架构就可以实现呢?
谢谢老师
写回答
1回答
-
多层感知器,也就是我们所说的神经网络,将很多的神经元组合在一起这样就可以进行更为复杂的判断,核心就是基于多层感知器的一个结构框架。为什么通过这样的叠加可以解决更为复杂的任务?我们举个例子:
假设y与x是非线性边界分类关系,而一个神经元可以实现f=sigmoid(ax+b)的线性边界运算,现在我们把两个神经元叠加在一起看看会发生什么:
神经元1:f1=sigmoid(a1*x+b1)
神经元2: f2=sigmoid(a2*f1+b2)
然后从x》f1>f2的过程就是:
f2=sigmoid(a2*f1+b2)=sigmoid(a2*sigmoid(a1*x+b1)+b2)
这个看起来有点复杂哈,但通过这样的变化,你会发现f2的分类边界是非线性的,也就是说通过这样的简单叠加就实现了更为复杂的分类。
实际的mlp结构还不仅仅是两个神经元叠加,而是更多,而且每个神经元的函数关系也不一定是sigmoid函数,因此可以实现复杂的推理
172020-11-01
相似问题