关于多层感知器

来源:7-2 MLP实现非线性分类

好好加油学习

2020-10-27

老师您好,我想问一下关于我理解的多层感知器是否正确。


多层感知器是不是就是使用了多层感知器的模型架构,然后用比如课程中的例子中那样的图片数据来训练模型,最终得到分类。然后其中模型中又实用了逻辑回归类似的表达式和函数来模拟神经网络?是这么理解的吗?


还有就是老师您能稍微讲一下它的原理?为什么通过这个模型架构就可以实现呢?


谢谢老师

写回答

1回答

flare_zhao

2020-10-28

多层感知器,也就是我们所说的神经网络,将很多的神经元组合在一起这样就可以进行更为复杂的判断,核心就是基于多层感知器的一个结构框架。为什么通过这样的叠加可以解决更为复杂的任务?我们举个例子:

假设y与x是非线性边界分类关系,而一个神经元可以实现f=sigmoid(ax+b)的线性边界运算,现在我们把两个神经元叠加在一起看看会发生什么:

神经元1:f1=sigmoid(a1*x+b1)

神经元2: f2=sigmoid(a2*f1+b2)

然后从x》f1>f2的过程就是:

f2=sigmoid(a2*f1+b2)=sigmoid(a2*sigmoid(a1*x+b1)+b2)

这个看起来有点复杂哈,但通过这样的变化,你会发现f2的分类边界是非线性的,也就是说通过这样的简单叠加就实现了更为复杂的分类。

实际的mlp结构还不仅仅是两个神经元叠加,而是更多,而且每个神经元的函数关系也不一定是sigmoid函数,因此可以实现复杂的推理

1
7
flare_zhao
回复
好好加油学习
加油哈
2020-11-01
共7条回复

Python3入门人工智能 掌握机器学习+深度学习

人工智能基础全方位讲解,构建完整人工智能知识体系,带你入门AI

1946 学习 · 594 问题

查看课程