关于图像参数的几个问题

来源:8-1 卷积神经网络(一)

慕娘6279593

2024-05-13

1,一开始提到的28*28的图片使用784的数组加上两个392的神经网络层是怎么计算出他的训练参数为465706的呢?

2,第二个例子小猫图片是500*400像素的图片他的训练参数是怎么计算出78558378这个参数量的呢?

3,这个模型学习的参数量是怎么理解,这个与我们说的LLM大模型的学习数量是一回事吗,比如开源的llama模型一开始有70亿个参数,这两个参数有什么区别吗,llama模型有70亿个参数可以做很多问答了,但是这个学习一张图片的参数居然要这么多,这又怎么去理解呢?···

写回答

1回答

flare_zhao

2024-06-16

  1. 图片中展示了每层训练参数的个数,第一层是输入特征数(28*28+1)*392 = 307720,同样得到第二层、三层参数,然后求和。

  2. 计算方式和第一种情况一样

  3. 意思是一样的,都是超参数。这是最基本的cnn结构,可以通过一系列的方法减少训练参数的数量,同时尽可能保证效果。此外,同样的模型和参数,也可以用在其他图片的识别。

0
0

Python3入门人工智能 掌握机器学习+深度学习

人工智能基础全方位讲解,构建完整人工智能知识体系,带你入门AI

1946 学习 · 594 问题

查看课程