神经网络的基本概念

Yama-lei2025年2月15日大约 2 分钟

神经网络基础结构

值得参考的资料：

神经元接受多个加权输入和bias，如果结果大于激活的阈值，那么就会进行输出

即：

MLP神经网络可分为三层：输入层，隐藏层，输出层

决定神经元是否应该被激活的函数，常见的有：

前面说每一个神经元都有许许多多个参数（权重等），想要找到最好的模型，就需要找到一组最佳参数。

通过对模型的性能进行评估，来调整参数，直到效果符合要求。

这里需要解决两个问题：

1. 如何评估模型的效果

2. 如何更好的调整参数

损失函数用于衡量模型的预测值与真实值之间的差异。

常见的损失函数包括：

我们考虑：每一组参数就会有一个损失值，那么损失值可以看做是关于这些参数的一个多元函数，我们的任务变成了找到这组多元函数的最小值。

所以我们需要反向传播算法来计算梯度，从而调整每一个参数，使得顺势能够最小。

在深度学习中，模型的训练过程通常包括以下几个步骤：
1. 前向传播（Forward Propagation） ：通过输入数据和模型参数，计算输出。
2. 计算损失（Loss Calculation） ：根据模型的输出和真实标签，计算损失函数的值。
3. 反向传播（Backward Propagation） ：根据损失函数，计算损失对模型参数的梯度。
4. 参数更新（Parameter Update） ：使用优化算法（如梯度下降）更新模型参数。