深度学习初探神经网络的基本结构

2025-09-22 约 1258 字预计阅读 3 分钟

深度学习初探：神经网络的基本结构

[ VibeCoding·九月创作之星挑战赛 10w+人浏览 2.2k人参与

]( )

在人工智能的浪潮中，深度学习（Deep Learning） 是近年来最火热的研究与应用方向。而支撑深度学习的核心就是——人工神经网络（Artificial Neural Network, ANN）。本文将带你初步了解神经网络的基本结构，帮助你快速入门。

人工神经网络的灵感来源于人类大脑的神经元结构。大脑通过神经元的连接和信号传递处理信息，而人工神经网络则用数学函数与矩阵运算模拟这一过程。

位于输入层与输出层之间，由多个神经元组成。
每一层神经元都会将输入做加权求和，再经过 激活函数（Activation Function） 处理，增加非线性。
深度学习的“深度”就是指隐藏层的层数。
常见激活函数：
- ReLU：ReLU(x)=max⁡(0,x)\text{ReLU}(x) = \max(0, x)ReLU(x)=max(0,x)
- Sigmoid：将结果映射到 [0,1][0,1][0,1]
- Tanh：映射到 [−1,1][-1,1][−1,1]

公式：

z=w1x1+w2x2+…+wnxn+b z = w_1x_1 + w_2x_2 + … + w_nx_n + b z=w1x1+w2x2+…+wnxn+b

输入数据依次通过各层神经元，逐层计算输出，直到得到预测结果。

神经网络通过 误差反向传播 来更新参数。

以二分类任务（如“是否点击广告”）为例：

最终，模型可以自动学习哪些特征对结果更重要，从而进行预测。

神经网络的基本结构包括：

理解了这些基础，才能更好地学习 CNN（卷积神经网络）、RNN（循环神经网络）、Transformer 等更复杂的深度学习模型。