知识表示的规则
规则1
相似类别中的相似输入通常应产生网络中的相似的表示,因此可以归入同一类中。
相似性的测量方法
欧几里得距离
$$
d(x_i,x_j) = || x_i - x_j || = \left[\sum_{k=1}^m (x_{ik} - x_{jk})^2\right]^{1/2}
$$
内积 给定一对相同维数的向量 $x_i$,$x_j$,他们的内积是 $x_i^Tx_j$,定义为向量 $x_i$ 对向量 $x_j$ 的投影
$$
(x_i,x_j) = x_i^Tx_j = \sum_{k=1}^mx_{ik}x_{jk}
$$
欧几里得距离 $||x_i - x_j||$ 越小,向量 $x_i$ 和 $x_j$ 越相识,内积 $x_i^Tx_j$ 越大
规则2
网络对可分离为不同种的输入向量给出差别很大的表示
规则3
如果某个特征很重要,那么网络表示这个向量将设计大量神经元
规则4
如果存在先验信息和不变性,应该将其附加在网络设计中,这样就不必学习这些信息而简化网络设计
怎样在神经网络设计中加入先验信息
- 通过使用称为接收域(receptive field)的局部连接,限制网络结构
- 通过使用权值共享(weight-sharing),限制突触权值的选择
如何在神经网络设计中建立不变性
- 结构不变性 同一输入变换后必须得到同样的输出
- 训练不变性 用一些来自同一目标的不同样本训练网络,这些样本代表目标的不同变换
- 不变特征空间 提取表示输入数据本质信息内容特征的特征,并且这些特征对输入的变换保持不变