你好,看了你关于最大熵模型应用于MNIST数据集上的python代码,有一些不懂的地方想要请教一下。 就是应该如何理解特征函数这个东西。代码中关于82页最下方的期望,x是用的(0_x1,y)这样的特征,但是在计算83页最上方的期望的时候,x又变成了一整个输入向量(0_x1,1_x2,.....).请问这个是为什么呢? 不甚感谢