nn实现的交叉熵和我们自己实现的并不一样,传入的 X 是不需要做一遍 sotfmax 的,同时传入的 Y 不需要做 one_hot 。
nn.CrossEntropyLoss 会在输出时做一遍 softmax 。
文本预处理→