ニューラルネットを3層→4層にしたらXORを正しく学習しなくなった

以下、？ちゃんねるからVIPがお送りします

3層の時の重みは
1層目で値を横流し
2層目で(入力値1 * -1) + (入力値2 * 1)を出力として出す
みたいな感じになってるんだけど

4層にすると
1層目が入力値1==0 && 入力値2==1 の場合0,1を出力、それ以外は0,0
2層目からは3層構成と同じ
みたいな重みになる