Aus der Deep-Learning-Klasse der Udacity ist der Softmax von y_i einfach das Exponential geteilt durch die Summe der Exponentiale des gesamten Y-Vektors: Wo S(y_i)ist die Softmax-Funktion von y_iund eist die Exponentialfunktion und jist die Nr. von Spalten im Eingabevektor Y. Ich habe folgendes...