Bei der kollaborativen Filterung gibt es Werte, die nicht ausgefüllt sind. Angenommen, ein Benutzer hat keinen Film angesehen, und wir müssen dort ein 'na' einfügen.
Wenn ich eine SVD dieser Matrix erstellen möchte, muss ich eine Zahl eingeben, z. B. 0. Wenn ich die Matrix faktorisiere, kann ich ähnliche Benutzer finden (indem ich herausfinde, welche Benutzer näher beieinander liegen) der reduzierte Dimensionsraum). Aber die vorhergesagte Präferenz selbst - für einen Benutzer zu einem Artikel wird Null sein. (weil wir das in die unbekannten Spalten eingegeben haben).
Ich stehe also vor dem Problem der kollaborativen Filterung im Vergleich zu SVD. Sie scheinen fast gleich zu sein, aber nicht ganz.
Was ist der Unterschied zwischen ihnen und was passiert, wenn ich eine SVD auf ein Problem der kollaborativen Filterung anwende? Ich habe es getan, und die Ergebnisse scheinen akzeptabel zu sein, wenn es darum geht, Benutzer in der Nähe zu finden. Das ist großartig, aber wie?