Ich habe einen anstößigen Inhaltsprüfer für meine Website entwickelt und möchte ihn auf GitHub veröffentlichen . Der Quellcode enthält jedoch viele anstößige, rassistische und sonst böse Inhalte.
Die Quelle ist vollständig dokumentiert, aber ich wollte Ihre Meinung dazu, ob es akzeptabel ist, solche Arbeiten auf GitHub zu veröffentlichen, oder ob Sie die Fülle der Zeichenfolgen der Vorstellungskraft des Lesers überlassen ?!
Antworten:
Ich muss mit der ROT-13-Lösung nicht einverstanden sein. Deine verbotenen Wörter zu verschleiern, nur weil der Anblick von ihnen jemanden beleidigen könnte, ist Zeitverschwendung.
Ihr Wörterbuch mit schlechten Wörtern / Regeln für schlechte Wörter sollte sowieso aus einer separaten Datei stammen (die zur Laufzeit geladen oder als Ressource eingebettet werden kann) . Das Verschleiern dieser Datei erschwert es Ihnen / anderen Entwicklern / Ihren Benutzern, sie zu ändern oder Probleme zu beheben. Außerdem würde ich erwarten , dass eine Datei mit dem Namen "banned_words.txt" eine Liste anstößiger Wörter enthält.
quelle
"Alle Probleme in der Informatik können durch eine andere Indirektionsebene gelöst werden." ( von David Wheeler ).
Ihre Optionen beschränken sich nicht nur auf das Hochladen oder nicht, wenn Sie berücksichtigen, dass Sie Inhalte codieren können, damit die Leser nicht gestört werden.
Wie in den Kommentaren ausgeführt , wird ein Ansatz wie der oben beschriebene in der ROT13- Buchstaben- Ersetzungs-Chiffre verwendet , die für ihre Verwendung "als Mittel zum Verbergen ... anstößiger Materialien vor dem zufälligen Blick ..." bekannt ist.
Der Vollständigkeit halber sollten Sie in Erwägung ziehen, Ihren Checker zusätzlich mit einem codierten Wörterbuch zu vergleichen , um sicherzustellen, dass die ausgewählte Codierung nicht versehentlich ein beleidigendes Wort in ein anderes verwandelt.
Wenn man solche Dinge verschlüsselt, ist es sinnvoll, sie noch einmal zu überprüfen, da man die Dinge nicht zuverlässig vorhersagen kann. In einem meiner früheren Projekte kam es zu einem ziemlich schwerwiegenden Mail-Ausfall, als ein falsch konfigurierter Checker anstößige Inhalte in zufälligen Zeichenfolgen entdeckte (im nicht verschlüsselten Inhalt von ZIP-Archiven).
Verglichen mit der Weitergabe von einfachem Text in Gvdls hat die Codierung den wesentlichen Vorteil, dass rechtliche Probleme und alle damit verbundenen Risiken und Abhängigkeiten vollständig vermieden werden .
Man denke nur daran. Angenommen, bestimmte Servicebedingungen in einem bestimmten Repository lassen meinen Inhalt zu.
Aber was ist, wenn sie sich entscheiden, die AGB zu ändern ? Oder was ist, wenn ich mich entscheide, in ein anderes Repository zu wechseln, mit inkompatiblen Begriffen. Was soll ich tun?
Beachten Sie übrigens, dass selbst wenn Sie sich hier und jetzt in einem "freundlichen" Repository befinden, dies noch nicht ganz sicher ist.
Was ist, wenn jemand meinen Inhalt aufgrund eines seltsamen Webfilters nicht herunterladen kann ? Bin ich bereit, auf Beschwerden von Benutzern zu antworten und zu erklären, wie der Filter repariert werden kann? Ihr Filter ...
... Sie sehen, ich würde lieber zweimal überlegen, bevor ich mich gegen eine Codierung entscheide. Und selbst wenn ich mich entscheide, würde ich dafür einen sehr, sehr guten Grund haben.
quelle