Ist es akzeptabel, anstößige Inhalte auf GitHub hochzuladen? [geschlossen]

12

Ich habe einen anstößigen Inhaltsprüfer für meine Website entwickelt und möchte ihn auf GitHub veröffentlichen . Der Quellcode enthält jedoch viele anstößige, rassistische und sonst böse Inhalte.

Die Quelle ist vollständig dokumentiert, aber ich wollte Ihre Meinung dazu, ob es akzeptabel ist, solche Arbeiten auf GitHub zu veröffentlichen, oder ob Sie die Fülle der Zeichenfolgen der Vorstellungskraft des Lesers überlassen ?!

SimonGoldstone.com
quelle
11
Die Schlüsselfrage ist wahrscheinlich "Ist es tatsächlich beleidigend? Oder ist es nur ein" Dikton "?" das kommt in den Github TOS - §7 legt nahe, dass sie es entfernen dürfen (aber nicht dazu verpflichtet sind). Möglicherweise möchten Sie die Zeichenfolgen in eine andere Datei extrahieren lassen, die dann rot13-verschlüsselt ist, oder in eine solche, um den kausalen Browser nicht zu verletzen.
1
Ich denke, es ist in Ordnung, warnen Sie nur mögliche Leser in der Readme, es gibt viele anstößige Wörter in anderen GitHub Repos. Außerdem ist Ihr Fall in gutem Glauben.
Jacktrades
5
Warum nicht alle Wörter in eine Textdatei oder Datenbank einfügen und zur Laufzeit laden? Fügen Sie dann am Anfang der Datei einen kleinen Haftungsausschluss ein, der besagt, dass der folgende Text nichts für schwache Nerven ist. Ihr Code ist sauber und Sie können verschiedene Textdateien für verschiedene Situationen verwenden?
Ampt
@Sparticus danke für deinen Kommentar. Ich stimme zu und denke, das ist wahrscheinlich der beste Ansatz für mich.
SimonGoldstone.com
5
Ein Wort allein ist nicht beleidigend. Die Absicht dahinter macht es beleidigend.
Kaptan

Antworten:

45

Ich muss mit der ROT-13-Lösung nicht einverstanden sein. Deine verbotenen Wörter zu verschleiern, nur weil der Anblick von ihnen jemanden beleidigen könnte, ist Zeitverschwendung.

Ihr Wörterbuch mit schlechten Wörtern / Regeln für schlechte Wörter sollte sowieso aus einer separaten Datei stammen (die zur Laufzeit geladen oder als Ressource eingebettet werden kann) . Das Verschleiern dieser Datei erschwert es Ihnen / anderen Entwicklern / Ihren Benutzern, sie zu ändern oder Probleme zu beheben. Außerdem würde ich erwarten , dass eine Datei mit dem Namen "banned_words.txt" eine Liste anstößiger Wörter enthält.

BlueRaja - Danny Pflughoeft
quelle
Genau. Ich möchte die Worte nicht verschleiern.
SimonGoldstone.com
5
+1 @simon Solche Listen erscheinen bereits: github.com/snipe/banbuilder
dcaswell
2
@simon Ich habe nicht gemeint, dass sich Ihr Projekt nicht lohnt, nur, dass Github es Leuten ermöglicht, Listen so zu speichern, wie Sie es möchten. Die andere Antwort hat kein Ja oder Nein, ich wollte Ihnen nur bestätigen, dass die Antwort tatsächlich Ja war.
dcaswell
1
"Das Rad neu erfinden" ist ein Teil des Lernens ... es sind die meisten Dinge, die im College gelehrt werden.
WernerCD
2
Manchmal begegnet man Menschen mit ... wie sollen wir sagen ... heiklen Empfindungen, die einen gewissen Einfluss darauf haben können, ob die Verteilung des Programms anhält oder nicht. Wenn rot13ing die Datei bedeutet, dass sie bleibt, hilft dies dem OP, sein Ziel zu erreichen, dass sein Code aktiviert ist und auf GitHub bleibt. Das ist keine Zeitverschwendung in meinem Buch.
Blrfl
16

"Alle Probleme in der Informatik können durch eine andere Indirektionsebene gelöst werden." ( von David Wheeler ).

Ihre Optionen beschränken sich nicht nur auf das Hochladen oder nicht, wenn Sie berücksichtigen, dass Sie Inhalte codieren können, damit die Leser nicht gestört werden.

  • Wenn Sie beispielsweise einfach zum nächsten Buchstaben wechseln (A nach B, B nach C usw., und Z nach A, um die Codierung abzuschließen), können Sie berühmte Wörter mit vier Buchstaben in völlig harmlose Gvdl verwandeln . Alles, was Sie brauchen, um es in Ihrer Anwendung zu verwenden, wäre, es in die entgegengesetzte Richtung zu den vorherigen Buchstaben zu verschieben , wobei A zu Z wechselt.

Wie in den Kommentaren ausgeführt , wird ein Ansatz wie der oben beschriebene in der ROT13- Buchstaben- Ersetzungs-Chiffre verwendet , die für ihre Verwendung "als Mittel zum Verbergen ... anstößiger Materialien vor dem zufälligen Blick ..." bekannt ist.

 

http://upload.wikimedia.org/wikipedia/commons/thumb/3/33/ROT13_table_with_example.svg/320px-ROT13_table_with_example.svg.png


Der Vollständigkeit halber sollten Sie in Erwägung ziehen, Ihren Checker zusätzlich mit einem codierten Wörterbuch zu vergleichen , um sicherzustellen, dass die ausgewählte Codierung nicht versehentlich ein beleidigendes Wort in ein anderes verwandelt.

Wenn man solche Dinge verschlüsselt, ist es sinnvoll, sie noch einmal zu überprüfen, da man die Dinge nicht zuverlässig vorhersagen kann. In einem meiner früheren Projekte kam es zu einem ziemlich schwerwiegenden Mail-Ausfall, als ein falsch konfigurierter Checker anstößige Inhalte in zufälligen Zeichenfolgen entdeckte (im nicht verschlüsselten Inhalt von ZIP-Archiven).


Verglichen mit der Weitergabe von einfachem Text in Gvdls hat die Codierung den wesentlichen Vorteil, dass rechtliche Probleme und alle damit verbundenen Risiken und Abhängigkeiten vollständig vermieden werden .

Man denke nur daran. Angenommen, bestimmte Servicebedingungen in einem bestimmten Repository lassen meinen Inhalt zu.

Aber was ist, wenn sie sich entscheiden, die AGB zu ändern ? Oder was ist, wenn ich mich entscheide, in ein anderes Repository zu wechseln, mit inkompatiblen Begriffen. Was soll ich tun?

Beachten Sie übrigens, dass selbst wenn Sie sich hier und jetzt in einem "freundlichen" Repository befinden, dies noch nicht ganz sicher ist.

Was ist, wenn jemand meinen Inhalt aufgrund eines seltsamen Webfilters nicht herunterladen kann ? Bin ich bereit, auf Beschwerden von Benutzern zu antworten und zu erklären, wie der Filter repariert werden kann? Ihr Filter ...

... Sie sehen, ich würde lieber zweimal überlegen, bevor ich mich gegen eine Codierung entscheide. Und selbst wenn ich mich entscheide, würde ich dafür einen sehr, sehr guten Grund haben.

Mücke
quelle
6
Rot13 ist eine Art De-facto-Standard dafür. Double Rot13 ist noch besser. :-)
Blrfl
5
@Blrfl genau wie Triple DES ist besser als DES, Triple Rot13 ist der richtige Weg.
1
Ich denke, es gibt Plugins für viele Editoren, die das Bearbeiten von rot13-Dateien genauso erschweren wie das Bearbeiten anderer Dateien in einem speziellen Format
JoelFan 18.10.13
2
@ Simon Es ist nicht so sehr so, dass rot13 Verschleierung ist - sondern nur eine Standardmethode, um den Text trivial zu verbergen. Beachten Sie, dass einige Firewalls so konfiguriert sein können, dass bestimmte Zeichenmuster blockiert werden, wodurch es schwierig wird, an Ihren Text für die Funktionalität des Programms zu gelangen. Es ist nicht die Offensivität, die das wahrscheinliche Problem darstellt, sondern die anderen technologischen Hürden, die den Unterschied zwischen "etwas, das Sie herunterladen möchten" und "etwas, das Sie blockieren möchten" möglicherweise nicht erkennen. Ja, sie können den Reißverschluss bekommen, aber sie werden nicht in der Lage sein, zu klonen, zu gabeln oder zu drücken.
2
@ThomasEding Caesar verschiebt die Chiffre um einen Buchstaben. Das erste Zeichen ist ursprünglich ein 'F'.