Ich suche nach Tools, mit denen ich und mein Team Trainingssätze kommentieren können. Ich arbeite in einer Umgebung mit großen Datenmengen, von denen einige un- oder halbstrukturiert sind. In vielen Fällen gibt es Registrierungen, die helfen, eine fundierte Wahrheit zu finden. In vielen Fällen wird jedoch ein kuratierter Satz benötigt, auch wenn er nur zur Bewertung dient. Ein erschwerender Faktor ist, dass einige der Daten die Prämisse nicht verlassen können.
Wir möchten eine Objekterkennungsaufgabe mit Anmerkungen versehen, aber ich erwarte in naher Zukunft eine Bildsegmentierungsaufgabe, eine Textklassifizierungsaufgabe und eine Stimmungserkennungsaufgabe.
Was ich suche, ist ein System, das einer Gruppe helfen kann, eine Annotation zu erstellen, vorzugsweise auf eine Weise, die die Annotatoren motiviert, indem es den Gruppenfortschritt, den relativen individuellen Fortschritt und möglicherweise die persönliche Vereinbarung zwischen Annotatoren anzeigt.
quelle
Antworten:
Sie können Prodigy durch Explosion.ai ausprobieren , Entwickler von Spacy oder Brat, eine Open-Source-Alternative dazu. Sie können auch auf diesen Beitrag auf Qoura verweisen.
quelle
Doccano ist eine einfachere Open Source-Alternative zu Prodigy. Seine native Python über Django. Ich fand es für einfache Implementierungen geeignet.
quelle
Diffgram kann zum Erstellen und Verwalten von Trainingsdaten verwendet werden.
quelle
Ich habe mit der SpaCy- Erweiterung für INCEpTION der Technischen Universität Darmstadt gearbeitet. Scheint bisher ziemlich gut zu sein.
quelle
(Ich habe gerade eine Python - Bibliothek erstellt GitHub - Blog Post ) , um schnell Trainingsdaten für Spacy NER Modelle mit ipywidgets zu erstellen.
quelle