Stack Exchange ist, wie wir alle wissen, eine Sammlung von Q & A-Sites mit diversifizierten Themen. Angenommen, jede Site ist unabhängig voneinander, wie kann man angesichts der Statistiken eines Benutzers seine "Rundung" im Vergleich zum nächsten berechnen? Was ist das statistische Tool, das ich verwenden sollte?
Um ehrlich zu sein, weiß ich nicht genau, wie man die "Well-Rundheit" mathematisch definiert, aber sie muss die folgenden Eigenschaften haben:
- Wenn alle Dinge gleich sind, ist er umso runder, je mehr Wiederholungen ein Benutzer hat
- Wenn alle Dinge gleich sind, ist er umso runder, je mehr Websites ein Benutzer besucht.
- Ob Antwort oder Frage keinen Einfluss auf die Rundheit haben
Antworten:
Sie müssen auch die Ähnlichkeit zwischen den Websites berücksichtigen. Jemand, der an StackOverflow und Seasoned Advice teilnimmt, ist runder als jemand, der an SO und CrossValidated teilnimmt, der wiederum (ich würde argumentieren) runder ist als jemand, der an SO und Programmierern teilnimmt . Es gibt zweifellos viele Möglichkeiten, dies zu tun, aber Sie können die überlappende Registrierung überprüfen, um ein Gefühl dafür zu bekommen.
quelle
BEISPIEL: Angenommen, es gibt drei Websites, und wir möchten die Rundung der Benutzer A, B, C vergleichen. Wir schreiben den Ruf der Benutzer über die drei Websites in Vektorform:
Wir würden A als runder als B betrachten (ihr Ruf ist gleichmäßig auf zwei Standorte verteilt, aber A hat einen besseren Ruf). Wir würden C auch als runder als B betrachten (sie haben den gleichen Ruf, aber C hat eine gleichmäßige Verteilung auf mehr Standorte). Es ist unentschlossen, ob A als runder als C angesehen werden sollte oder umgekehrt .
Zwei gängige Beispiele für konvexe Funktionen sind die 'Bruchnorm'
Gemessen an der skalierten Shannon-Entropie würden wir sagen, dass C die am besten gerundete der drei und A die am zweithäufigsten gerundete ist.
EDIT2: Ein Beispiel wurde im Lichte von Whubers Kommentar hinzugefügt.
quelle
Dies ist eine sehr, sehr interessante Frage (in der Tat bin ich etwas verliebt in die Idee, die Stapelaustauschstellen im Allgemeinen zu modellieren).
In Bezug auf die Frage der Rundung besteht eine Möglichkeit, dies zu bewerten, in den Tags, die bestimmte Benutzer tendenziell beantworten, und in ihrer Verteilung auf mehrere Websites. Beispiele können dies klarer machen.
Ich bin Mitglied bei TeX, StackOverflow, CrossValidated und AskUbuntu. Jetzt trage ich wirklich nur zu hier und StackOverflow bei und nur zu R bei Stackoverflow. Um eine gute Rundung zu definieren, würde ich a) die Anzahl der Tags betrachten, die zwei Websites gemeinsam haben (um die Ähnlichkeit zwischen Websites zu definieren) und das Ausmaß, in dem ein Benutzer Fragen zu Websites beantwortet, die nur wenige oder keine Tags gemeinsam haben.
Wenn zum Beispiel jemand zu Python-Tags für StackOverflow und Kochen beiträgt, ist diese Person runder als jemand, der Fragen zur statistischen Software (zum Beispiel) zu Überlauf- und Statistikfragen hier beantwortet.
Ich hoffe das ist etwas hilfreich.
quelle
Wenn Sie "Rundung" als "Beitrag zu vielen verschiedenen Stack Exchange-Sites" definieren, würde ich eine Metrik des Beitrags pro Site berechnen. Sie können die Gesamtzahl der Beiträge oder die durchschnittlichen Beiträge pro Tag oder möglicherweise den Ruf verwenden. Schauen Sie sich dann die Verteilung dieser Metrik auf alle Websites an und berechnen Sie ihre Schiefe auf eine sinnvolle Weise.
Mit anderen Worten, eine "gut gerundete" Person wäre eine Person, die zu vielen verschiedenen Sites beiträgt, während eine "nicht abgerundete" Person eine Person wäre, die hauptsächlich zu einer Site beiträgt. Sie können dies weiter verbessern, indem Sie Ihre Metrik mit der Gesamtsumme eines Benutzers auf allen Websites skalieren. dh jemand, der viel zu vielen verschiedenen Websites beigetragen hat, sollte als runder angesehen werden als jemand, der nichts zu einer der Websites beigetragen hat. Eine Person, die SE noch nie benutzt hat, ist nicht sehr gut gerundet!
quelle
Schon viele gute Antworten, warum noch eine? Dies dient hauptsächlich dazu, die Aufmerksamkeit auf die interessanten Ideen zu lenken, die hier im The n-Category Café diskutiert werden . Während die Vielfalt in der Ökologie (und anderswo) meist nur die Fülle betrachtet, sollte man auch untersuchen, wie ähnlich / unähnlich die verschiedenen Arten sind.
Durch die Darstellung der Spezies (oder was auch immer, wie SE-Stellen ...) als Punkte in einem metrischen Raum führt dies zu einer Verallgemeinerung der Entropie auf metrische Räume, siehe zum Beispiel Die maximale Entropie eines metrischen Raums von Tom Leinster, Emily Roff . Dieselben Ideen könnten in SE-Sites verwendet werden, indem Tags als Punkte in einem metrischen Raum betrachtet werden.
quelle