Ich interviewe Leute für eine Position als Entwickler / Forscher von Algorithmen in einem Kontext von Statistik, maschinellem Lernen und Data Mining.
Ich suche nach Fragen, um insbesondere die Vertrautheit, das Verständnis und die Fließfähigkeit eines Kandidaten mit der zugrunde liegenden Theorie zu bestimmen, z. B. grundlegende Eigenschaften von Erwartung und Varianz, einige häufige Verteilungen usw.
Meine aktuelle Frage lautet: "Es gibt eine unbekannte Größe die wir schätzen möchten. Zu diesem Zweck haben wir Schätzer Y 1 , Y 2 , ... , Y n , die bei X alle unvoreingenommen und unabhängig sind, und jedes hat eine bekannte Varianz & sgr; 2 i , die für jedes unterschiedlich ist. Finden Sie den optimalen Schätzer Y = f ( Y 1 , … , Y n ), der unbefangen ist und eine minimale Varianz hat. "
Ich erwarte von jedem ernsthaften Kandidaten, dass er problemlos damit umgeht (wenn man etwas Zeit hat, die Berechnungen zu erarbeiten), und ich bin dennoch überrascht, wie viele Kandidaten, die angeblich aus relevanten Bereichen stammen, nicht einmal die geringsten Fortschritte erzielen. Ich halte es daher für eine gute, diskriminierende Frage. Das einzige Problem bei dieser Frage ist, dass es sich nur um eine handelt.
Welche weiteren Fragen können dazu herangezogen werden? Wo kann ich alternativ eine Sammlung solcher Fragen finden?
quelle
Antworten:
Was soll Ihr statistischer Entwickler tun?
Die US-Armee sagt, "trainiere, dass du kämpfen wirst, weil du kämpfen wirst, als ob du trainiert wurdest". Testen Sie sie den ganzen Tag, was Sie wollen. Sie möchten wirklich, dass sie für das Unternehmen "Wert schaffen" oder "Geld verdienen".
Boss 101
Denke "Zeig mir das Geld."
Hinweis: Wenn Ihre symbolische Manipulationsfrage nicht sauber mit dem "Geld" verbunden ist, stellen Sie möglicherweise die falsche Frage.
Es gibt drei Dinge, die jeder Mitarbeiter tun muss, um ein Mitarbeiter zu sein:
Wenn Sie diese Daten nicht erhalten, wird Ihnen keine andere Antwort etwas nützen.
Wenn Sie sie durch eine gute Software oder einen gut ausgebildeten Teenager ersetzen können, müssen Sie das irgendwann tun, und es wird Sie kosten.
Daten 101
Was sie können sollten:
Sind diese beiden gleich oder verschieden (auch bekannt als Cluster / Klassifizieren), in welcher Beziehung steht dies dazu (Regression / Anpassung einschließlich linearer Modelle, glm, radiale Basis,
Differenzgleichungen), ist es wahr, dass "x "(Hypothesentest), wie viele Proben benötige ich (Akzeptanzstichprobe), wie erhalte ich die meisten
Daten aus wenigen / billigen / effizienten Experimenten (statistische
Versuchsplanung) - Haftungsausschluss, ich bin Ingenieur, kein Statistiker Sie sie fragen könnten die Frage "Was sind die verschiedenen grundlegenden Aufgaben und wie testen Sie, ob der Statistiker sie effizient und korrekt ausführen kann?
Sie sollten in der Lage sein, aus csv, xlsx (Excel), SQL und
Bildern zu lesen . (HDF5, Rdata) Wenn Sie ein benutzerdefiniertes Format haben, sollten
sie es lesen und schnell und
effizient mit den Tools arbeiten können . Sie sollten Stärke / Schwäche des Formats kennen. CSV ist schnell einsatzbereit, gibt es schon immer, ist ein schneller Prototyp, aber aufgebläht, ineffizient und langsam im Betrieb.
Leute sagen "es gibt Lügen, verdammte Lügen und Statistiken", aber nicht in meiner
Firma. Dieselbe gute Eingabe ergibt dieselbe gute Ausgabe. Die Ausgabe ist keine Zahl, sondern immer eine Geschäftsentscheidung, die eine
technische Aktion informiert und zu einem Geschäftsergebnis führt. Unterschiedliche Tests können das Einstellrad auf 5,5 oder 6,5 einstellen, aber die Fähigkeit liegt immer über 1,33.
und / oder Schergenentwickler und / oder sich selbst in einem Jahr
mit den geringsten Fehlern verstehen können. Eine schöne Sache ist, es erklären zu können, damit deine Oma es bekommt. Dies ( Link ) ist meine Antwort, aber ich mag es.
Analytische Zinger:
Ich denke, unmögliche Fragen sind großartig. Sie sind aus einem bestimmten Grund unmöglich. Zu wissen, ob etwas unmöglich ist, ist eine gute Sache. Zu wissen, warum, wie man sich darauf einlässt oder in der Lage ist, eine andere Frage zu stellen, kann besser sein.
Andere Fragen zum Lebenslauf. ( Link ) Auf reddit. ( link ) andere ( link )
Übrigens: das war eine gute Frage. Möglicherweise muss ich diese Antwort im Laufe der Zeit aktualisieren.
quelle