10 najczęściej zadawanych pytań do ankietera

Dziedzina nauki o danych stale się rozwija, obejmując kilka branż i wymagając szerokiego zestawu umiejętności, w tym matematyki, statystyki, programowania i marketingu. Stanie się naukowcem danych wymaga imponującego połączenia umiejętności technicznych, kreatywności i komunikacji.

Opisy stanowisk dla badaczy danych mogą się znacznie różnić, chociaż wszyscy szukają kandydatów z długą listą najbardziej pożądanych umiejętności zawodowych, takich jak krytyczne myślenie, rozwiązywanie problemów, analiza danych, inteligencja emocjonalna, dbałość o szczegóły i praca zespołowa. Oznacza to, że pytania do wywiadu dla naukowców zajmujących się danymi mogą obejmować kilka różnych tematów, od typowych zapytań dotyczących umiejętności miękkich po niezwykle techniczne dyskusje.

Wywiady z Data Science wymagają dużo przygotowania. Niezależnie od tego, czy dopiero zaczynasz naukę w wyższej szkole informatycznej, czy chcesz przenieść się do innej firmy lub branży, powinieneś poświęcić czas na omówienie głównych koncepcji swojej pracy. Tak jak wiesz, jak prowadzić, ale możesz mieć problemy z recytowaniem określonych zasad ruchu drogowego, możesz utknąć w wywiadzie, próbując określić, w jaki sposób działa określony algorytm.

Aby pomóc Ci w przygotowaniu, zebraliśmy 10 najczęściej zadawanych pytań do ankietera. Od wczesnych projekcji po filmy wideo drugiego i trzeciego etapu oraz wywiady na miejscu - spotkasz się z różnorodnymi egzaminami, takimi jak umiejętności techniczne, umiejętności komunikacyjne i styl pracy.

1. „Powiedz nam więcej o najnowszym projekcie w swoim portfolio”.

Badacze danych są poszukiwani w wielu różnych branżach, ale firmy często szukają kogoś o bardzo specyficznych umiejętnościach i dobrym dopasowaniu kulturowym. Szczegółowe portfolio online przedstawiające rodzaj pracy, do której jesteś zdolny, a także silną obecność w mediach społecznościowych i osobistą markę, pomaga wyróżnić się na tle innych kandydatów, a także połączyć Cię z zatrudnianiem menedżerów i rekruterów na stanowiska, na które jesteś idealnie nadaje się do.

Bądź przygotowany w każdym wywiadzie dotyczącym danych, aby obszernie rozmawiać o wszystkich elementach swojego CV, portfolio lub strony internetowej. Dostosuj swoją odpowiedź na temat projektu do swoich odbiorców. Jeśli jest to wstępny przegląd lub panel z uczestnikami z różnych działów, powinieneś skupić się na tym, jak twoja praca przyniosła pozytywne wyniki dla klienta i jego firmy.

Po przejściu do części procesu rozmowy, w której spotykasz się z innym badaczem danych, inżynierem, analitykiem lub inną osobą techniczną, wymagany jest bardziej szczegółowy opis danych i procesów zaangażowanych w twoją pracę.

2. „Dlaczego chcesz pracować dla tej firmy?”

Nawet jeśli skontaktujesz się bezpośrednio z portfelem internetowym lub profilem LinkedIn i zostaniesz zaproszony na rozmowę kwalifikacyjną na otwarte stanowisko, firma nadal będzie chciała wiedzieć, dlaczego się zgodziłeś i dlaczego uważasz, że będziesz dobrze pasować do tej pracy.

Oprócz doskonalenia umiejętności technicznych, przygotowania do rozmowy kwalifikacyjnej powinny obejmować badania dotyczące firmy, do której aplikujesz. Informacje na temat ich branży, misji, personelu, dokładnie tego, co robią i jak dobrze to robią, pomogą ci przygotować odpowiedź na to pytanie.

Określ, w jaki sposób Twój zestaw umiejętności pomoże im osiągnąć wyznaczone cele. Znajdź sposób wyrażenia pasji na temat jednego lub kilku aspektów swojej roli, w tym misji, filozofii, innowacji lub linii produktów. Jeśli jest to Twoja wymarzona praca, warto poświęcić czas na przygotowanie projektu analizy danych przed wywiadem, który rozwiązuje dla nich problem - na przykład odwoływanie się do nowej grupy demograficznej lub bardziej wydajne planowanie dostaw.

3. „Wymień naukowców, których najbardziej podziwiasz, i wyjaśnij, dlaczego”.

Chociaż jest to bardzo osobiste pytanie, które technicznie nie ma właściwej odpowiedzi, wybrane odpowiedzi są bardzo ważne. Twoje badania dotyczące firmy, a także badania w panelu wywiadu, mogą pomóc ci zrobić dobre pierwsze wrażenie z samym pytaniem.

Znając ludzi, którzy są wybitni w tej dziedzinie, a także tych, którzy obecnie robią fale, pokaże ankieterom, że masz wiedzę i pasję do branży. Przydatne jest omówienie naukowców zajmujących się danymi, które są cenione na konkretnej scenie kariery, o którą się ubiegasz, na przykład o finansach, medycynie lub giełdzie.

To pytanie to coś więcej niż imponująca lista nazwisk. Część równania „dlaczego” pokaże również twoim potencjalnym pracodawcom, co cenisz w swojej dziedzinie i jak podejdziesz do swojej pracy. Jeśli twoje badania wykazały, że firma ceni innowację, uczciwość, a nawet pewną metodę statystyczną, jest to świetna okazja, aby poinformować ich, że podzielasz te same wartości.

4. „Jak wyjaśniłbyś silnik rekomendacji komuś z działu marketingu?”

Jedną z ważnych cech, które odróżniają naukowców zajmujących się danymi od innych geniuszy technicznych, jest możliwość konwertowania, wyświetlania i wyjaśniania danych w sposób zrozumiały dla osób nietechnicznych. To sprawia, że ​​takie pytanie jest jednym z najważniejszych pytań podczas wywiadu dla badaczy danych. Ankieterzy chcą zobaczyć, jak dobrze możesz komunikować się z takimi pojęciami, jak modelowanie danych, drzewa decyzyjne i regresja liniowa.

W tym konkretnym przypadku najpierw musisz wyjaśnić w prosty sposób, jak działa silnik rekomendacji, z przykładami zarówno filtrowania opartego na treści, jak i filtrowania grupowego. Następnie będziesz chciał omówić, w jaki sposób możesz współpracować z działem marketingu, aby połączyć ich umiejętności przyciągania klientów z mocą algorytmu, który wykorzystuje zebrane dane, aby pomóc w określeniu, czego chcą konsumenci.

5. „Jakie są różnice między nauką nadzorowaną i bez nadzoru?”

Możesz zacząć od podsumowania, że ​​główna różnica między tymi dwoma polega na tym, że nadzorowane uczenie ma dane szkoleniowe, z których algorytm może się uczyć i udzielać odpowiedzi. Uczenie się bez nadzoru wymaga grupowania rzeczy według podobieństw, typowych anomalii i innych procesów poszukiwania wzorców, a nie twardych i szybkich danych.

Ankieter chce, abyś zagłębił się w szczegóły, dlatego ważne jest, aby wymienić konkretne różnice i móc mówić o różnych stosowanych algorytmach.

Nadzorowana nauka

  • wykorzystuje znane i oznaczone dane jako dane wejściowe
  • ma mechanizm sprzężenia zwrotnego
  • używane do przewidywania
  • jego wspólne algorytmy obejmują drzewo decyzyjne, regresję logistyczną, regresję liniową, maszynę wektorów wsparcia i losowy las

Uczenie się bez nadzoru

  • używa danych nieoznakowanych jako danych wejściowych
  • nie ma mechanizmu sprzężenia zwrotnego
  • wykorzystywane do analizy
  • jego wspólne algorytmy obejmują klastrowanie K-średnich, klastrowanie hierarchiczne, autokodery i reguły asocjacji

Będziesz chciał podać kilka przykładów, ogólnych lub z konkretnego projektu, nad którym pracowałeś, aby zilustrować różnice między tymi dwoma rodzajami uczenia maszynowego oraz to, w jakich przypadkach można je zastosować. Na przykład nauka bez nadzoru może być wykorzystywana przy wprowadzaniu nowego produktu, w przypadku którego dane demograficzne klientów, do których może się odwoływać, są nieznane.

Subskrybować

Zapisz się do naszego newslettera, aby uzyskać więcej niesamowitych treści i uzyskaj 20% ZNIŻKI na nasz test kariery!

Subskrybować

6. „Jak uniknąć stronniczości wyboru?”

To pytanie może przybierać różne formy w wywiadzie dotyczącym danych. Możesz zostać poproszony o zdefiniowanie stronniczości wyboru, jak tego uniknąć lub podać konkretny przykład, w jaki sposób odegrał on rolę w projekcie, nad którym pracowałeś.

Głównym problemem z błędem selekcji jest to, że wyciągnięto wnioski z nielosowej próby. Oczywiście najłatwiejszym rozwiązaniem jest zawsze wybór z losowej próby jasno określonej populacji. Musisz wyjaśnić, dlaczego nie zawsze jest to możliwe.

Należy pamiętać, że ponieważ stronniczość selekcji może być celowa - z celowym wyborem lub eliminacją danych w celu udowodnienia z góry założonej teorii lub prognozy - może to być pośredni sposób dla panelu rekrutacyjnego na zadawanie jednego z tych trudnych pytań podczas rozmowy na temat etyki i uczciwości w pracy .

Ostatecznie będziesz chciał podkreślić, w jaki sposób stronniczość selekcji jest częściej przypadkiem niezamierzonych lub nieuniknionych stronniczości danych. Pamiętaj, aby rozwinąć niektóre obszary, w których może wystąpić błąd selekcji, w tym próbkowanie, przedział czasu, dane i zużycie. Następnie podaj kilka przykładów tego, w jaki sposób techniki dźwigniowe, takie jak ponowne próbkowanie i przyspieszanie, mogą pomóc w obejściu nieprzypadkowych próbek.

Jeśli bierzesz udział w rozmowie kwalifikacyjnej, kiedy rozmawiasz z przedstawicielami mniej technicznych działów, skorzystaj z łatwo przyswajalnego przykładu, który jasno ilustruje stronniczość selekcji. Naukowiec danych, Eric Hollingsworth, odwołuje się do lekcji wyciągniętej z wybuchu ptasiej grypy w 2011 r., W której „tylko bardzo chore osoby zostały policzone” w statystycznej próbie „potwierdzonych przypadków”. Wynikające z tego 80% zgonów, tak strasznych z powodu stronniczości selekcji, wywołało znaczny powszechny strach.

7. „Jak leczyć wartości odstające?”

To często zadawane pytanie przez analityków danych, ponieważ pokazuje, w jaki sposób wykorzystujesz dane, metody, których używasz do przetwarzania tych danych oraz czy jesteś gotów poświęcić czas na ocenę każdej części tych danych.

Najpierw będziesz chciał porozmawiać o tym, co stanowi wartość odstającą, o liczbach, które istnieją daleko poza grupą danych na wykresie, o 2–3 standardowych odchyleniach od średniej i tak dalej. Następnym krokiem w radzeniu sobie z wartościami odstającymi jest ocena, dlaczego tak się stało.

Niewielką liczbę wartości odstających, które można przypisać prostemu błędowi ludzkiemu lub maszynowemu, można łatwo wyeliminować. Pamiętaj jednak, że nawet pojedyncza wartość odstająca może być kluczowym punktem danych, a nie problemem, ponieważ może wskazywać na sukces jednej taktyki marketingowej, nowego składnika leku lub linii produktów.

Następnie musisz wyjaśnić, jak radzić sobie z dużą liczbą wartości odstających, co wymaga bardziej złożonych rozwiązań. Na przykład może być konieczna zmiana używanego modelu, normalizacja danych do średniej lub użycie losowego algorytmu leśnego. Jeszcze raz spróbuj użyć prawdziwego przypadku z twojego doświadczenia jako naukowca danych, aby wyjaśnić prawidłową taktykę.

8. „Dlaczego czyszczenie danych jest ważne?”

Zbieranie i czyszczenie danych to dominująca część pracy naukowca zajmującego się danymi, która zajmuje do 80% czasu. Niezależnie od branży, do której aplikujesz, pytania podczas rozmowy kwalifikacyjnej zawsze zawierają pytanie dotyczące tego, dlaczego czyszczenie danych jest ważne. Ankieterzy zapytają również o twoje preferowane techniki i programy oczyszczania.

Należy podkreślić, jak czyste dane są konieczne, aby wyciągnąć prawidłowe wnioski, ale nie chodzi tylko o liczby. Wyjaśnij, w jaki sposób rozpoczęcie od kompletnych, dokładnych, prawidłowych i jednolitych danych bezpośrednio wpływa na ich działalność. Kluczowe korzyści do omówienia obejmują:

  • usprawnione podejmowanie decyzji dotyczących celów firmy
  • szybsze pozyskiwanie klientów i ponowne ukierunkowanie na poprzednich klientów
  • oszczędność czasu i zasobów dzięki eliminacji niedokładnych lub zduplikowanych danych
  • lepsza wydajność
  • zwiększone morale zespołu dzięki powtarzalnym, wydajnym i dokładnym wynikom

9. „Jaki jest cel testowania A / B?”

Pytania dotyczące testowania A / B podczas wywiadu na stanowisko naukowca danych mogą zaczynać się od bardziej ogólnego odniesienia do korzystania z projektu eksperymentalnego w celu odpowiedzi na jedno pytanie dotyczące zachowania lub preferencji użytkownika. Celem testowania zmiennej projektowej witryny, aplikacji lub biuletynu jest po prostu ocena, czy zmiana zwiększy zainteresowanie, zaangażowanie i współczynnik konwersji.

Jednym ze sposobów wyróżnienia się w odpowiedziach na tego typu pytania podczas wywiadu jest omówienie, w jaki sposób inni naukowcy danych mogą wyciągać błędne wnioski z testów A / B. Możliwe pułapki obejmują:

  • nie gromadzi wystarczającej ilości danych przez wystarczająco długi okres
  • testowanie zbyt wielu zmiennych jednocześnie
  • nie uwzględnia czynników zewnętrznych, które mogą wpływać na ruch w okresie testowym
  • ignorując niewielkie zyski, które mogą z czasem rosnąć i łączyć się z innymi pozytywnymi zmianami w celu zwiększenia przychodów
  • brak interpretacji dużych obrazów, takich jak zyski lub straty finansowe netto w stosunku do kursów wymiany

Oprócz wskazywania tych problemów, musisz wyrazić, w jaki sposób je rozwiążesz - lub jeszcze lepiej, w jaki sposób już ich unikałeś w swoich poprzednich projektach dotyczących analizy danych.

10. „Masz 48 godzin na rozwiązanie tego wyzwania kodowania”.

Wyzwanie kodowania może być początkowym sposobem sprawdzenia potencjalnych naukowców zajmujących się danymi lub może być drugim krokiem w procesie wywiadu po pokonaniu pierwszej przeszkody przez osobę rekrutującą lub menedżera ds. Zatrudnienia. Może to być test na miejscu, który zajmuje od 30 minut do 2 godzin, podczas których będziesz pisać na tablicy lub na klawiaturze w widoku ankietera. Często masz wybór języka, ale bądź przygotowany na kodowanie w SQL lub Python.

Niektóre firmy przydzielają dłuższe zadania z terminami do tygodnia. Wyzwania tablicy mogą wymagać napisania dość prostych zapytań SQL, ale dłuższe testy są oczywiście bardziej złożone. Zazwyczaj będziesz otrzymywać dane i proszony o konkretne prognozy na podstawie tych danych i będziesz musiał pokazać swoją pracę. Na przykład niedawny wywiad z badaczem danych otrzymał dane Airbnb i został poproszony o prognozowanie cen domów na podstawie funkcji zakwaterowania.

Ankieterzy będą chcieli omówić z tobą twoje wybory, przyjęte przez ciebie założenia, wybrane funkcje, dlaczego zastosowałeś określone algorytmy i wiele więcej. Często otrzymywana odpowiedź jest mniej ważna niż proces, kreatywność, czytelność kodu i projekt.

Może to być denerwujące doświadczenie w rozmowie kwalifikacyjnej, więc przygotuj się, tworząc i wykonując wyzwania związane z kodowaniem ćwiczeń z przyjaciółmi lub współpracownikami w dziedzinie nauki danych. Możesz także odwiedzić strony takie jak Leetcode i SQLZOO, aby ćwiczyć kodowanie. Rzeczywiste próbne wywiady dotyczące algorytmów i problemów z projektowaniem systemów są dostępne bezpłatnie na Interviewing.io.

Jak widać, pytania do ankieterów przeprowadzające wywiady mogą być trudne, a cały proces może być długi i wyczerpujący. Jedną z najważniejszych wskazówek podczas rozmowy jest pozostanie pozytywnym, nawet jeśli uważasz, że część procesu rozmowy zakończyła się niepowodzeniem. Często jesteśmy dla siebie trudniejsi niż inni i nadal możesz zdobyć pracę, mimo że nie otrzymujesz każdej odpowiedzi tak idealnej, jak byś chciał.

Jeśli nie możesz skorzystać z okazji, poproś o opinię i skorzystaj z niej, aby poprawić wrażenia podczas następnej rozmowy. W końcu wielu uznanych badaczy danych zostało odrzuconych z kilku stanowisk i nadal odnosiło sukcesy w zawodach, które ostatecznie były lepiej dopasowane!

Jakie pytania i wyzwania związane z kodowaniem napotkałeś podczas próby znalezienia pracy w dziedzinie danych? Dołącz do dyskusji w komentarzach poniżej i pomóż innym naukowcom w przygotowaniu się do następnego wywiadu!

Zostaw Swój Komentarz

Please enter your comment!
Please enter your name here