Питања за интервју за науку о подацима

БраинСтатион-ов водич за каријеру Дата Сциентист може вам помоћи да направите прве кораке ка уносној каријери у науци о подацима. Читајте даље за преглед уобичајених питања за интервјуе за послове науке о подацима и како најбоље одговорити на њих.

Постаните Дата Сциентист

Разговарајте са саветником за учење да бисте сазнали више о томе како наши кампови и курсеви могу да вам помогну да постанете научник података.



Кликом на Пошаљи, прихватате наше Услови .



прихвати

Није могуће послати! Освежити страницу и покушати поново?

Сазнајте више о нашем кампу за обуку о науци о подацима

Хвала вам!

Ускоро ћемо бити у контакту.



Погледајте страницу Дата Сциенце Боотцамп

Процеси интервјуа за науку о подацима могу се разликовати у зависности од компаније и индустрије. Обично ће укључивати почетни телефонски преглед са менаџером за запошљавање након чега следи један или неколико интервјуа на лицу места.

Мораћете да одговорите на питања у вези са техничким и бихевиоралним подацима за интервјуе и вероватно ћете завршити пројекат везан за вештине. Пре сваког интервјуа, требало би да прегледате свој животопис и портфолио, као и да се припремите за потенцијална питања за интервју.

Питања за интервју са науком о подацима ће тестирати ваше знање и вештине из статистике, програмирања, математике и моделирања података. Послодавци ће процењивати ваше техничке и меке вештине и колико бисте се добро уклопили у њихову компанију.



Припремајући нека уобичајена питања и одговоре за интервју за науку о подацима, можете ући у интервју са самопоуздањем. Постоји неколико различитих типова питања Дата Сциентист-а на која можете очекивати да ћете се сусрести током интервјуа за науку о подацима.

Списак питања за интервју за науку о подацима: питања у вези са подацима

Послодавци траже кандидате који имају јако знање о техникама и концептима науке о подацима. Питања за интервју у вези са подацима ће се разликовати у зависности од позиције и потребних вештина.

Ево неколико примера питања и одговора на интервјуу у вези са подацима:



Која је разлика између учења под надзором и учења без надзора?

Највећа разлика између надгледаног и ненадгледаног учења укључује употребу означених и неозначених скупова података. Учење под надзором користи излазне и улазне податке који су означени, а алгоритми учења без надзора не. Друга разлика је у томе што учење под надзором има механизам повратне информације, док учење без надзора нема. Коначно, најчешће коришћени алгоритми за надгледано учење укључују логистичку регресију, машину вектора подршке и стабла одлучивања, док су алгоритми учења без надзора груписање к-средњих вредности, хијерархијско груписање и априорни алгоритам.

Која је разлика између дубоког учења и машинског учења?

На ово питање може бити тешко дати јасан одговор јер овде очигледно постоји нека преклапања. Почните тако што ћете објаснити да је дубоко учење у суштини подпоље машинског учења и да оба спадају под окриље вештачке интелигенције. Тамо где машинско учење користи алгоритме за анализу података и на крају научи да доноси одлуке на основу онога што доноси из података, дубоко учење поставља слојеве тих алгоритама да би се створиле вештачке неуронске мреже способне да уче и доносе информисане одлуке.

  • Можете ли дати детаљно објашњење алгоритма стабла одлучивања?
  • Шта је узорковање? Са колико метода узорковања сте упознати?
  • Како правите разлику између грешке типа И и типа ИИ?
  • Молимо дефинишите линеарну регресију.
  • Шта значе појмови п-вредност, коефицијент и р-квадрат вредност? Зашто је свака компонента значајна?
  • Дефинишите пристрасност избора.
  • Дефинишите статистичку интеракцију.
  • Можете ли да дате пример скупа података са не-Гаусовом дистрибуцијом?
  • Молимо објасните формулу биномне вероватноће.
  • Можете ли да објасните разлику између к-НН и к-меанс груписања?
  • Какав је ваш приступ креирању модела логистичке регресије?
  • Шта је правило 80/20? Колико је важно моделирати валидацију?
  • Дефинишите прецизност и присећање. Како се они односе на РОЦ криву?
  • Објасните како да разликујете Л1 и Л2 методе регуларизације?
  • Пре примене алгоритама за машинско учење, који су кораци за препуцавање података и чишћење података?
  • Можете ли да објасните разлику између хистограма и оквира?
  • Како дефинишете унакрсну валидацију?
  • Можете ли да објасните шта је лажно позитивно, а шта лажно негативно? Шта бисте рекли да је боље имати: превише лажно позитивних или превише лажно негативних?
  • Када дизајнирате модел машинског учења, шта је важније: тачност модела или перформансе модела?
  • По вашем мишљењу, шта је боље: 50 малих стабала одлучивања или једно велико?
  • Можете ли да замислите пројекат науке о подацима у нашој компанији који би вас занимао?
  • Можете ли се сетити неколико примера најбољих пракси у науци о подацима?

Списак питања за интервјуе за науку о подацима: Питања о техничким вештинама

Питања о техничким вештинама у интервјуу за науку о подацима користе се за процену вашег знања, вештина и способности у области науке о подацима. Ова питања ће се односити на специфичне пословне одговорности позиције Дата Сциентист.

Питања за интервју за науку о техничким подацима могу имати један тачан одговор или неколико могућих решења. Желећете да покажете свој мисаони процес када решавате проблеме и јасно објасните како сте дошли до одговора.

Примери питања за интервју о вештинама техничких података укључују:

Који су најбољи алати и техничке вештине за дата Сциентист?

Наука о подацима је високо техничка област и желећете да покажете менаџеру за запошљавање да сте вешти са свим најновијим индустријским стандардним алатима, софтвером и програмским језицима. Од различитих статистичких програмских језика који се користе у науци о подацима, научници података најчешће користе Р и Питхон. Оба се могу користити за статистичке функције као што су креирање нелинеарног или линеарног модела, регресиона анализа, статистички тестови, рударење података и још много тога. Још један важан алат за науку о подацима је РСтудио Сервер, док се Јупитер Нотебоок често користи за статистичко моделирање, визуелизације података, функције машинског учења, итд. Наравно, постоји низ наменских алата за визуелизацију података које интензивно користе научници података, укључујући Таблеау, ПоверБИ , Бокех, Плотли и Инфограм. Научницима о подацима је такође потребно доста искуства у коришћењу СКЛ-а и Екцел-а.

Ваш одговор такође треба да помене све специфичне алате или техничке компетенције које захтева посао за који интервјуишете. Прегледајте опис посла и ако постоје алати или програми које нисте користили, можда би било вредно да се упознате са њима пре интервјуа.

Како третирате ванредне вредности?

Неке врсте одступања се могу уклонити. Смеће вредности или вредности за које знате да не могу бити истините, могу се одбацити. Изрази са екстремним вредностима далеко изван осталих тачака података груписаних у скупу такође се могу уклонити. Ако не можете да избаците вањске вредности, могли бисте поново да размислите да ли сте изабрали прави модел, могли бисте да користите алгоритме (као што су насумичне шуме) на које вредности одступања неће у великој мери утицати, или можете покушати да нормализујете своје податке.

  • Реците нам о оригиналном алгоритму који сте креирали.
  • Који је ваш омиљени статистички софтвер и зашто?
  • Да ли сте радили на пројекту науке о подацима који је захтевао значајну компоненту програмирања? Шта сте извукли из искуства?
  • Опишите како ефикасно представити податке са пет димензија.
  • Морате да генеришете предиктивни модел користећи вишеструку регресију. Који је ваш процес за валидацију овог модела?
  • Како осигуравате да промене које уносите у алгоритам представљају побољшање?
  • Наведите свој метод за руковање неуравнотеженим скупом података који се користи за предвиђање (тј. много више негативних него позитивних класа).
  • Какав је ваш приступ да потврдите модел који сте креирали да бисте генерисали предиктивни модел квантитативне варијабле исхода користећи вишеструку регресију?
  • Имате два различита модела упоредивих рачунарских перформанси и тачности. Објасните како одлучујете шта ћете изабрати за производњу и зашто.
  • Дат вам је скуп података који се састоји од променљивих са значајним делом вредности које недостају. Какав је ваш приступ?

Листа питања за интервју у области науке о подацима: лична питања

Поред тестирања вашег знања и вештина у области науке о подацима, послодавци ће вероватно постављати и општа питања како би вас боље упознали. Ова питања ће им помоћи да разумеју ваш стил рада, личност и како бисте се могли уклопити у културу њихове компаније.

Питања на интервјуу стручњака за личне податке могу укључивати:

Шта чини доброг Дата Сциентист-а?

Ваш одговор на ово питање ће менаџеру за запошљавање много рећи о томе како ви видите своју улогу и вредност коју доносите организацији. У свом одговору можете говорити о томе како наука о подацима захтева ретку комбинацију компетенција и вештина. Добар Дата Сциентист треба да комбинује техничку вештину потребну за рашчлањивање података и креирање модела са пословним смислом неопходним за разумевање проблема са којима се баве, као и за препознавање увида у своје податке који се могу применити. У свом одговору, такође бисте могли да разговарате о Дата Сциентист-у на кога се угледате, било да је то колега кога лично познајете или проницљива фигура из индустрије.

  • Молим те, реци ми нешто о себи.
  • Које су ваше најбоље квалитете на професионалном плану? Које су ваше области слабости?
  • Постоји ли један Дата Сциентист коме се највише дивите?
  • Шта је инспирисало ваше интересовање за науку о подацима?
  • Које јединствене вештине или карактеристике доносите које би помогле тиму?
  • Шта вас је навело да напустите последњи посао?
  • Који ниво надокнаде очекујете од овог посла?
  • Да ли више волите да радите сами или као део тима Дата Сциентистс?
  • Где видите своју каријеру за пет година?
  • Какав је ваш приступ за решавање стреса на послу?
  • Како проналазите мотивацију?
  • Који је ваш метод за мерење успеха?
  • Како бисте описали своје идеално радно окружење?
  • Које су ваше страсти или хобији изван науке о подацима?

Листа питања за интервју за науку о подацима: Лидерство и комуникација

Лидерство и комуникација су две вредне вештине за научнике података. Послодавци цене кандидате за посао који могу да покажу иницијативу, поделе своју стручност са члановима тима и пренесу циљеве и стратегије науке о подацима.

Ево неколико примера питања за интервју са науком о подацима о лидерству и комуникацији:

Шта вам се допада у раду у мултидисциплинарном тиму?

Дата Сциентист сарађује са широким спектром људи у техничким и нетехничким улогама. Није неуобичајено да Дата Сциентист ради са програмерима, дизајнерима, стручњацима за производе, аналитичарима података, продајним и маркетиншким тимовима и највишим руководиоцима, а да не спомињемо клијенте. Дакле, у свом одговору на ово питање, морате да илуструјете да сте тимски играч који ужива у прилици да се састаје и сарађује са људима широм организације. Изаберите пример ситуације у којој сте извештавали људе на највишем нивоу у компанији да бисте показали не само да вам је пријатно да комуницирате са било ким, већ и да бисте показали колико су ваши увиди засновани на подацима били вредни у прошлости.

  • Можете ли да замислите професионалну ситуацију у којој сте имали прилику да покажете лидерство?
  • Какав је ваш приступ решавању сукоба?
  • Какав је ваш приступ изградњи професионалних односа са колегама?
  • Који је пример успешне презентације коју сте дали? Зашто је било тако убедљиво?
  • Ако разговарате са колегом или клијентом из нетехничке позадине, како објашњавате сложене техничке проблеме или изазове?
  • Присетите се ситуације када сте морали да рукујете осетљивим информацијама. Како сте приступили ситуацији?
  • Из ваше перспективе, како бисте оценили своје комуникацијске вештине?

Листа питања за интервју за науку о подацима: бихејвиорална

Са питањима за интервјуе о понашању, послодавци траже специфичне ситуације које показују одређене вештине. Анкетар жели да разуме како сте се носили са ситуацијама у прошлости, шта сте научили и шта сте у могућности да донесете њиховој компанији.

Примери питања понашања у интервјуу за науку о подацима укључују:

Да ли се сећате ситуације када сте морали да очистите и организујете велики скуп података?

Студије су показале да научници података проводе већину свог времена на припреми података, за разлику од рударења података или моделирања. Дакле, ако имате било какво искуство као Дата Сциентист, готово је сигурно да имате искуство у чишћењу и организовању великог скупа података. Истина је и да је ово задатак у коме мало ко заиста ужива. Али чишћење података је такође један од најважнијих корака за сваку компанију. Дакле, требало би да водите менаџера за запошљавање кроз процес који следите у припреми података: уклањање дуплих запажања, исправљање структурних грешака, филтрирање изузетака, решавање недостајућих података и валидација података.

  • Присетите се пројекта података на којем сте радили где сте наишли на проблем или изазов. Каква је била ситуација, која је била препрека и како сте је превазишли?
  • Молимо да наведете конкретан пример коришћења података за побољшање искуства корисника или заинтересоване стране?
  • Наведите конкретну ситуацију у којој сте остварили циљ. Како сте то постигли?
  • Наведите конкретну ситуацију у којој нисте успели да постигнете циљ. Шта је пошло наопако?
  • Какав је ваш приступ управљању и испуњавању кратких рокова?
  • Да ли се сећате времена када сте се суочили са конфликтом на послу? Како сте се носили са тим?

Листа питања за интервју за науку о подацима од врхунских компанија (Амазон, Гоогле, Фацебоок, Мицрософт)

Да бисмо вам дали представу о неким другим питањима која се могу појавити у интервјуу, саставили смо листу питања за интервјуе за науку о подацима од неких од врхунских технолошких компанија.

  • Која је разлика између машине за вектор подршке и логистичке регресије? Наведите примере ситуација у којима бисте изабрали да користите једно уместо другог.
  • Ако уклањање вредности које недостају из скупа података узрокује пристрасност, шта бисте урадили?
  • Када посматрате здравље, ангажовање или раст производа, које метрике бисте проценили?
  • Када покушавате да решите или решите пословне проблеме у вези са нашим производом, које метрике бисте проценили?
  • Како оцењујете перформансе производа?
  • Како знате да ли је ново запажање изванредно?
  • Како бисте дефинисали уступак пристрасности и варијансе?
  • Који је ваш метод за насумично одабирање узорка из популације корисника производа?
  • Који је ваш процес препарирања и чишћења података пре примене алгоритама машинског учења?
  • Како бисте приступили неуравнотеженој бинарној класификацији?
  • Како разликујете добру и лошу визуелизацију података?
  • Направите функцију која проверава да ли је реч палиндром.

Kategori: Вести