Myślę, że prędzej czy później trafiłabym do Data Science – mówi Anna, pracująca jako Data Scientist. Anna to utalentowana, a jednocześnie skromna, młoda kobieta, mówiąca biegle w trzech językach. Uwielbia literaturę i ma ogromną pasję do analizy danych, z którymi radzi sobie od sześciu lat z naturalną swobodą.
Co robi w fascynującym świecie danych, do którego trafiła, jak sama uważa, nieprzypadkowo? Przekonajcie się sami.
Jak zaczęłaś swoją karierę i co Cię przyciągnęło do tego zawodu?
Nie mogę powiedzieć, że trafiłam do tego zawodu przez przypadek, ponieważ studiowałam Informatykę i Statystykę, i już wtedy wiedziałam, czym chciałabym się zajmować w przyszłości. Myślę, że prędzej czy później trafiłabym do Data Science, ponieważ od dzieciństwa lubiłam rozwiązywać zagadki matematyczne i fascynowały mnie liczby oraz analizy danych – wspomina Anna.
Na początku pracowałam jako Analityk Danych, wykonując zarówno proste, jak i zaawansowane analizy przy użyciu SQL i Pythona. Już od początku byłam zachwycona możliwościami, jakie dawały modele predykcyjne, wizualizacje danych oraz podejmowanie decyzji na podstawie analizy danych. Dalsza praca z danymi tylko inspirowała mnie i motywowała do ciągłego rozwoju w tej dziedzinie.
Jakie są Twoje codzienne obowiązki jako Data Scientist?
Typowy zestaw zadań w moich projektach obejmuje:
- Analiza i zrozumienie danych wejściowych oraz celu całego projektu. Muszę określić, co powinniśmy wyciągnąć z danych i jak pozyskać te informacje.
- Wstępne przetwarzanie danych. W zależności od typu danych – tabelaryczne, tekstowe czy obrazy – stosuję różne techniki przetwarzania. Na przykład, dla danych tekstowych jest to oczyszczenie tekstu i tokenizacja, a dla obrazów usunięcie szumów i zastosowanie filtrów.
- Budowa modelu, czyli stworzenie mechanizmu uzyskiwania informacji z danych według wybranej metody matematycznej. Modele mogą wykonywać różne zadania, takie jak klasyfikacja, grupowanie czy rozpoznawanie obiektów na obrazkach.
- Testowanie i debugowanie kodu, wdrożenie modelu oraz stworzenie systemu monitoringu, który zapewni, że model utrzymuje swoją dokładność w czasie.
Jakie nietypowe zadania mogą się pojawić, w których Twój udział jest niezbędny?
Często muszę pracować z nieustrukturyzowanymi danymi, które wymagają uporządkowania przed dalszą analizą. Również brak etykiet w danych może stanowić wyzwanie, które trzeba rozwiązać poprzez ich ręczne przypisanie lub zastosowanie metod statystycznych. Ważnym aspektem jest też umiejętność przedstawienia wyników w sposób zrozumiały dla osób niepracujących na co dzień z danymi.
Jakich narzędzi używasz w pracy i do czego je stosujesz?
Najczęściej używam języków programowania Python i SQL. Python jest wszechstronny i idealny do analizy danych, budowy modeli oraz wizualizacji, podczas gdy SQL jest niezbędny do zarządzania danymi w bazach danych.
Czy możesz opisać jedno zadanie lub projekt, który najwięcej Cię nauczył? Jakie miałaś tam wyzwania i jakie wnioski do dalszej pracy wyciągnęłaś?
Realnym wyzwaniem była dla mnie praca z danymi tekstowymi i obrazkami, które wymagały zastosowania niestandardowych rozwiązań. Wdrażanie modeli oraz ich integracja z innymi narzędziami to ważny aspekt, który pokazuje, że praca z danymi to nie tylko tworzenie modeli, ale także ich efektywne wdrażanie do użytku produkcyjnego.
Na podstawie Twoich obserwacji, czy kobiety sprawdzają się w takim zawodzie równie dobrze jak mężczyźni?
Myślę, że nie ma znaczenia, czy jesteś kobietą, czy mężczyzną. Ważne jest, aby mieć pasję do danych, chęć do nauki i rozwijania się oraz odwagę do próbowania nowych rzeczy.
Co byś powiedziała kobietom, które zastanawiają się, czy porzucić swoją pracę i przekwalifikować się do zawodów związanych z IT?
Warto próbować i szukać siebie, nie bać się popełniać błędów. Zachęcam wszystkie kobiety, które się wahają, aby uczestniczyły w spotkaniach branżowych i hackatonach związanych z Data Science, aby sprawdzić, czy to jest coś dla nich i poznać ludzi o podobnych zainteresowaniach.
Anna jest świetnym przykładem na to, że każdy, kto ma pasję i determinację, może osiągnąć sukces w Data Science. Może po przeczytaniu tego artykułu ktoś z Was zdecyduje się na rozpoczęcie kursu z zakresu Data Science lub stworzy swój pierwszy wykres w Pythonie? 😉