Odpowiedzią Uniwersytetu Gdańskiego na rosnącą potrzebę kształcenia specjalistów z zakresu statystycznej analizy danych jest utworzenie na Wydziale Zarządzania nowych studiów podyplomowych Analiza Danych – Big Data.
Informacje o studiach
Analiza Danych - Big Data to dwusemestralne studia podyplomowe o charakterze praktycznym, które będą prowadzone w formie studiów niestacjonarnych przez Katedrę Statystyki Wydziału Zarządzania Uniwersytetu Gdańskiego. Adresowane są do osób, które pracują lub zamierzają podjąć pracę na stanowisku związanym ze statystyczną analizą danych (szczególnie dużych zbiorów danych). Program studiów obejmuje 228 godzin zajęć prowadzonych w laboratoriach komputerowych na Wydziale Zarządzania UG w Sopocie.
Podczas studiów studenci dowiedzą się, jak przygotować dane do analizy, dokonać eksploracji danych, budować modele statystyczne i wykorzystywać zaawansowane metody data mining za pomocą nowoczesnego oprogramowania (głównie w językach R i Python).
Absolwenci studiów podyplomowych Analiza Danych – Big Data zdobędą wiedzę z zakresu zaawansowanej analizy danych statystycznych, specyfiki big data, narzędzi i technik wydobywania informacji i wiedzy z dużych, wielowymiarowych zbiorów danych, zastosowań elementów sztucznej inteligencji w zarządzaniu opartym na analizach danych. Ukończenie studiów umożliwia podjęcie pracy na stanowiskach takich jak Data Scientist, Data Intelligence Analyst, Marketing Data Analyst, Fraud & Risk Analyst, Research Analyst. Absolwent może podjąć pracę w podmiotach sektora bankowego, ubezpieczeniowego, z branży IT, w firmach konsultingowych i w każdym innym przedsiębiorstwie, które wykorzystuje metody zarządzania oparte na danych.
Więcej o rekrutacji 2020/2021 na Uniwersytecie Gdańskim
Big data
Big data to zbiory danych charakteryzujące się dużą objętością, zmiennością i różnorodnością. Wymagają wydajnej, innowacyjnej formy przetwarzania w celu uzyskania wiedzy, która może pomóc np. podjąć odpowiednią decyzję czy zautomatyzować procesy w firmie. Big data to zarówno dane ustrukturyzowane (np. tablica z liczbami) jak i nieustrukturyzowane, takie jak tekst, obraz czy film. Uzyskanie wiedzy z takiego typu danych jest możliwe dopiero po odpowiedniej obróbce, analizie i wizualizacji. Kluczową rolę w tym procesie odgrywają osoby posiadające odpowiednie umiejętności z zakresu statystyki i informatyki.
Wiele przedsiębiorstw wskazuje, że główną barierą do pełnego wykorzystania potencjału płynącego z analizy dużych zbiorów danych jest brak dobrze wykształconych, utalentowanych analityków danych. Wiele firm uruchamia programy mające na celu stworzenie kultury opartej na danych. Wciąż brakuje jednak specjalistów oraz menedżerów potrafiących przekuć wnioski płynące z analizy danych na praktyczne działania biznesowe.
Nowe wyzwania dla biznesu
Wiele przedsiębiorstw wykorzystuje big data już teraz, inne zamierzają to zrobić w najbliższej przyszłości. Jakie korzyści niosą ze sobą analizy dużych zbiorów danych i na co należy zwrócić uwagę przy wdrażaniu projektów opartych na big data?
1. Stop nadużyciom finansowym
Coraz częściej poruszaną kwestią w bankowości jest cyberprzestępczość, która rozwija się w szybkim tempie. Kradzieże tożsamości, wyłudzenia kredytów, kradzieże danych z kart płatniczych, nadużycia w bankowości elektronicznej oparte o phising (podszywanie się pod inną osobę lub instytucję w celu wyłudzenia poufnych informacji) i malware (złośliwe oprogramowanie) to najczęściej spotykane rodzaje oszustw w sektorze finansowym. Banki w celu minimalizacji przestępstw finansowych stosują zaawansowane narzędzia analityczne oparte na big data. Bazują one między innymi na analizie tekstu, która pozwala na wykrywanie słów kluczowych z danych tekstowych oraz sieci powiązań, która pozwala na identyfikacje związków między osobami podejmującymi podejrzane transakcje.
2. Zdolność kredytowa w 5 minut
Kolejną korzyścią wykorzystania big data w bankowości jest możliwość budowania bardziej złożonych modeli oceny ryzyka kredytowego. Obecnie stosowane scoringi kredytowe dla klientów indywidualnych ograniczają się do sprawdzenia kilku podstawowych cech, takich jak: wielkość i źródło dochodu, aktualnie spłacane pożyczki, wiek czy liczba posiadanych dzieci. Jednak banki, które chciałyby bardziej ograniczyć własne ryzyko mogą budować bardziej złożone modele oparte na danych z portali społecznościowych. Jednak wiarygodność czy sprawiedliwość takich modeli jest dyskusyjna. Posługują się one danymi wrażliwymi, co stanowi również ryzyko naruszenia praw chroniących dane osobowe.
Ekonomiści O. Netzer, A. Lemaire oraz M. Herzenstein badając wypowiedzi potencjalnych pożyczkobiorców z portalu Prosper (portal pożyczkowy) zauważyli, że na podstawie typowych określeń można obliczyć prawdopodobieństwo spłaty pożyczki przez klienta. Nie jest to dobra informacja dla nas. Powinniśmy częściej zwracać uwagę na swoje wpisy w Internecie, które w przyszłości mogą wpływać na naszą zdolność kredytową.
3. Lepsze dostosowanie produktu do grup docelowych
Przedsiębiorstwa coraz częściej wykorzystują dane z portali społecznościowych takich jak Facebook czy Linkedin w celu prowadzenia w efektywny sposób kampanii marketingowej i dostosowywania swoich produktów do grup docelowych. To profilowanie klientów pozwala odpowiednio dobierać treści do odbiorców. Przedsiębiorstwa znając oczekiwania obecnych klientów mogą prowadzić swoje działania w taki sposób, aby ich zatrzymać. Oprócz tego, mogą pozyskiwać nowych klientów oferując im atrakcyjne oferty produktów czy rabatów. Użytkownicy portali społecznościowych zauważając reklamę w Internecie, która będzie odpowiadała na ich potrzeby, chętniej skorzystają z proponowanych rozwiązań.
4. Szybka jazda = większa składka
Branża ubezpieczeń od zawsze wykorzystuje analizę danych do minimalizacji własnego ryzyka. Na podstawie zebranych informacji o kliencie ubezpieczyciele dostosowują odpowiednią składkę zapewniającą ochronę obu stronom porozumienia. Big data to nowe źródło wiedzy, które pozwala m.in. zapobiegać oszustwom i śledzić potencjalnych klientów. W USA firmy ubezpieczeniowe stosują tzw. „czarne skrzynki” w samochodach, które zbierają dane o zachowaniu kierowcy podczas jazdy (w czasie rzeczywistym). To dane faktyczne wpływające na politykę cenową ubezpieczycieli. W ten sposób kierowcy są nagradzani za ostrożną, bezszkodową jazdę oraz karani za łamanie przepisów i stwarzanie zagrożeń na drodze.
5. Medycyna, informatyka, polityka oraz wiele innych…
Coraz więcej branż wdraża big data lub ma to w planach. W większości przypadków głównym celem jest zwiększenie przewagi konkurencyjnej i tym samym poprawa wyniku finansowego przedsiębiorstwa. Jednak big data wchodzi też do branż, których głównym celem nie jest maksymalizacja zysku. Na przykład w obszarze ochrony zdrowia od zawsze leczenie pacjentów odbywało się na podstawie osądów lekarzy, a teraz się to zmienia. Gromadząc i analizując dane medyczne można poprawić diagnozy stawiane przez lekarzy oraz lepiej dopasować leczenie. Jest to szansa na poprawę jakości świadczonych usług zdrowotnych, ale również pomoc w pracy personelu medycznego.