Gdyby William Szekspir pisał Hamleta w XXI wieku, słynny cytat z jego dramatu brzmiałby pewnie Dane, dane, dane! Dane to pojęcie, które od początku millenium bije rekordy popularności w różnych kontekstach. Niemal wszystkie sfery życia podlegają obecnie datafikacji czy danetyzacji. Aktywność w internecie, logowanie się do sieci naszego telefonu, każda zawarta transakcja generuje dane, które są gromadzone, a następnie przetwarzane w celu pozyskania nowych informacji. Jesteśmy świadkami niezwykle dynamicznego przyrostu wolumenu danych, który zaowocował rozwojem technologii big data, a także sprawił, że dla wielu organizacji naglące stało się wprowadzanie rozwiązań z zakresu data governance i data management. Dodatkowo kilka lat temu stanęliśmy przed wyzwaniem dostosowania prowadzonej działalności do przepisów RODO, a obecnie zmierzamy w kierunku otwierania danych w ramach postulatu otwartej nauki.

Te wszystkie zmiany nie pozostają bez wpływu na sposób, w jaki prowadzone są badania społeczne. W przeszłości największą bolączką badaczy było pozyskanie danych. Obecnie zaś coraz większym problemem staje się ich przechowywanie oraz zapewnienie infrastruktury IT o odpowiedniej wydajności, umożliwiającej szybkie przetwarzanie. Przede wszystkim jednak, wyzwaniem pozostaje pozyskanie analityków danych, którzy potrafią wydobywać wiedzę z tera- lub petabajtów danych.

Rejestry publiczne jako źródło danych

Co istotne, dane, które mogą służyć do badań i być źródłem cennej wiedzy, nie powstają jedynie w sektorze prywatnym, ale wraz z postępującą cyfryzacją administracji publicznej, tworzone są również przez instytucje państwowe. Dane te gromadzone są w rejestrach publicznych, które przy zachowaniu świadomości ich pewnych ograniczeń, mogą stanowić remedium na niedostatki związane z badaniami sondażowymi.

Główną zaletą badań prowadzonych z wykorzystaniem rejestrów publicznych są niskie koszty pozyskania danych w porównaniu z sondażami. W związku z tym, że zakres informacji zbieranych w rejestrach jest użyteczny głównie dla wytwarzających je instytucji, może się jednak zdarzyć, że dany rejestr nie będzie w pełni odpowiadał potrzebom badacza. Dlatego warto wcześniej zapoznać się z informacjami na temat sposobu definiowania pojęć i gromadzenia danych, które zwykle udostępniane są na stronach internetowych instytucji prowadzących określone rejestry. Jeśli jednak zwartość rejestru okaże się przydatna dla naszych celów badawczych, to uzyskamy nieocenioną korzyść – możliwość prowadzenia analiz na danych obejmujących całą populację. Takiego komfortu nie dają badania sondażowe, które z reguły realizowane są na ograniczonej próbie jednostek wylosowanych z określonej populacji. Co więcej, korzystając z rejestrów, eliminujemy nasilający się problem odmów udziału w badaniach ankietowych, który zaburza zakładany w tej metodzie dobór losowy i negatywnie oddziałuje na poprawność wnioskowania statystycznego.

Istotną zaletą danych gromadzonych w rejestrach publicznych jest ich rzetelność, wynikająca ze standaryzacji procedur administracyjnych, w ramach których są one pozyskiwane. Nie występuje tu właściwy dla sondaży tzw. efekt ankietera. Nie dochodzi też do zniekształcenia odpowiedzi spowodowanego znużeniem czy niepamięcią respondentów. Ponadto, badania realizowane na podstawie danych pochodzących z rejestrów, umożliwiają prowadzenie analiz na małolicznych grupach w ramach populacji, a także gwarantują badanym zachowanie anonimowości. Badania te nie są jednak zupełnie pozbawione wad. Podobnie jak metody sondażowe, wymagają sprawdzenia kompletności pozyskanych informacji, ustalenia przyczyn występowania braków danych i możliwych sposobów ich uzupełnienia.

Badanie absolwentów na podstawie rejestrów

W Ośrodku Przetwarzania Informacji – Państwowym Instytucie Badawczym, już od 2016 roku, na zlecenie Ministerstwa Edukacji i Nauki, rozwijamy na podstawie danych administracyjnych ogólnopolski monitoring Ekonomicznych Losów Absolwentów szkół wyższych (ELA). Dane na potrzeby monitoringu pozyskujemy z rejestrów Zakładu Ubezpieczeń Społecznych oraz Zintegrowanej Sieci Informacji o Nauce i Szkolnictwie Wyższym POL-on. Dane te, po odpowiednim przetworzeniu, dostarczają wiedzy o sytuacji absolwentów polskich uczelni na rynku pracy.

Wykorzystanie w ramach badania ELA informacji o miesięcznych składkach ubezpieczonych, dostępnych w rejestrach ZUS, umożliwia analizę dynamiki procesów zachodzących na rynku pracy. Na podstawie danych z rejestrów skonstruowaliśmy wskaźniki sukcesu na rynku pracy, które pozwalają na rzetelne porównanie sytuacji absolwentów w różnych okresach objętych badaniem. Informacje te przedstawiamy w ujęciu ogólnopolskim oraz w podziale na poszczególne uczelnie i kierunki studiów. Badanie dostarcza również wiedzy o losach naukowych i zawodowych doktorantów oraz osób ze stopniem doktora, a także informacji o aktywności zawodowej i przebiegu kształcenia studentów.

Interesariusze i ich korzyści

Dzięki wypracowaniu wspólnie z MEiN i ZUS bezpiecznych procedur organizacyjnych i metodologicznych jesteśmy w stanie przedstawić wiarygodne i użyteczne wyniki przy zapewnieniu pełnej ochrony prywatności badanych osób. Wiedza, którą tworzymy, dzięki wykorzystaniu danych pochodzących z rejestrów, stanowi cenną wartość dla różnych grup interesariuszy. Informacje te są użyteczne przede wszystkim dla osób, które myślą o rozpoczęciu studiów lub kontynuowaniu ich na kolejnym stopniu i chcą dokonać świadomego wyboru kierunku. Znajomość poziomu wynagrodzeń i ryzyka bezrobocia w pierwszych latach po ukończeniu studiów pozwala im lepiej zaplanować przyszłość. Umożliwia też wybór wymarzonego kierunku na takiej uczelni, po ukończeniu której szanse na znalezienie dobrze płatnej pracy są największe.

Informacje, które dostarczamy, mogą być także użyteczne dla osób odpowiadających za ofertę programową szkół wyższych. Pozwalają porównać losy absolwentów różnych kierunków w ramach tej samej uczelni, jak i losy absolwentów zbliżonych kierunków, prowadzonych na różnych uczelniach. Dzięki temu władze szkół wyższych wiedzą, po których kierunkach absolwenci ich uczelni są najbardziej poszukiwani na rynku, a na jakich absolwentów jest mniejsze zapotrzebowanie wśród pracodawców. Co więcej, jeśli okaże się, że absolwenci konkurencyjnych kierunków są lepiej wyceniani przez rynek, może to stanowić dla nich sygnał do przyjrzenia się własnemu programowi studiów.

Kolejną grupą, dla której informacje pochodzące z badania ELA mogą być pomocne, są pracownicy biur karier. Na podstawie udostępnionych wyników mogą wskazywać przyszłym studentom wahającym się, jaki kierunek wybrać, te programy studiów, po których będą mieli większe szanse na znalezienie dobrze płatnej pracy. ELA jest też ważnym narzędziem dla MEiN, umożliwiającym prowadzenie polityki dotyczącej szkolnictwa wyższego opartej na dowodach.

Co wynika z tegorocznej edycji badania ELA?

Wyniki badania ELA prezentowane są w formie raportów tworzonych automatycznie przy użyciu dedykowanego oprogramowania i udostępnianych na stronie internetowej https://ela.nauka.gov.pl/pl. Przygotowany w OPI PIB system stanowi nowatorskie rozwiązanie w skali Europy. Co więcej, działając w duchu open science, oprócz raportów, udostępniamy również zbiory danych źródłowych, które umożliwiają zainteresowanym osobom prowadzenie własnych analiz.

W tegorocznej edycji ELA badaniem objęte zostały osoby, które ukończyły studia w latach 2014–2020. Krajobraz po pandemii COVID-19 nie zaburzył znacząco trendów obserwowanych w poprzednich latach. Nadal największym powodzeniem na rynku pracy cieszą się absolwenci kierunków informatycznych. Osoby, które ukończyły te programy studiów, mogą liczyć na najwyższe zarobki spośród wszystkich absolwentów. Pokłosiem pandemii i związanej z nią premii dla medyków jest obecność na wysokich lokatach rankingu według wynagrodzeń również osób, które zdobyły dyplom z ratownictwa medycznego. Niezmiennie też w czołówce pojawiają się absolwenci kierunków związanych z analizą danych. Wyniki badania ELA stanowią zatem odbicie szerszych trendów na rynku pracy i zdecydowanie zachęcają do zdobycia kompetencji data scientist.