Big Data i e-learning

Wojciech Zieliński

W poniedziałkowej „Gazecie Wyborczej” na pierwszej stronie znajdujemy artykuł Macieja Samcika o korzystaniu przez banki z danych o nas. Artykuł zaczyna się od znamiennego zdania „W nasze życie wkracza właśnie Big Data”. Samo pojęcie „big data" jest obecnie modne, ale trzeba przyznać, że stoją za nim poważne badania naukowe i prace technologiczne. Wynika to przede wszystkim z rosnącej powszechności użytkowania internetu. W sieci pozostawiamy coraz więcej danych, albo tych, które sami świadomie umieściliśmy, albo takich, które systemy informatyczne zbierają bez naszej wiedzy lub przy naszej milczącej zgodzie. Rośnie różnorodność kontekstów, w jakich te dane są gromadzone – zbierających je portali lub aplikacji, czasu i miejsc, w jakich są zostawiane, grup użytkowników, jakim są prezentowane, itp. Im większa liczba korzystających z sieci, zostawianych przez nich danych i kontekstów, w jakich są gromadzone, tym bardziej wyrafinowane muszą być narzędzia pozwalające zamienić te dane na wiedzę, którą potem można wykorzystać.
Trend „big data” nie omija e-learningu. Analizowanie danych związanych z uczestnictwem w kursach internetowych nie jest nowością. Zajmujący się tymi zagadnieniami naukowcy wskazują na następującą ewolucję.
„Academic Analytics” (AA) to wykorzystanie przede wszystkim narzędzi inteligencji biznesowej (business intelligence) do usprawnienia procesu podejmowania decyzji przez instytucje prowadzące kurs. Ten rodzaj analiz ma najczęściej na celu odpowiednio wczesne rozpoznanie uczestników, którzy są zagrożeni nie ukończeniem kursu i podjęcie stosownych działań.
Nieco dalej idzie „Educational Data Mining” (EDM). W tym przypadku rodzaj stosowanych technik jest szerszy i obejmuje m.in. analizę statystyczną, drążenie danych czy elementy sztucznej inteligencji. Co charakterystyczne jednak, badane są dane historyczne, dotyczące zachowania uczestników w kursach zakończonych, po to by je poprawić lub zmienić dla nowych edycji.
Najnowszym podejściem jest „Learning Analytics” (LA) i to jest rzeczywiste „big data”. Wykorzystuje się w nim aktualne dane powstające w trakcie odbywanego kursu. Dotyczą one wielu kontekstów np. charakterystyki uczestnika – jego danych osobowych i kompetencji przed przystąpieniem do kursów; zachowania w kursie – materiałów, z których korzysta, testów, które wykonuje, uczestników, z którymi się kontaktuje; treści jakie sam tworzy – wypowiedzi na forach, pytań do prowadzącego, prac pisemnych. Te konteksty mogą być bardzo szerokie i wychodzić poza wirtualne środowisko nauczania, obejmując np. portale społecznościowe. Wykorzystywane są wszystkie wymienione wcześniej techniki analizy pozyskiwania i analizy danych uzupełnione o techniki semantyczne. Wiedza wydobywana z tych danych wykorzystywana jest przede wszystkim do zmian i adaptacji jeszcze w trackie kursu. Jej odbiorcą może być sam uczestnik, który otrzymuje „automatyczne” propozycje i podejmuje decyzje o skorzystaniu z nich, lub nauczyciel, który na podstawie dostarczonej mu wiedzy modyfikuje sposób, w jaki prowadzi kurs. Adaptacje kursu mogą dotyczyć wykorzystywanych materiałów dydaktycznych, podejmowanych przez uczestnika aktywności, nawiązywania kontaktów z innymi uczestnikami kursu, specjalistami, itp. Zakres możliwości jest tu bardzo szeroki i tak jak w przypadku zbierania danych wykracza poza platformę, na której toczy się kurs.
Zainteresowanie LA jest coraz większe m.in. za sprawą rosnącej popularności MOOC. Te masowe kursy to idealne środowisko dla technik „big data”. Nie ma wątpliwości, że liczba danych, jaka w takich kursach musi być analizowana, jest ogromna. Trzeba też zwrócić uwagę, że kursy te, z oczywistych względów, charakteryzują się wyjątkowo niską, a wręcz żadną, pomocą nauczyciela dla pojedynczego uczestnika. Mogą ją za to w jakimś sensie zapewnić systemy informatyczne korzystające z narzędzi LA.
Nie wiem czy ktokolwiek prowadzi w Polsce prace nad LA. Jeśli znacie takie przykłady proszę o zamieszczenie informacji w komentarzu.

Data dodania: 15.05.2013

Wojciech Zieliński

Członek Zarządu Stowarzyszenia E-learningu Akademickiego, członek Komitetów Doradczych eLearning Papers oraz Online Educa w Berlinie. Prezes Zarządu MakoLab S.A. Zarządzał wieloma projektami e-learningowymi, w tym studiami online na platformie Polskiego Uniwersytetu Wirtualnego oraz E-egzaminem 2008. Jego zainteresowania koncentrują się wokół wykorzystania technik informacyjnych w uczelniach. Prowadzi działalność doradczą i jest autorem wielu publikacji z tego zakresu.