Jakość bibliotek cyfrowych - aspekty i kryteria oceny

Ewa Głowacka

Biblioteki cyfrowe to obecnie bardzo dynamicznie rozwijające się repozytoria wartościowych zasobów elektronicznych (zdigitalizowanych i tych, które powstały w postaci elektronicznej, tzw. born digital). Ważną kwestią jest wypracowanie standardów oceny ich jakości. W artykule przedstawiono wybrane aspekty, kryteria i wskaźniki takiej ewaluacji.

Jeszcze do niedawna pod pojęciem biblioteki rozumiano klasyczną książnicę gromadzącą zasoby głównie na nośnikach papierowych. Obecnie jednak na świecie i w Polsce dynamicznie rozwijają się biblioteki cyfrowe. Cieszą się one coraz większym zainteresowaniem użytkowników, umożliwiają bowiem zdalne korzystanie z bardzo wielu rodzajów zasobów bibliotek, muzeów i archiwów - w postaci elektronicznej. Bibliotekę cyfrową charakteryzują następujące cechy:
  • zbiory mają postać cyfrową,
  • informacja o zbiorach ma również postać cyfrową,
  • pomoc czytelnikowi i jego obsługa odbywają się poprzez sieci komputerowe,
  • działalność biblioteki: wydawnicza i badawcza jest skomputeryzowana,
  • funkcjonowanie biblioteki jest niezależne od sprzętu i oprogramowania1.
Dobrą bibliotekę cyfrową powinny cechować bogate i dostosowane do potrzeb użytkowników zasoby. W zależności od tego, czy mamy do czynienia z masową digitalizacją, powolnym procesem udostępniania dzieł, czy też gromadzeniem zasobów od początku dostępnych w formie elektronicznej (born digital), biblioteki cyfrowe pełnią różne funkcje i służą różnym użytkownikom. Jednak ich podstawową rolą jest zabezpieczenie dziedzictwa kultury oraz pełnienie funkcji informacyjnej i edukacyjnej. Biblioteki cyfrowe bazują często na międzynarodowych standardach (np. dla opisu bibliograficznego na Dublin Core, dla przesyłania danych: na protokole OAI-PMH2) oraz dobrych praktykach opracowanych przez bibliotekarzy i informatyków. Dzięki tym standardom możliwe jest tworzenie repozytoriów, w których są przechowywane metadane, a ich przeszukiwanie umożliwia m.in. serwis Oaister.

Rozwój bibliotek cyfrowych

Biblioteki cyfrowe mają bardzo krótką historię. Prace koncepcyjne dotyczące ich kształtowania trwają od lat 60. XX wieku, jednak początki powstawania tego typu repozytoriów to dopiero lata 90. Obecnie działające na świecie biblioteki cyfrowe mają różnorodne funkcje, zasoby, sposoby organizacji zbiorów i dostępu do nich, a także zróżnicowany zasięg terytorialny. Istnieje wiele inicjatyw międzynarodowych tego rodzaju. Do grupy najbardziej znanych należą:

  • The European Library - projekt Unii Europejskiej, biblioteka zapewniająca dostęp do połączonych zasobów 43 europejskich bibliotek narodowych, gromadząca zasoby dotyczące wszystkich dziedzin wiedzy;
  • Europeana - otwarta 20 listopada 2008 roku w ramach inicjatywy UE: i2010 na rzecz bibliotek cyfrowych, w celu udostępnienia dziedzictwa kulturowego i naukowego Europy; Europeana to wspólny punkt dostępu do zbioru bibliotek, archiwów i muzeów;
  • The Universal Digital Library - projekt, którego koordynatorem jest Carnegie Mellon University; celem tej inicjatywy jest stworzenie światowej biblioteki cyfrowej oferującej dostęp online do literatury naukowej z różnych dziedzin wiedzy oraz do literatury pięknej;
  • World Digital Library - projekt, którego celem jest stworzenie międzynarodowej biblioteki cyfrowej, udostępniającej swoje zbiory za darmo; mają w niej zostać zgromadzone zdigitalizowane manuskrypty, mapy, trudno dostępne książki, nagrania czy fotografie z całego świata. Projekt wspierają m.in. UNESCO, Biblioteka Kongresu, IFLA.
W Polsce pierwszą biblioteką cyfrową była Polska Biblioteka Internetowa. Wstępne założenia projektu tej biblioteki opisano w Programie Powszechnej Informatyzacji Nowoczesna Polska, przyjętym jako program przedwyborczy przez SLD 8 kwietnia 2001 roku3. Zakładał on wprowadzenie do wszystkich obszarów oświaty i nauki w Polsce edukacji informatycznej.

Biblioteka została oficjalnie udostępniona 1 września 2003 roku4. Zasadniczym celem jej powołania było wyrównanie szans dostępu do różnorodnych publikacji wydanych dotychczas w języku polskim osobom pochodzącym z małych miast, wsi czy innych regionów oddalonych od ośrodków akademickich i kulturalnych, gdzie komputer z łączem internetowym może stanowić jedyne narzędzie kontaktu z dorobkiem literatury i kultury. Realizacją projektu zajął się powołany w Komitecie Badań Naukowych Departament Promocji Społeczeństwa Informacyjnego5. Przedsięwzięcie to było jednak zdecydowanie nieudane. Przez kilka pierwszych lat liczba zdigitalizowanych zasobów rosła bardzo powoli. Popełniano też błędy w przygotowaniu materiałów, np. liczne błędy literowe. W porównaniu z innymi bibliotekami cyfrowymi w Polsce, które powstały w tym samym okresie lub później, np. Wielkopolską Biblioteką Cyfrową, Małopolską Biblioteką Cyfrową, Kujawsko-Pomorską Biblioteką Cyfrową, PBI nadal udostępnia mniejszą liczbę dokumentów6, choć rośnie ona w ostatnich latach dynamiczniej niż na początku. Duże zastrzeżenia budzi też jej funkcjonalność, szczególnie ograniczone możliwości wyszukiwawcze (przede wszystkim brak opcji wyszukiwania rzeczowego).

Od 2002 r. rozwijają się natomiast polskie biblioteki cyfrowe na jednolitej platformie cyfrowej dLibra. Prace badawcze związane z omawianym systemem rozpoczęły się w Poznańskim Centrum Superkomputerowo-Sieciowym (PCSS) w 1996 roku. W 1998 roku opracowano pierwszy prototyp oprogramowania do tworzenia takich bibliotek. Na podstawie doświadczeń zebranych przy jego budowie w 1999 roku zdefiniowano nowe założenia projektowe stanowiące bazę dla rozwoju platformy dLibra. W październiku 2002 roku uruchomiono Wielkopolską Bibliotekę Cyfrową.

Dynamiczny rozwój WBC zapoczątkował w Polsce proces tworzenia bibliotek cyfrowych. W listopadzie 2004 roku uruchomiona została Biblioteka Cyfrowa Politechniki Wrocławskiej, która rok później, po przemianowaniu, stała się drugą regionalną biblioteką cyfrową w Polsce - Dolnośląską Biblioteką Cyfrową. We wrześniu 2005 roku na UMK w Toruniu uruchomiona została Kujawsko-Pomorska Biblioteka Cyfrowa, pierwszy w Polsce projekt sfinansowany częściowo z funduszy Unii Europejskiej (z programu ZPORR). Od tego momentu liczba ogólnodostępnych instalacji oprogramowania dLibra w naszym kraju zaczęła gwałtownie rosnąć7. Obecnie funkcjonuje 60 bibliotek cyfrowych, a trzy kolejne są w fazie przygotowania. Łącznie obejmują ponad 570 tys. dokumentów8.

Kolejny etap budowy sieci rozproszonych bibliotek cyfrowych i repozytoriów w Polsce wiąże się z powstaniem w czerwcu 2007 r. Federacji Bibliotek Cyfrowych (FBC)9. Serwis jest zbiorem zaawansowanych usług sieciowych, opartych na zasobach dostępnych w polskich bibliotekach cyfrowych i repozytoriach uruchomionych w sieci PIONIER10. Zasoby te są współtworzone przez różne instytucje - przede wszystkim wyższe uczelnie, biblioteki, archiwa, muzea i ośrodki badawcze. Serwis FBC utrzymywany jest przez Poznańskie Centrum Superkomputerowo-Sieciowe działające przy Instytucie Chemii Bioorganicznej PAN, a za jego rozwój odpowiada Zespół Bibliotek Cyfrowych PCSS. Główne cele serwisu to ułatwienie korzystania z zasobów polskich bibliotek cyfrowych i repozytoriów, zwiększenie ich widoczności i popularyzacja w internecie, udostępnianie ich użytkownikom a także twórcom nowych, zaawansowanych usług sieciowych opartych na tych zasobach. Główne funkcje FBC to:
  • wyszukiwanie proste i zaawansowane,
  • lokalizacja obiektów cyfrowych,
  • wykrywanie istniejących duplikatów obiektów cyfrowych i zapobieganie ich powstawaniu,
  • przeglądanie planów digitalizacji.
  • tworzenie podsumowań i statystyk dotyczących zasobów dostępnych w FBC11.
W światowych bibliotekach cyfrowych spotyka się elektroniczne wersje dokumentów tekstowych (książek, czasopism, gazet, starych druków, rękopisów, materiałów dydaktycznych, rozpraw naukowych itp.), druków muzycznych, materiałów kartograficznych, obrazów (fotografii, grafik, pocztówek itp.) oraz obiektów dźwiękowych, filmowych i multimedialnych. W polskich kolekcjach dominują zbiory tekstowe. Polskie biblioteki cyfrowe zawierają też niewielki odsetek materiałów współczesnych12, czyli takich, na które nie wygasły prawa autorskie.

Biblioteki cyfrowe - analiza i ocena

Biblioteki cyfrowe są systemami kompleksowymi, w których kluczową rolę odgrywają komponenty takie jak: zasoby, infrastruktura techniczna, użytkownicy oraz środowisko, dla którego repozytorium jest tworzone. Dlatego w przypadku tego typu bibliotek analizie i ocenie podlega bardzo wiele grup elementów. Zaliczyć do nich trzeba przede wszystkim zakres kolekcji, metadane, ontologie, kategorie i preferencje użytkowników, architekturę systemu, zarządzanie kolekcją. Biblioteki cyfrowe, tak jak inne źródła elektroniczne, oprócz oferowania przydatnych i dobrze kształtowanych zasobów, muszą również charakteryzować się użytecznością i funkcjonalnością, o których w dużej mierze decyduje doskonalenie i rozwój narzędzi wyszukiwania, interfejsu systemów informacyjnych, telekomunikacji i kolekcji multimedialnych.

Jedną z najbardziej syntetycznych prac dotyczących płaszczyzn i elementów oceny tego rodzaju zasobów jest opracowanie Tefko Saracevica13 z 2004 r., w którym autor, po przeanalizowaniu 80 raportów z badań bibliotek cyfrowych i studiów dotyczących metodologii tych badań, przedstawił listę kryteriów i wskaźników stanowiących zarys standardu ewaluacji bibliotek cyfrowych. Saracevic kryteria te przyporządkował do następujących płaszczyzn: użyteczność, cechy systemu, wykorzystanie, kryteria etnograficzne oraz inne.

W aspekcie badań użyteczności bibliotek cyfrowych autor wyróżnił cztery kryteria: zawartość zasobu, możliwości jego przetwarzania (np. wyszukiwanie, nawigacja, ocena), format i ocenę ogólną. Najważniejszymi wskaźnikami zawartości zasobu są przede wszystkim: jego dostępność, adekwatność do potrzeb, wiarygodność, przejrzystość prezentacji, kompleksowość struktury zasobu i jej zrozumiałość oraz autorstwo (przejrzystość informacji o twórcach zasobu). Wskaźniki dotyczące oceny przetwarzania zasobów są związane z funkcjami systemu - to np. dostępność pomocy, kompleksowość realizacji opcji i działań w zakresie przetwarzania, wskaźnik błędów - oraz z odczuciami użytkowników, np. łatwość wykorzystania oraz uczenia się możliwości przetwarzania zasobów, ocena poczucia zagubienia, zaufania do rezultatów przetwarzania. W odniesieniu do formatu najważniejszymi miernikami są: atrakcyjna forma prezentacji, logika i konsekwencja, komunikatywność i rodzaj metadanych. Przy ocenie ogólnej użyteczności Saracevic proponuje zastosować następujące wskaźniki: poziom satysfakcji użytkowników, użyteczność zasobów w znaczeniu relewancji, ocena wpływu na użytkowników i barier w wykorzystaniu oraz analiza potrzeb użytkowników i jakości dostępnych szkoleń z zakresu wykorzystania zasobu.

Ocenę cech systemu autor przedstawił, wyróżniając jej trzy kryteria: funkcjonalność techniczną, jakość działania i cechy ogólne systemu. Przy rozpatrywaniu technicznych cech systemu najwięcej uwagi zwraca się na czas odpowiedzi oraz pojemność systemu. Jakość działania to przede wszystkim ocena relewancji osiąganych rezultatów, funkcjonalność systemu, jego elastyczność, dostosowanie do działań użytkowników, wskaźnik błędów, czas wyszukiwania, długość ścieżek dostępu i liczba kliknięć niezbędnych do uzyskania rezultatów. Cechy ogólne to warunki utrzymywania systemu, jego interoperacyjność (możliwość współpracy z innymi systemami), skalowalność (scalability), tzn. ocena zachowania systemu, gdy rosną zasoby i zwiększa się liczba klientów, oraz koszty.

Płaszczyzna oceny wykorzystania biblioteki cyfrowej opiera się na analizie wzorców korzystania z jej zasobów, badaniu statystyk wykorzystania oraz zestawianiu kategorii użytkowników z czasem i celami korzystania z biblioteki. Natomiast badania bibliotek cyfrowych z perspektywy etnograficznej wymagają kompleksowej porównawczej analizy kulturowych warunków funkcjonowania takich inicjatyw oraz wpływu na różnorodne grupy użytkowników14.

Ostatnio w polskiej literaturze przedmiotu pojawiła się praca Lidii Derfert-Wolff - Jak posługiwać się biblioteką cyfrową? - przedstawiająca kluczowe, według autorki, elementy oceny bibliotek cyfrowych. Skupiła się ona na elementach oceny z punktu widzenia użytkownika, pominęła ogólne cechy sytemu oraz perspektywę etnograficzną badań, dodała natomiast wskaźniki cech bibliotek, które pojawiły się wraz z rozwojem Web 2.0. Zaproponowane grupy wskaźników wyraźnie eksponują przyjętą perspektywę badawczą. Są nimi:

  • jakość kolekcji, czyli opis kolekcji jako całości, w tym informacja o prawach autorskich i prawach dostępu, organizacja zasobów, opis obiektów cyfrowych (metadane), wiarygodność i dokładność;
  • interfejs użytkownika: tożsamość serwisu (zapewnienie użytkownikowi podstawowych informacji niezbędnych do identyfikacji całego serwisu - czytelna nazwa i zwięzła misja serwisu, określenie grup odbiorców, dane kontaktowe oraz przyciągające uwagę elementy graficzne, np. logo), funkcjonalność, w tym wyszukiwanie i przeglądanie zasobów według indeksów, dostępność dla jak najszerszego grona odbiorców i użyteczność (łatwość korzystania z podstawowych funkcji serwisu - intuicyjna nawigacja, ułatwianie dostępu do poszukiwanej informacji oraz zapewnienie zrozumiałej dla użytkownika komunikacji serwisu);
  • możliwości i techniki wyszukiwawcze: wyszukiwanie pełnotekstowe, możliwość wyszukiwania według różnych kryteriów i list wyboru, korzystania ze słowników kontrolowanych, indeksów, możliwość ograniczania wyszukiwania według różnych kryteriów, techniki wyszukiwawcze i techniki przetwarzania tekstu, system podpowiedzi (sugestii);
  • prezentacja wyników wyszukiwania: ogólna informacja o rezultatach wyszukiwania, różne opcje wyświetlania listy wyników, grupowanie i szeregowanie, dalsze ograniczanie wyszukiwania według zadanych kryteriów, prezentacja opisów obiektów, możliwość zachowywania i cytowania rezultatów wyszukiwania, obsługa różnych formatów plików, dostępność narzędzi do ich odczytu;
  • dodatkowe usługi: elementy Web 2.0, specjalne uprawnienia dla zarejestrowanego użytkownika, dostępność raportów i statystyk, inne funkcje i usługi 15.
Prace nad rozwojem metodologii oceny bibliotek cyfrowych prowadzone są również w ramach programów międzynarodowych. Od początku 2004 roku problematyką rozwoju i oceny bibliotek cyfrowych zajmuje się 55-osobowa grupa specjalistów z różnych krajów, którzy współpracują w ramach projektu DELOS częściowo finansowanego przez Komisję Europejską z Information Society Technologies Programme16. Celem całego projektu jest koordynacja badań dotyczących bibliotek cyfrowych oraz popularyzacja ich wyników poprzez organizację konferencji i warsztatów. Jednym z celów inicjatywy DELOS jest stworzenie metodologii oceny bibliotek cyfrowych. Jako podstawę prac przyjęto ustalenia T. Saracevica, a dalsze rozwijanie metodologii opiera się na kilku założeniach, takich jak:
  • elastyczność zakresu, płaszczyzn i kryteriów oceny,
  • udział w niej praktyków i użytkowników,
  • tworzenie metodologii na bazie dotychczasowego dorobku innych projektów: TREC, CLEF, INEX, NTCIR17.
W pracach nad metodologią zwraca się również uwagę na zagadnienia, którymi dotąd zajmowano się w mniejszym stopniu, a więc:
  • monitoring prowadzonych badań z zakresu oceny bibliotek cyfrowych, co będzie stanowiło podstawę wyłaniania najlepszych praktyk w tym zakresie,
  • tworzenie repozytoriów danych prymarnych, wykorzystywanych w ocenach (np. logów, wyników sondaży, danych z monitorowanych procesów),
  • standaryzację formatów logowania się do systemów,
  • ocenę zachowań użytkowników,
  • ustalenie specyfiki metodologii oceny bibliotek cyfrowych w odróżnieniu od ewaluacji innych zasobów sieciowych18.

Podsumowanie

Metodologia oceny bibliotek cyfrowych ciągle się rozwija, tak jak powiększają się zasoby tego rodzaju i zmieniają technologie ich udostępniania. Przedstawione w artykule wybrane propozycje płaszczyzn, kryteriów i wskaźników ewaluacji oraz kierunki ich rozwoju niewątpliwie nie wyczerpują tematu. Starano się jednak zwrócić uwagę na rozwój zainteresowania tą problematyką w środowisku międzynarodowym i polskim. Prezentowane aspekty i kryteria oceny mogą stanowić podstawę wyboru płaszczyzn i elementów badań konkretnych projektów cyfrowych realizowanych w naszym kraju. Analiza wyników takich badań byłaby bardzo cenna - zarówno dla twórców, jak i użytkowników repozytoriów. Jednak w przekonaniu autorki już samo przyjrzenie się różnym aspektom oceny jakości bibliotek cyfrowych pozwoli bardziej świadomie kształtować istniejące i nowe projekty repozytoriów, a później z satysfakcją z nich korzystać.

Bibliografia

  • L. Derfert-Wolff, Jak posługiwać się biblioteką cyfrową?, [w:] H. Hollener (red.), Cyfrowy świat dokumentu. Wydawnictwa, biblioteki, muzea, archiwa, Centrum Promocji Informatyki, Warszawa 2011.
  • N. Fuhr i inni, Evaluation of digital libraries, „International Journal on Digital Libraries” 2007, nr 8.

Netografia

Informacje o autorze

zobacz podgląd
EWA GŁOWACKA

Autorka jest doktorem habilitowanym nauk humanistycznych w zakresie bibliologii, profesorem w Instytucie Informacji Naukowej i Bibliologii Uniwersytetu Mikołaja Kopernika w Toruniu. Od ponad 10 lat zajmuje się metodologią oceny jakości zasobów i usług informacyjnych. Ma w swym dorobku liczne publikacje z tej dziedziny.

Komentarze

Nie ma jeszcze komentarzy do tego artykułu.

dodaj komentarz dodaj komentarz

Przypisy

1 M. Mocydlarz, Udostępnianie informacji naukowej na nośnikach elektronicznych, „Biuletyn Porozumienia Biblioteka z Horyzontem”, galileo.pfsl.poznan.... [10.03.2011].

2 Dublin Core to jeden ze standardów zapisu metadanych, protokół OAI-PMH służy do ich przesyłania. W bibliotekach cyfrowych metadane dotyczą obiektu cyfrowego lub kolekcji obiektów - ułatwiają lokalizację, identyfikację, wyszukiwanie i wykorzystanie obiektów.

3 Komitet Badań Naukowych, Polska Biblioteka Internetowa, kbn.icm.edu.pl/info.... [01.04.2011].

4 Opis biblioteki cyfrowej, Polska Biblioteka Internetowa, fbc.pionier.net.pl/.... [01.04.2011].

5 Polska Biblioteka Internetowa. Historia projektu, www.pbi.edu.pl/opbi.... [10.03.2011].

6 PBI - 32 071 dokumentów, WBC - 129 888 dokumentów, MBC - 56 969 dokumentów, KPBC - 41 714 dokumentów (stan z 1 kwietnia 2011 roku).

7 O projekcie dLibra, dlibra.psnc.pl/inde.... [10.03.2011].

8 Zestawienie polskich bibliotek cyfrowych, fbc.pionier.net.pl/.... [10.03.2011].

9 A. Lewandowska, C. Mazurek, M. Werla, Federacja Bibliotek Cyfrowych w sieci PIONIER - Dostęp do otwartych bibliotek cyfrowych i repozytoriów, IV Ogólnopolska Konferencja EBIB Internet w bibliotekach Open Access, Toruń, 7-8 grudnia 2007 roku, www.ebib.info/publi.... [23.03.2011].

10 PIONIER - ogólnopolska szerokopasmowa sieć optyczna nauki (Polski Internet Optyczny).

11 Federacja Bibliotek Cyfrowych, fbc.pionier.net.pl/.... [22.03.2011].

12 L. Derfert-Wolff, Jak posługiwać się biblioteką cyfrową?, [w:] H. Hollender (red.), Cyfrowy świat dokumentu. Wydawnictwa, biblioteki, muzea, archiwa, Centrum Promocji Informatyki, Warszawa 2011, s. 192.

13 Tefko Saracevic, Evaluation of digital libaries: An overview, www.scils.rutgers.e.... [22.03.2011].

14 Lista skonsruowana przez Saracevica na podstawie ponad 80 raportów z badań jest podstawą ustalania kryteriów oceny bibliotek cyfrowych. Kryteria te stosuje się w wyborze w bardzo wielu badaniach.

15 L. Derfert-Wolff, dz.cyt., s. 190-233.

16 About DELOS, www.delos.info/inde.... [22.03.2011].

17 The Text REtrieval Conference (TREC) - prowadzone od 1992 r. przez National Institute of Standards and Technology (USA) coroczne konferencje i warsztaty związane z oceną wyszukiwania pełnotekstowego; The Cross-Language Evaluation (CLEF) - forum, kampania i warsztaty prowadzone od 2000 r., poświęcone ocenie dostępu do informacji oraz ocenie systemów informacyjno-wyszukiwawczych; INitiative for the Evaluation of XML Retrieval (INEX) - projekt zapoczątkowany w 2002 r., prowadzony przez Schloss Dagstuhl/Leibnitz Center for Informatics, NTCIR - projekt warsztatów dotyczących badań związanych z dostępem i wyszukiwaniem informacji, realizowany od 1997 r. przez National Center for Science Information Systems (NACSIS) we współpracy z Japan Society for Promotion of Science (JSPS).

18 N. Fuhr i inni, Evaluation of digital libraries, „International Journal on Digital Libraries” 2007, nr 8, s. 35.