Miliony skanów za miliony złotych

Miliony skanów za miliony złotych

Mamy w Polsce bardzo rozbudowaną bibliotekę cyfrową. Niestety, mało kto o niej wie

Mój niedoszły teść oglądał w każdą Wigilię „Misia” Stanisława Barei. Zapytałem go, skąd mu się wzięła ta świecka tradycja. Odpowiedział, że raz do roku, kiedy ma trochę spokoju, lubi sobie przypomnieć, że żyjemy w kraju, w którym nie dość, że wszystko wygląda jak u Barei, to jeszcze nigdy się tych bareizmów nie pozbędziemy. Niezależnie od tego, jakich najnowszych technologii i światłowodów będziemy używać.

Co wspólnego mają z tym ponad 3 mln dostępnych online skanów zgromadzonych przez Bibliotekę Narodową? Nasza opowieść zaczyna się 21 grudnia 2002 r., kiedy to z ramienia Departamentu Promocji Społeczeństwa Informacyjnego Ministerstwa Nauki powstała Polska Biblioteka Internetowa. W zamierzeniu zgromadzone online zbiory miały ułatwiać edukację osobom pochodzącym z małych miast lub regionów oddalonych od ośrodków akademickich czy kulturalnych. W praktyce skorzystali głównie akademicy, specjaliści i ludzie zamiłowani w bibliotekoznawstwie czy historii. Ogółem osoby będące w temacie. Z najnowszej odsłony PBI, która przeobraziła się w ciągu lat w Polona.pl, nadal może skorzystać każdy. Problem w tym, że po 20 latach istnienia o stronie z pokaźnymi zbiorami nadal wie niewiele osób.

Miś

Wokół projektu Polskiej Biblioteki Internetowej narosło sporo kontrowersji, i to od samego początku. Główną linią krytyki były koszty związane z jej powstaniem. Wątpliwości wyrażali m.in. dziennikarze „Internet Standard”, tytułu zajmującego się wiadomościami ze świata raczkującego w Polsce internetu. Informowali, że na stworzenie PBI, która miała na starcie zaledwie 265 zdigitalizowanych pozycji, zostanie przeznaczone w 2003 r. 3,5 mln zł, aby rozbudować bazę tytułów o kolejne – zaledwie – 6 tys. pozycji. Z tej kwoty na internetową reklamę wydano 147 tys. zł. Eksperci twierdzili, że był to zabieg chybiony, wręcz niepotrzebny, ponieważ kampania nie odniosła żadnego skutku. Warto pamiętać, że były to inne czasy, kiedy reklama w sieci nie była oczywistością. Według badań SMG/KRC Poland Media w 2002 r. mieliśmy w Polsce 5,2 mln internautów. Dla porównania – według analizy Mediapanel Gemius w czwartym kwartale 2021 r. z internetu miesięcznie korzystało średnio 29,6 mln Polaków.

Nie był to jedyny zarzut formułowany przeciwko inicjatywie. Pierwsi użytkownicy pokazywali niedostatki PBI: „Otworzyłem sobie »Romeo i Julię« Szekspira. Nie ma śladu informacji o tym, kto to tłumaczył i na podstawie jakiego wydania publikują tekst. Jak nic naruszenie prawa autorskiego. To, że nie ma notki, co to za dzieło, kto je stworzył, kiedy były ciekawsze tłumaczenia i wydania, świadczy o braku jakiejkolwiek koncepcji edukacyjnej autorów projektu”, pisał jeden z internautów, który korzystał z serwisu w pierwszych dniach. Wpadek było na początku tyle, że stronę wziął na warsztat popularny na początku lat dwutysięcznych serwis Osiolki.net, oddolna inicjatywa, która pomagała twórcom stron internetowych w poprawianiu błędów popełnionych podczas tworzenia portali. Niech to wybrzmi – PBI robiona za 3,5 mln zł była krytykowana przez serwis, który pomagał przeważnie amatorom stawiającym pierwsze kroki w sieci.

Innym zarzutem były problemy nawigacyjne, ponieważ książki skatalogowano tylko według tytułów i autorów. PBI potykała się tak o własne sznurówki aż do 2008 r., kiedy to przejęło ją od MSWiA Ministerstwo Kultury i Dziedzictwa Narodowego. Tym sposobem serwis de facto trafił w ręce Biblioteki Narodowej, z którą do tej pory właściwie konkurował, tworząc alternatywną dla portalu Polona.pl bazę lektur.

Stare po staremu

Inicjatywa Polskiej Biblioteki Internetowej przez cztery lata leżała odłogiem, aż w 2012 r. zainteresowała się nią Najwyższa Izba Kontroli. „NIK krytycznie ocenia także realizację przez MSWiA projektu Polskiej Biblioteki Internetowej (PBI). Miała ona zapewnić internetowy dostęp do klasyki literatury polskiej i światowej, dokumentów archiwalnych, czasopism i periodyków. Choć na ten projekt wydano łącznie 10 mln zł, to stan zasobów oraz funkcjonalność PBI znacząco odbiega od standardów oferowanych przez inne biblioteki cyfrowe”, czytamy w raporcie. Kontrolerzy NIK wymieniają mankamenty tej witryny, m.in. brak udogodnień dla osób niedowidzących i słabą jakość plików. Dodatkowo raport zwraca uwagę, że technologia zastosowana przy budowie strony uniemożliwiała jej dalszy rozwój. Być może dlatego po przejęciu PBI Biblioteka Narodowa zaczęła w 2012 r. przenosić treści do portalu, który sama rozwijała.

Co jednak ważne, NIK opublikowała raport cztery lata po przejęciu Polskiej Biblioteki Internetowej przez nowy podmiot. I kontrolerzy NIK również na Bibliotece Narodowej nie zostawili suchej nitki. Mimo że PBI miała już 10 lat, nadal borykała się z problemami z zakresu prawa autorskiego. Poza tym skany były w tak złej rozdzielczości, że nie nadawały się do długotrwałej archiwizacji, a część była wybrakowana. Można jednak powiedzieć, że wiele czasu i pieniędzy upłynęło od napisania raportu Najwyższej Izby Kontroli i serwis Polona.pl święci dziś triumfy jako jedna z największych bibliotek cyfrowych w Europie. Przenoszenie zasobów do Polony trwało cztery lata, między 2012 a 2016 r. Przeanalizowano w tym czasie pliki z PBI i zaimportowano to, co miało wystarczającą jakość i nie budziło wątpliwości prawnych.

Polona

„Zachęcamy do skorzystania z zasobów cyfrowych Biblioteki Narodowej, które są udostępnione w serwisie POLONA. To najnowocześniejsza w Polsce i jedna z największych w Europie bibliotek cyfrowych. Uczniowie i nauczyciele znajdą w serwisie rękopisy iluminowane, najstarsze polskie książki drukowane, ryciny, rysunki, stare elementarze, książki dla dzieci czy dawne poradniki”, można przeczytać na stronie rządowego serwisu  Gov.pl z okazji dnia bibliotekarza. Dowiadujemy się też, że jest to największa cyfrowa biblioteka w Polsce, która ma połączone zbiory z Biblioteką Jagiellońską: „W serwisie można znaleźć: najcenniejsze skarby polskiej kultury i historii, np. »Kronikę« Galla Anonima, rękopisy Kochanowskiego, Mickiewicza i Chopina czy rysunki Norwida i Witkacego. Są tu obiekty reprezentujące przekrój dziedzin i epok: rękopisy iluminowane, najstarsze polskie książki drukowane, ryciny, rysunki oraz publikacje popularne – pocztówki, stare elementarze, książki dla dzieci, książki kucharskie czy dawne poradniki”.

Ale jak to właściwie działa? Polona jest portalem darmowym, w którym nie trzeba nawet zakładać konta, aby móc korzystać z większości jej funkcji. Na stronie mamy ponad 3,7 mln skanów i plików. Wpisujemy poszukiwaną frazę, autora czy nawet słowo w wyszukiwarkę i już możemy czytać. Oczywiście o ile tytuł znajduje się

w tych zasobach. Na przykład po wpisaniu hasła „Lalka” wyskakują dziesiątki wydań dzieła Bolesława Prusa. Można przeczytać skan zarówno z 1890 r., jak i z 1925 czy 1946. Pojawia się pytanie, czy taka liczba skanów jednego tytułu, który nie występuje przecież w różnych tłumaczeniach, jest komuś potrzebna. Być może koneserzy literatury stwierdzą, że fajnie porównać sobie poszczególne egzemplarze. Pozostaje jednak wątpliwość, czy ktoś przypadkiem nie postawił tutaj na ilość, a nie na jakość, aby móc się pochwalić wielkością biblioteki. Oczywiście nie można odmówić wartości wszystkim tym skanom, które umożliwiają chociażby przeczytanie najstarszych wydań „Kuriera Warszawskiego”, co może być bardzo przydatne dla autorów książek czy prac naukowych. Jednak właśnie w tym tkwi problem. Polona wydaje się narzędziem dla wąskiej grupy specjalistów i entuzjastów. Miesięcznie odnotowuje się od 3 do 3,6 mln wejść, jednak liczba zarejestrowanych użytkowników portalu wynosi około 100 tys. osób.

Kierunek ten zdaje się potwierdzać ostatnia akcja poszerzenia zasobów portalu kierowanego przez Bibliotekę Narodową. Chodzi o realizowany w latach 2017-2020 projekt „Patrimonium”, mający na celu digitalizację i udostępnienie polskiego dziedzictwa narodowego znajdującego się w zbiorach Biblioteki Narodowej i Biblioteki Jagiellońskiej. Wszystkie wybrane do projektu obiekty należały do domeny publicznej, a więc mogą być bez ograniczeń wykorzystywane przez użytkowników portalu. Przyjrzyjmy się, co trafiło do cyfrowego przetworzenia. „Procesowi digitalizacji zostaną poddane dokumenty pochodzące ze zbiorów kartograficznych, muzycznych, ikonograficznych, jak również czasopisma, druki ulotne, rękopisy, stare druki oraz książki z XIX i XX w. Część z nich podlega szczególnej ochronie ze względów konserwatorskich i nie jest dostępna na co dzień”, informowała Biblioteka Narodowa w 2017 r. Przeprowadzona digitalizacja objęła ponad milion obiektów z obu bibliotek i kosztowała prawie 100 mln zł, z czego ponad 83 mln pochodziło z funduszy Unii Europejskiej. Projekt doczekał się kontynuacji w postaci „Patrimonium – Zabytki piśmiennictwa”, między lipcem 2020 r. a listopadem 2022 r. Zeskanowano jeszcze starsze i cenniejsze zapiski, m.in. oryginały Galla Anonima, co kosztowało kolejnych 37 mln zł. Unia znowu wyłożyła większość kwoty, bo 84%. Według Biblioteki Narodowej utrzymanie samej infrastruktury Polona.pl to ponad 350 tys. zł rocznie brutto. To jednak tylko ułamek wszystkich kosztów portalu. Do tego trzeba doliczyć serwerownie, administratorów, informatyków, bibliotekarzy publikujących cyfrowe obiekty na polona.pl i wielu innych pracowników BN, którzy stale poszerzają wirtualne zbiory.

W Polona.pl nie przekonuje sama funkcjonalność strony. Część użytkowników narzeka na bałagan panujący na stronie głównej. Skany najlepiej pobierać bezpośrednio na dysk, gdyż przeładowywanie kolejnych stron trwa bardzo długo. Wątpliwości budzi też funkcja „warstwy tekstowej” pozwalająca skopiować tekst bezpośrednio ze skanu, która miałaby potencjał dla uczniów, a podobno to dla nich Polona ma być wielkim ułatwieniem.

Postanawiam to sprawdzić. Przełączam się pomiędzy kolejnymi „Lalkami” i próbuję z użyciem wspomnianej funkcji skopiować fragment książki do pliku tekstowego. Niestety, niezależnie od wybranej „Lalki” po kliknięciu „wklej” pojawia się zbity tekst bez spacji, którego nie da się zrozumieć. Pech. Na szczęście strona Gov.pl podpowiada mi, że jeśli szukam darmowego dostępu do szkolnych lektur, to pod adresem lektury.gov.pl mogę odnaleźć większość tytułów. Klikam w link. Strona nie działa. Wykonuję intelektualnego fikołka i przekopiowuję adres do nowego okna wyszukiwarki. Strona otwiera się, ale z ostrzeżeniem na czerwono, że nie spełnia najnowszych norm bezpieczeństwa. Ryzykuję, w końcu to domena rządowa, przechodzę dalej. Po kilku chwilach nawigowania okazuje się, że ten adres nie działa, karmiąc mnie w kółko powiadomieniem: „Przepraszamy, wystąpił błąd. Odśwież stronę”.

Tylko kto to będzie czytał?

Pozostawiony samemu sobie postanowiłem szukać dalej użytecznej dla ucznia wersji „Lalki”. Trafiam na stronę WolneLektury.pl. Strona zrobiona jest na tip-top. Znajduje się tu masa tytułów. Wszystkie książki można pobrać w kilku rozszerzeniach na czytniki. Nie brakuje także wersji przeglądarkowej. Część lektur jest w audio. Treść można oczywiście bez problemu kopiować do notatek. Na stronie wyświetla się baner, który informuje, że aby przetrwać, portal potrzebuje wsparcia finansowego użytkowników. Za WolneLektury.pl odpowiedzialna jest bowiem fundacja Nowoczesna Polska. Okazuje się więc, że znowu to inicjatywa oddolna musiała zadbać o coś w polskiej edukacji i zrobiła to lepiej niż państwo.

A to niejedyny niepokojący fakt. Z badań Biblioteki Narodowej dotyczącej czytelnictwa w Polsce w 2020 r. wynika, że 58% respondentów w ciągu roku nie przeczytało ani jednej książki. Tylko 5% przeczytało od 7 do 11 książek, czyli mniej niż jedną na miesiąc. Na koniec warto przytoczyć samo pytanie zadawane respondentom: „Czy w ciągu ostatnich 12 miesięcy czytał(a) Pan(i), w całości lub fragmencie, albo przeglądał(a) Pan(i) jakieś książki?”. Widać, że nawet badacze nie mają złudzeń, jak to czytelnictwo w Polsce wygląda.

Mamy zatem ogromną darmową bibliotekę cyfrową z milionami pozycji, stworzoną za setki milionów złotych w kraju, w którym ponad połowa obywateli nie jest w stanie przejrzeć nawet jednej książki rocznie. Trudno nie pomyśleć o słomianej inwestycji z filmu Barei.

Fot. Shutterstock

Wydanie: 2022, 53/2022

Kategorie: Kraj

Komentarze

  1. Jarosław Witkowski
    Jarosław Witkowski 16 lutego, 2023, 09:17

    To nie jest słomiana inwestycja to jest konieczność, angielskojęzyczne zasoby w dużej mierze są płatne ale ich zasięg jest kilkadziesiąt razy większy.
    Problemem dla użytkownika jest różny sposób publikacji, jedne są dostępne w pdf inne w djvu inne w jpg. Wyszukiwanie jest nieintuicyjne, czasami zawodzi filtrowanie, opis opcji wyszukiwania jest słaby, zrozumiały dla bibliotekarzy ale nie dla zwykłego czytelnika.

    Odpowiedz na ten komentarz

Napisz komentarz

Odpowiedz na treść artykułu lub innych komentarzy