Dokładne opracowanie wyników Spisu Powszechnego potrwa do wiosny przyszłego roku Ileż ton papieru zapisano na temat wadliwego systemu informatycznego w ZUS? Jak bardzo złorzeczono na system obliczania głosów w wyborach powszechnych? Pogodziliśmy się też z faktem, że nie udało się dotąd stworzyć skomputeryzowanego systemu poszukiwania skradzionych samochodów ani przestępstw celnych, że PIT-y wypełnia się ręcznie i składa osobiście, a czytający to urzędnicy niszczą sobie wzrok. Tymczasem o informatycznym systemie, którzy przetworzył z sukcesem wyniki pracy 170 tys. rachmistrzów spisowych, prawie w ogóle nic nie wiemy. Po to jednak wynaleziono technikę optycznego odczytu dokumentów, określaną też skrótem OCR, aby uwolnić od „ręcznego obrabiania” stosy papierów, na których zapisywane są ważne informacje i dane. Największe przedsięwzięcie o zasięgu krajowym, zamiast być tradycyjnie długotrwałe, pracochłonne i kosztowne, już dobiega końca. Narodowy Spis Powszechny Ludności i Mieszkań oraz Powszechny Spis Rolny wymagały przetworzenia prawie 300 mln stron dokumentów spisowych, czyli różowych formularzy, które powstały podczas wizyt w 13,8 mln gospodarstw domowych, były właśnie na razie jedynymi przedsięwzięciami o tak ogromnej skali w Europie. Czytanie maszynowe Wiesław Łagodziński, rzecznik prasowy Prezesa Głównego Urzędu Statystycznego, przypomina sobie, że kiedy zbierano doświadczenia z innych krajów, które niedawno przeprowadzały spisy powszechne, wyrażano wątpliwość, czy możliwa jest realizacja dwóch spisów jednocześnie, i przewidywano, że przedsięwzięcie się nie uda. Amerykanie twierdzili, że zadanie jest bardzo ambitne, zaś Francuzi mówili wprost: nie dacie rady, wszystko się wam posypie. W Polsce mimo dużych komplikacji – polegających m.in. robieniu równolegle dwóch spisów (w związku z tym używano aż ośmiu typów formularzy), a także wprowadzeniu szeregu nowych elementów, np. po raz pierwszy pytano o narodowość, po raz pierwszy też spisywano bezdomnych – przedsięwzięcie zakończono w terminie i z pełnym sukcesem. Co więcej, sam spis wywołał bardzo korzystne reakcje społeczne, ożywienie i uświadomienie – przecież było to również przetestowanie najbliższego otoczenia mieszkańców, sprawdzenie funkcjonalności obecnego podziału administracyjnego, wszystkich samorządów, 2,5 tys. gmin, a także efektywności lokalnych decyzji, np. dotyczących rekrutacji rachmistrzów spisowych. Właśnie dzięki takim udanym akcjom GUS jest dziś traktowany jako najbardziej wiarygodne, bezstronne i apolityczne źródło informacji o podstawowych wskaźnikach ekonomicznych, produkcji, sprzedaży, płacach, zatrudnieniu i bezrobociu. Jesteśmy także przekonani, że spis się udał dzięki bardzo dobremu przygotowaniu, trwającym od dwóch lat pracom studyjnym i przeprowadzonemu w 2000 r. spisowi próbnemu w ośmiu gminach. Po tych badaniach potwierdziła się decyzja, że w zredukowania prac ręcznych przy kodowaniu informacji i rejestracji danych zawartych w formularzach bardzo pomoże OCR – technika optycznego odczytu dokumentów, polegająca na zeskanowaniu wszystkich formularzy, automatycznym odczytaniu, kodowaniu i odkodowywaniu niektórych cech oraz automatycznej korekcie i weryfikacji wyników. Skanowanie w świątek – piątek Krzysztof Kurkowski, dyrektor Departamentu Infrastruktury Technicznej GUS, który odpowiadał za ogromną operację przetworzenia danych z formularzy, zwraca uwagę na istotne decyzje o charakterze organizacyjnym, które pozwoliły na sprawne, ale zarazem w miarę oszczędne przeprowadzenie tej części spisu. Zakupiono 36 nowych skanerów M4099D Fujitsu, choć zgodnie z instrukcją obsługi tych urządzeń do obróbki takiej masy dokumentów trzeba byłoby mieć około setki. Uzyskano jednak od producenta gwarancję, że urządzenia do optycznego czytania i przetwarzania ręcznych wpisów rachmistrzów w dane numeryczne wytrzymają trzykrotne przeciążenie, pracując non stop na trzy zmiany. Gdyby kupiono więcej skanerów, na jeden przypadłoby ok. 2,5 mln kartek. W naszym spisie na jeden skaner przypadło 4,5 mln kartek i choć po zakończeniu pracy urządzenia będą już w poważnym stopniu zużyte, wyniki uzyskano szybko i względnie tanio. W tym przypadku skorzystano z doświadczeń estońskich, gdzie również – choć w znacznie mniejszej skali – eksploatowano skanery „aż do zdarcia”. Aby skanery i ich oprogramowanie jak najmniej się myliły, zastosowano szereg rozwiązań pomocniczych. Dla lepszej czytelności wszystkie formularze musiały być wypełniane czarnymi długopisami, zaś ramki wyznaczające pola odczytu wydrukowano w kolorze czerwonym, którego skanery „nie biorą”. Aby poszczególne formularze wypełniane u jednego
Tagi:
Bronisław Tumiłowicz









