Rachmistrze i skanery

Rachmistrze i skanery

Dokładne opracowanie wyników Spisu Powszechnego potrwa do wiosny przyszłego roku

Ileż ton papieru zapisano na temat wadliwego systemu informatycznego w ZUS? Jak bardzo złorzeczono na system obliczania głosów w wyborach powszechnych? Pogodziliśmy się też z faktem, że nie udało się dotąd stworzyć skomputeryzowanego systemu poszukiwania skradzionych samochodów ani przestępstw celnych, że PIT-y wypełnia się ręcznie i składa osobiście, a czytający to urzędnicy niszczą sobie wzrok. Tymczasem o informatycznym systemie, którzy przetworzył z sukcesem wyniki pracy 170 tys. rachmistrzów spisowych, prawie w ogóle nic nie wiemy.
Po to jednak wynaleziono technikę optycznego odczytu dokumentów, określaną też skrótem OCR, aby uwolnić od „ręcznego obrabiania” stosy papierów, na których zapisywane są ważne informacje i dane. Największe przedsięwzięcie o zasięgu krajowym, zamiast być tradycyjnie długotrwałe, pracochłonne i kosztowne, już dobiega końca. Narodowy Spis Powszechny Ludności i Mieszkań oraz Powszechny Spis Rolny wymagały przetworzenia prawie 300 mln stron dokumentów spisowych, czyli różowych formularzy, które powstały podczas wizyt w 13,8 mln gospodarstw domowych, były właśnie na razie jedynymi przedsięwzięciami o tak ogromnej skali w Europie.

Czytanie maszynowe

Wiesław Łagodziński, rzecznik prasowy Prezesa Głównego Urzędu Statystycznego, przypomina sobie, że kiedy zbierano doświadczenia z innych krajów, które niedawno przeprowadzały spisy powszechne, wyrażano wątpliwość, czy możliwa jest realizacja dwóch spisów jednocześnie, i przewidywano, że przedsięwzięcie się nie uda. Amerykanie twierdzili, że zadanie jest bardzo ambitne, zaś Francuzi mówili wprost: nie dacie rady, wszystko się wam posypie.
W Polsce mimo dużych komplikacji – polegających m.in. robieniu równolegle dwóch spisów (w związku z tym używano aż ośmiu typów formularzy), a także wprowadzeniu szeregu nowych elementów, np. po raz pierwszy pytano o narodowość, po raz pierwszy też spisywano bezdomnych – przedsięwzięcie zakończono w terminie i z pełnym sukcesem. Co więcej, sam spis wywołał bardzo korzystne reakcje społeczne, ożywienie i uświadomienie – przecież było to również przetestowanie najbliższego otoczenia mieszkańców, sprawdzenie funkcjonalności obecnego podziału administracyjnego, wszystkich samorządów, 2,5 tys. gmin, a także efektywności lokalnych decyzji, np. dotyczących rekrutacji rachmistrzów spisowych. Właśnie dzięki takim udanym akcjom GUS jest dziś traktowany jako najbardziej wiarygodne, bezstronne i apolityczne źródło informacji o podstawowych wskaźnikach ekonomicznych, produkcji, sprzedaży, płacach, zatrudnieniu i bezrobociu.
Jesteśmy także przekonani, że spis się udał dzięki bardzo dobremu przygotowaniu, trwającym od dwóch lat pracom studyjnym i przeprowadzonemu w 2000 r. spisowi próbnemu w ośmiu gminach. Po tych badaniach potwierdziła się decyzja, że w zredukowania prac ręcznych przy kodowaniu informacji i rejestracji danych zawartych w formularzach bardzo pomoże OCR – technika optycznego odczytu dokumentów, polegająca na zeskanowaniu wszystkich formularzy, automatycznym odczytaniu, kodowaniu i odkodowywaniu niektórych cech oraz automatycznej korekcie i weryfikacji wyników.

Skanowanie w świątek – piątek

Krzysztof Kurkowski, dyrektor Departamentu Infrastruktury Technicznej GUS, który odpowiadał za ogromną operację przetworzenia danych z formularzy, zwraca uwagę na istotne decyzje o charakterze organizacyjnym, które pozwoliły na sprawne, ale zarazem w miarę oszczędne przeprowadzenie tej części spisu. Zakupiono 36 nowych skanerów M4099D Fujitsu, choć zgodnie z instrukcją obsługi tych urządzeń do obróbki takiej masy dokumentów trzeba byłoby mieć około setki. Uzyskano jednak od producenta gwarancję, że urządzenia do optycznego czytania i przetwarzania ręcznych wpisów rachmistrzów w dane numeryczne wytrzymają trzykrotne przeciążenie, pracując non stop na trzy zmiany. Gdyby kupiono więcej skanerów, na jeden przypadłoby ok. 2,5 mln kartek. W naszym spisie na jeden skaner przypadło 4,5 mln kartek i choć po zakończeniu pracy urządzenia będą już w poważnym stopniu zużyte, wyniki uzyskano szybko i względnie tanio. W tym przypadku skorzystano z doświadczeń estońskich, gdzie również – choć w znacznie mniejszej skali – eksploatowano skanery „aż do zdarcia”.
Aby skanery i ich oprogramowanie jak najmniej się myliły, zastosowano szereg rozwiązań pomocniczych. Dla lepszej czytelności wszystkie formularze musiały być wypełniane czarnymi długopisami, zaś ramki wyznaczające pola odczytu wydrukowano w kolorze czerwonym, którego skanery „nie biorą”. Aby poszczególne formularze wypełniane u jednego mieszkańca nie mieszały się i nie gubiły, oznaczono je kodem kreskowym. Taki sam kod wydrukowany na formularzu mieszkaniowym rachmistrz doklejał do wszystkich innych formularzy o symbolach Am, Ap, M, D, R1, R2 i załączników wypełnianych w konkretnym gospodarstwie domowym.
Nie przewidziano tylko jednego – skutków wykorzystania gumek do ścierania, z upodobaniem używanych przez rachmistrzów. Zaczynali oni wypełniać formularze ołówkiem, a kiedy przed porządnym wypełnienie czarnym długopisem wycierali wszystkie ołówkowe ślady, powstawał skanerowy horror. Skanery po „obróbce” kilku tysięcy formularzy należało gruntownie czyścić z pozostałości gumki, która przykleiła się do urządzeń. Jednak mimo takich niespodzianek skanery wytrzymały natężenie pracy i spisały się na piątkę.

Obróbka w pięć miesięcy

Dyr. Krzysztof Kurkowski chwali rzetelność oraz niezawodność maszyn i fachowców, którzy przyczynili się do powodzenia operacji. Firma Banpol SA zajmująca się oprogramowaniem i sprzętem do elektronicznego przetwarzania dokumentów była dostawcą skanerów i systemu symbolizacji, opracowała oprogramowanie skanowania, a także dobrze prowadziła obsługę serwisową tych urządzeń, zaś specjaliści z Centralnego Ośrodka Informatyki Statystycznej GUS przygotowali drugą część operacji.
Zanim Spis 2002 ruszył, przewidywano, że rejestracja i redagowanie danych potrwają nie dłużej niż sześć miesięcy i zakończą się w grudniu 2002 r. Dziś, kiedy GUS opublikował już wstępne wyniki Narodowego Spisu Powszechnego 2002, wiadomo, że niektóre województwa poradziły sobie z obróbką dokumentów nawet w pięć miesięcy.
Ostateczne pełne wyniki spisu będą sukcesywnie publikowane do końca drugiego kwartału 2003 r. – po zakończeniu procesu elektronicznego przetwarzania danych. Wszystkie podstawowe dane zostaną opublikowane w ciągu 12-18 miesięcy po zakończeniu spisu. Jednak najistotniejsze znaczenie w tej wielkiej operacji ma fakt, że w ostatnim roku przed akcesją do Unii Europejskiej otrzymamy „jeszcze ciepłe”, aktualne dane. Dzięki największemu przedsięwzięciu publicznemu w Europie poznamy dokładne i obiektywne saldo zmian w tym ważnym dla kraju momencie.

 

 

Wydanie: 2002, 50-51/2002

Kategorie: Kraj

Napisz komentarz

Odpowiedz na treść artykułu lub innych komentarzy