Wielkie skanowanie

Wielkie skanowanie

Życie po spisie – skończyli rachmistrze, zaczęły komputery

Narodowy Spis Powszechny to wielkie przedsięwzięcie informatyczne, skalą dorównujące informatyzacji ZUS. O ile jednak sprawa ZUS-u nie może się zakończyć już od dobrych kilku lat, to przy spisie o żadnych wpadkach nie może być mowy.
Wielka sala na parterze warszawskiego oddziału Urzędu Statystycznego przy ulicy 1. Sierpnia bardziej przypomina centrum dowodzenia NASA niż sale, w których sporządza się tabele z danymi. Na biurkach stoją w kilku rzędach monitory i komputery, tuż obok w szklanym akwarium znajdują się serwery sterujące całym systemem. Drzwi do pomieszczeń, w których znajdują się dokumenty spisowe, pilnują zamki szyfrowe. Na razie panuje tu cisza, jednak ten spokój jest pozorny. Od początku lipca magazyny po drugiej stronie korytarza wypełniają, paczka po paczce, pudła z wypisanymi formularzami przez rachmistrzów spisowych. Właśnie zaczyna się selekcja. Siedem rodzajów formularzy zostanie posegregowanych według ich typów: rolne do rolnych, migracyjne do migracyjnych, dzietności do dzietności. – Potem odbędzie się „darcie pierza”. Tak nazywamy oddzieranie perforacji od formularzy spisowych – zdradza Konrad Potyra, dyrektor urzędu.
Takich miejsc w całej Polsce, w których papierowe formularze zamieniają się już w elektroniczne pliki, jest 18 – po jednym w każdym mieście wojewódzkim, jedynie w Warszawie i Katowicach są po dwie lokalizacje.

300 mln kartek do zeskanowania

Spis powszechny to chyba największa operacja logistyczna III RP. Bierze w niej udział rekordowa liczba 900 komputerów, kilkudziesięciu serwerów oraz ponad 30 superskanerów zdolnych skanować ponad 100 kartek na minutę.
Choć 180 tys. rachmistrzów spisowych zakończyło swoją pracę i wróciło do domów, rozpoczął się najtrudniejszy etap spisu. Wypełnione przez nich formularze trafiły do gmin, które przekazały je do oddziałów urzędów statystycznych. Do ich przewiezienia wykorzystano 70 tirów. Do urzędów statystycznych spłynęło 40 mln formularzy osobowych, ponad 6 mln migracyjnych, 13 mln mieszkaniowych, 300 tys. dzietności oraz ponad trzy miliony rolnych. W efekcie daje to ponad 300 mln kartek. Teraz trafiają do skanerów. To pierwszy etap operacji.

Tysiące znaków, setki wyrazów

Następny krok to przetworzenie zeskanowanych wcześniej obrazów „ręcznego pisma” w elektroniczne pliki. W jaki sposób? Programy do odszyfrowywania ręcznego pisma i przypisywania im matematycznych symboli, używanych w języku informatycznym już istnieją. Wystarczyło tylko dopasować do potrzeb polskiej pisowni system już istniejący. Jaki? Informatycy z Banpolu, firmy, która opracowała, dostarczyła oprogramowanie i skanery dla GUS-u, przetestowali systemy rozpoznawania pisma ręcznego kilku firm europejskich.
Okazało się, że najbardziej podobny charakter pisma ręcznego do pisma Polaków mają Niemcy. Wystarczyło więc wzbogacić system niemiecki o polskie znaki. System rozpoznawania pisma zdał już egzamin. Podczas spisu próbnego w 2000 r. w rolę rachmistrzów wcielili się pracownicy GUS-u. Zadanie mieli proste: pisać bardzo nieczytelnie po to, by znaleźć słabe strony oprogramowania. Bezskutecznie.

System sam zasiewa błędy

Banpol tworzy podobne systemy od kilku lat. – Już na etapie oferty mieliśmy wyobrażenie, jak to powinno wyglądać. – Nad dopracowaniem systemu od listopada ubiegłego roku dzień w dzień pracowało kilkadziesiąt osób – opowiada Mariusz Walicki, szef projektu w Banpolu. – Przydało się doświadczenie, jakie zdobyliśmy np. w BRE Banku, Krajowej Izbie Rozliczeniowej, Telekomunikacji Polskiej i w wielu innych firmach. Staraliśmy się wyeliminować możliwość jakiejkolwiek pomyłki i wiemy, jak to robić. W systemach dla banków nie ma prawa wystąpić ani jeden błąd.
Mechanizm obróbki danych zaprojektowano więc tak, by maszyny eliminowały pomyłki ludzi: najpierw rachmistrze wypełniają formularze, te trafiają do gminnych sztabów, a stamtąd do jednego z wojewódzkich centrów przetwarzania danych. Tu formularze są skanowane. Wyskanowane pismo potem musi być rozpoznane przez komputery. Dalej te dane trafiają do centralnej bazy danych. Na tym etapie może być jeszcze niewielki procent błędów.
Dlatego kolejny etap to korekta. W oddziałach GUS przed dziewięcioma setkami komputerów zasiadło 1800 osób, które ręcznie będą poprawiały błędy (już przez Banpol przeszkoleni). Będą pracować na dwie zmiany. Po korekcie poprawionym danym nadawane są symbole liczbowe np. hasło rolnik otrzymuje symbol 011. Po kolejnych weryfikacjach wkracza GUS, który zebrane dane może analizować.
Ale przecież błędy mogą popełnić także korektorzy. I na to znaleziono radę. Program komputerowy sam je zasiewa po to, by sprawdzić skuteczność korekty. Jeśli nie zostaną poprawione, pomyłki usunie system. Jednak wtedy niesumienny korektor może stracić pracę.

Napięte terminy

Przetworzenie papierowych danych w elektroniczne pliki, na których pracować będą statystycy GUS, potrwa pół roku. Przy tej operacji pracować będzie 2,5 tys. osób. Porównać ją można jedynie do informatyzacji ZUS, która zaczęła się pięć lat temu i trwa do dziś. Spis tyle trwać nie może. Dane muszą zostać przetworzone najpóźniej do końca grudnia, tak, aby wyniki były gotowe w połowie przyszłego roku.
System został zaprojektowany tak, aby żadne dane nie wypłynęły w niepowołane ręce. – Pudełka z formularzami zostały złożone w specjalnych pomieszczeniach w urzędach statystycznych, do których dostępu przed niepowołanymi osobami bronią m.in. zamki szyfrowe i czytniki kart. Także budowa systemu minimalizuje skutki ataku hakerów. Dane umieszczone są na wydzielonych i pilnie strzeżonych stronach i nie zawierają nazwisk i adresów. Ponadto w każdym z punktów, w których są przetwarzane, nad bezpieczeństwem czuwają przeszkoleni administratorzy – mówi Krzysztof Kurkowski, p.o. dyrektora departamentu infrastruktury w GUS.
Co stanie się ze sprzętem, który pozostanie po spisie? – Nie zmarnuje się – zapewnia Krzysztof Kurkowski. – Maszyny zostaną wykorzystane w GUS. Spis to szansa na odnowienie sprzętu komputerowego. Czy na kolejną taką okazję trzeba będzie czekać do następnego spisu?

 

Wydanie: 30/2002

Kategorie: Kraj

Napisz komentarz

Odpowiedz na treść artykułu lub innych komentarzy