Mleczna Droga policzy wszystko

Mleczna Droga policzy wszystko

Chińczycy znów zaskoczyli świat. Tym razem budową najszybszego komputera na ziemi. Jak w tym wyścigu wygląda Polska?

Superkomputerom zawsze nadaje się jakieś dumne nazwy, np. Jaguar, Mgławica, Nieustraszony, Symulator Ziemi czy Kolos. Nie inaczej jest w wypadku chińskiego urządzenia, noszącego miano Tianhe, co znaczy Droga Mleczna. Choć dosłownie tłumaczy się to jako Niebiańską Rzekę, termin ten oznacza również naszą Galaktykę.
Droga Mleczna mieści się w Narodowym Centrum Superkomputerowym w mieście Tianjin. 12-milionowa metropolia bezpośrednio granicząca z Pekinem nie jest może aż tak znana jak stolica Państwa Środka czy Szanghaj, warto jednak zapamiętać tę nazwę. Jest to bowiem jedno z pięciu “narodowych miast centralnych”, namaszczonych przez rząd na wiodące ośrodki miejskie.
Tianhe nosi numer 1A i jest młodszą – i potężniejszą – siostrą Tianhe 1, ulokowanej w tym samym ośrodku, zajmującej siódme miejsce na liście najszybszych superkomputerów. Po aktualizacji listy starsza galaktyka spadnie pewnie na ósme miejsce. W ten sposób w pierwszej dziesiątce listy najszybszych komputerów, zwanej Top500, znajdą się trzy rodem z Chin.
Drogi Mleczne przeznaczono przede wszystkim do rozwiązywania problemów dotyczących poszukiwania ropy naftowej i projektowania samolotów, a także modelowania nowych konstrukcji w przemyśle motoryzacyjnym i stoczniowym. Sektor finansowy ma symulować na superkomputerach zachowanie rynków.
Niebiańska Rzeka kosztowała 88 mln dol., czyli mniej więcej 250 mln zł. W porównaniu z wielkimi inwestycjami infrastrukturalnymi, których dokonuje się także u nas, to niewiele. Gazoport kosztuje cztery razy więcej, podobnie kształtują się koszty oczyszczalni ścieków, nie wspominając o budowie autostrad czy modernizacji linii kolejowych. Czy zatem nie moglibyśmy się szarpnąć i zafundować sobie takiej zabawki? Czy polska nauka byłaby w stanie wykorzystać potencjał takiej maszyny i odniosłaby z niej konkretne korzyści?

Jest moc i co dalej

Choć ośrodków goszczących pod swoimi dachami superkomputery (zwane u nas KDM – Komputerami Dużej Mocy) mamy pięć, to zainstalowane w nich maszyny nie okupują najwyższych lokat na Top500. Stawkę otwiera superkomputer krakowskiego Akademickiego Centrum Komputerowego Cyfronet pod auspicjami Akademii Górniczo-Hutniczej (161. miejsce). Dalej jest sprzęt z Centrum Informatycznego Trójmiejskiej Akademickiej Sieci Komputerowej, w skrócie TASK, administrowanego przez Politechnikę Gdańską (181. miejsce). 245. pozycję zajmuje klaster Naszej Klasy, ale siłą rzeczy nie jest to sprzęt ogólnodostępny dla polskiej nauki. Na punktowanym miejscu jest jeszcze Poznańskie Centrum Superkomputerowo-Sieciowe (PCSS), zarządzane przez Instytut Chemii Bioorganicznej PAN (444. miejsce). Ostatnie dwa – w Interdyscyplinarnym Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego (ICM) oraz we Wrocławskim Centrum Sieciowo-Superkomputerowym – nie zmieściły się na liście, na której sytuacja zmienia się jak w kalejdoskopie.
Przypuśćmy więc, że rząd decyduje się wyasygnować dość znaczne środki na budowę naprawdę potężnej maszyny. Czy zrobilibyśmy z niej dobry użytek? – Apetyt rośnie w miarę jedzenia. Gdyby taka moc obliczeniowa się pojawiła, po paru miesiącach z pewnością zostałaby spożytkowana – mówi szef gdańskiego TASK, Mścisław Nakonieczny. – Jesteśmy w stanie zagospodarować dowolne moce obliczeniowe – zapewnia dyrektor krakowskiego Cyfronetu, Kazimierz Wiatr. – Taki sprzęt musi mieć jednak głębokie osadzenie w całej infrastrukturze środowiska, także osobowej, bo o wykorzystaniu naszych mocy obliczeniowych decydują użytkownicy, czyli naukowcy. Drugą nogą takiej inwestycji jest konieczność przyłączenia internetu szerokopasmowego, który w przypadku małej miejscowości oznacza przepustowość rzędu 1 Mbit/s, a w przypadku superkomputera 100 Gbit/s. Mówimy więc o internecie 100 tysięcy razy szybszym niż domowy.
Zakup superkomputera to również wydatki związane z adaptacją pomieszczeń. Jeden procesor wydziela mnóstwo ciepła (proszę przyłożyć dłoń do wylotu wentylacyjnego swojego komputera!), a ile muszą wydzielać tysiące! Pomieszczenia trzeba więc klimatyzować. Doprowadzone musi być też odpowiednie łącze energetyczne. Tianhe 1A potrzebuje do działania 4MW! Oprócz tego instalację należy zabezpieczyć na wypadek utraty zasilania; system baterii musi zapewnić prąd nie tylko komputerowi, lecz także układowi chłodzącemu.
Doliczmy do tego koszty bieżącego utrzymania takiej instalacji, a także wyszkolenia i uposażenia personelu. Choć tak naprawdę ten ostatni wydatek zwróci się wielokrotnie, stworzy się bowiem miejsca pracy w sektorze wysokich technologii, a każde takie miejsce pracy jest na wagę złota.
Dyrektor Nakonieczny wskazuje, że gdybyśmy faktycznie mieli zbudować taką instalację u siebie, oznaczałoby to potrzebę stworzenia jednego, narodowego centrum superkomputerowego. I choć rzecznik Ministerstwa Nauki i Szkolnictwa Wyższego zapewnia, że KDM są ministerialnym priorytetem, nie są nim chyba dla kolejnych ekip rządzących. Dlatego naukowcy robią, co mogą, w ramach ograniczonych budżetów.

Auto dla rajdowca

Może nie stać nas na wydanie od ręki 250 mln zł na sprzęt podobnej klasy co Droga Mleczna, stać nas jednak (z unijną pomocą) na wydanie 55 mln zł. Tyle wynosi budżet projektu o orzeźwiającej nazwie POWIEW (Program Obliczeń Wielkich Wyzwań Nauki i Techniki), w którym biorą udział ICM, Cyfronet i PCSS.
– Jest jedna rzecz, która wyróżnia ten program – mówi Maciej Cytowski z ICM. – Punktem wyjścia było sformułowanie listy problemów naukowych, które mają być rozwiązywane za pomocą tych superkomputerów. Ci, którzy chcą coś liczyć – np. meteorolodzy czy kosmolodzy – w ramach projektu razem z programistami pracują nad optymalizacją kodu dla ich aplikacji.
To, że jakiś superkomputer jest szybki w teorii, nie znaczy, że tak samo szybki będzie w praktyce. To jest trochę jak z samochodem. Porsche w rękach niedzielnego kierowcy jadącego na zakupy do marketu to zmarnowany potencjał. Za kierownicą trzeba posadzić rajdowca, który wyciśnie z auta siódme poty.
Podobnie rzecz ma się z oprogramowaniem uruchamianym na superkomputerach. Musi być doskonalone w procesie zwanym optymalizacją, tak aby jak najlepiej wykorzystać zasoby, które oferuje superkomputer. Zoptymalizowany program policzy, co mu każemy, w tydzień. Niezoptymalizowanemu zajmie to dwa tygodnie. Z niedzielnego kierowcy trzeba zrobić wojownika szos, który będzie wykręcał na torze jak najlepsze czasy.
Efekt takiego podejścia to nie jeden, lecz trzy superkomputery, o mocy 100 teraflopów każdy, oparte na trzech różnych architekturach, dopasowanych do potrzeb przyszłych użytkowników. Aby pociągnąć dalej motoryzacyjną metaforę – nie kupujemy superauta tylko po to, żeby potem szukać kierowców. Kupujemy takie samochody, jakich wymagają nasi kierowcy.
Kiedy program się zakończy w 2012 r., wzbogacimy się o maszyny, które dzisiaj plasowałyby się w okolicach 50. miejsca na Top500. I chociaż nie powinno się miejsc na tej liście fetyszyzować, dobrze wiedzieć, że do pierwszej setki wrócimy w pięknym stylu.

Jak po gridzie

Inną strategią jest połączenie superkomputerów siecią w jeden wielki metakomputer. Taki twór nazywa się gridem. – Intencja jest taka, że naukowiec wchodzi do gridu i nie wie, gdzie mu się liczy jego zadanie, ale ważne, że będzie liczone szybko – mówi dyrektor Wiatr. Dzisiaj my symulujemy Niemcom spalanie benzyny w silniku, jutro oni nam modelują syntezę białek. Wszystko dostępne z poziomu komputera podłączonego do internetu w dowolnym miejscu globu.
Krakowski Cyfronet zarządza polską częścią Europejskiej Inicjatywy Gridowej (EGI), skupiającej centra obliczeniowe z całej Europy (nie tylko z Unii). W sześcioosobowej radzie nadzorczej projektu zasiada przedstawiciel ośrodka, prof. Michał Turała. PL-GRID skupia wszystkie pięć krajowych KDM-ów.
Korzyści z takiego rozwiązania są oczywiste. Czego nie da się szybko policzyć przy wykorzystaniu wyłącznie polskich zasobów, będzie możliwe po ich uzupełnieniu o moce obliczeniowe z zagranicy. Tym bardziej że już w tej chwili pracują w Polsce zespoły, które walczą o granty finansujące czas obliczeniowy np. w Stanach Zjednoczonych. EGI zaoszczędzi im tego kłopotu. Zyskamy zresztą nie tylko my, ale także nasi europejscy partnerzy, którzy prowadzą eksperymenty wypluwające olbrzymie ilości danych do obróbki. Już teraz w ramach EGI małopolskie komputery przeliczają wyniki eksperymentów z CERN oraz rozproszonych radioteleskopów. Obliczenia te stanowią fragment wykorzystania naszych mocy obliczeniowych, przeznaczonych głównie dla polskich naukowców w kraju.
Zaletą superkomputerów jest także to, że mogą na siebie zarabiać. Udostępnienie czasu obliczeniowego klientom komercyjnym może nie sfinansuje w całości utrzymania takiej maszyny, ale stanowić będzie poważny zastrzyk finansowy dla przyszłych inwestycji. Zwłaszcza że nie każdą firmę stać na to, aby zafundować sobie centrum obliczeniowe. Mogą jednak zapłacić za czas obliczeniowy w jednym z centrów.
Niestety, ani w ICM, ani w TASK, ani w Cyfronecie nie pojawił się żaden polski klient pragnący coś policzyć. Dyrektor Nakonieczny wspomina jednak, że kiedyś składali wniosek o dofinansowanie ze środków unijnych projektu, w ramach którego TASK stanowiłby wsparcie obliczeniowe dla polskiej “Doliny lotniczej” liczącej 80 przedsiębiorstw i jednostek naukowych. Trudno chyba o prostszy, a przy tym bardziej kompleksowy przykład współdziałania nauki nie z pojedynczym podmiotem, ale sporą częścią polskiej branży lotniczej. – Projekt przepadł na etapie ministerialnym. Najpierw przypadł do gustu oceniającej go komisji, a potem został odrzucony przez zespół opiniujący w ministerstwie – mówi Nakonieczny.
Biorąc pod uwagę chroniczne niedofinansowanie polskiej nauki, obraz, jaki wyłania się ze świata superkomputerów, jest budujący. Mamy ludzi, mamy (lub będziemy mieli) niezły sprzęt (jak zaznaczył dyrektor Wiatr:
– Efektywny, nie efektowny). Na liście Top500, z nowo przyjętych do Unii krajów jest tylko Słowenia (201. lokata). Już w tej chwili dysponujemy sprzętem szybszym niż w niejednym zamożnym europejskim kraju, np. Austrii czy Norwegii. Tutaj nie można jednak spocząć na laurach – komputer biurkowy Anno Domini 2010 ma moc obliczeniową ostatniego na Top500 superkomputera A.D. 1995. Gdańska Galera po uruchomieniu w 2008 r. była 45. na liście. W ciągu dwóch lat spadła o 140 miejsc. Inwestycje nie mogą więc ustać.
Superkomputery (i ich wykorzystanie) są jak papierek lakmusowy. Jeśli się na nich non stop coś liczy, to znaczy, że są ludzie, którzy to potrafią. Jeśli liczą, to mają wyniki, które być może przełożą się na odkrycia, a te na patenty, wynalazki, usprawnienia czy nowe leki. To może w efekcie przełożyć się na gospodarkę żyjącą z zaawansowanych technologicznie produktów. Z powiewu wysokich technologii skorzystałaby cała Polska.

Wydanie: 46/2010

Kategorie: Nauka

Napisz komentarz

Odpowiedz na treść artykułu lub innych komentarzy