Odnaleźć e-igłę w stogu e-siana

Odnaleźć e-igłę w stogu e-siana

Jesteśmy zasypywani gradem informacji, a potrzebujemy tylko tej jednej Według Massachusetts Institute of Technology (MIT) Real-Time Search to jedna z 10 technologii, które mają przed sobą świetlaną przyszłość. Nic dziwnego. Wszak nie ma sensu gromadzenie gigabajtów danych w różnorodnej formie, jeżeli nie można znaleźć na czas tego, co jest właśnie potrzebne! Zupełnie niedawno MIT opublikował serię artykułów na temat owych 10 technologii, które mają przed sobą najbardziej obiecującą przyszłość. Jak zwykle w tego typu zestawieniach więcej jest fiction niż science, jednak moją uwagę zwróciło wymienienie w tym ekskluzywnym gronie czegoś, co nazywa się Real-Time Search, czyli wyszukiwanie danych w czasie rzeczywistym. Potraktuję to zatem jako pretekst do bliższego przyjrzenia się temu, co tak naprawdę kryje się za tą nazwą, oraz do przybliżenia najnowszych trendów w dziedzinie wyszukiwania informacji. INFORMACYJNE GRADOBICIE Opisywane przez MIT wyszukiwanie w czasie rzeczywistym odnosi się do rodzącej się technologii, która stara się odpowiedzieć na coraz silniejszą potrzebę analizowania najświeższych informacji pojawiających się w różnego rodzaju serwisach społecznościowych. W skrócie chodzi o to, by zwłaszcza młodzi ludzie, którzy bez internetu i jego dobrodziejstw nie wyobrażają sobie życia, mieli możliwość śledzenia na bieżąco tego, co robią, myślą, czują ich mniej lub bardziej wirtualni przyjaciele. Problem polega na tym, że zasypywani jesteśmy gradem informacji: kanały RSS wypluwają krocie wiadomości, mikroblogi (Twitter, Blip) pękają od wpisów, Nasza Klasa ciągle wprowadza nowości i bombarduje użytkowników e-mailami, że już dwa dni nie odwiedzali serwisu, na LinkedIn czy Golden Line widać, kto i kiedy zmienił pracę, a jest tego wszystkiego coraz więcej. Potrzeba zatem silnego narzędzia, które będzie w stanie nad tym zapanować. Nic w tej materii nie liczy się bardziej niż świeżość pozyskiwanych i wyszukiwanych informacji, nie jest nam bowiem potrzebna wyszukiwarka, która dopiero jutro po południu będzie w stanie dostarczyć nam informacji, że któryś z naszych znajomych dziś wieczorem się nudzi… CRAWLOWANIE NIE WYSTARCZY Można jednak wyobrazić sobie bardziej poważne zastosowania. Okazuje się bowiem, że morze tych wszystkich statusów, tweetów itp. jest całkiem ciekawym źródłem informacji o świecie i ludziach, które można wykorzystać na wiele różnych sposobów. Liderem innowacji w tej dziedzinie jest oczywiście Google, który pracuje nad technologią wyszukiwania w czasie rzeczywistym, tak by można było odnaleźć każdy wpis w serwisach społecznościowych od razu w jednej wyszukiwarce. Nad tym tematem pracuje także Microsoft i kilka mniejszych firm. Choć z pozoru może to wyglądać podobnie jak przeszukiwanie internetu, to nowe rozwiązanie znacząco się różni. Podstawowym wyzwaniem jest tutaj umożliwienie natychmiastowego zaindeksowania pojawiających się nieustannie nowych informacji. Tradycyjne tzw. crawlowanie stron internetowych tutaj się nie sprawdzi. To same serwisy muszą zasilać w dane dostawców wyszukiwania, jeżeli chcą w ten sposób zachęcić użytkowników do powrotu na ich strony. Poza tym ważnym czynnikiem porządkującym wyniki wyszukiwania – oprócz wspomnianej i najważniejszej świeżości informacji – jest częstotliwość cytowania danego wpisu oraz ustalenie, skąd dana wypowiedź pochodzi. Bo jeżeli ktoś pisze, że ziemia się trzęsie, a on sam znajduje się blisko epicentrum trzęsienia ziemi, to jest to znacznie cenniejsza informacja od tej napisanej 1200 km od danego miejsca. Okazuje się, że można to sprawdzać. SIŁA SENSU I ZNACZENIA Moim zdaniem najbardziej obiecującą technologią związaną z wyszukiwaniem jest jednak tzw. wyszukiwanie semantyczne, które najogólniej można opisać jako odnajdywanie w danych sensu i znaczenia, o które nam chodziło. Nasz umysł działa w ściśle określony sposób. Operujemy pojęciami, które opisują nasz świat, zachodzące w nim zjawiska czy nasze emocje. To, co myślimy, ubieramy w słowa i zapisujemy w formie tekstu. Proces ten nazywa się potocznie pisaniem. Jest też proces odwrotny do niego, czyli czytanie. Polega on na łączeniu liter w wyrazy i wyrażenia oraz nadawaniu temu wszystkiemu znaczenia. Potem cała ta informacja jest asymilowana i klasyfikowana i jesteśmy w stanie odpowiedzieć na pytanie, o czym jest ten tekst. Przytaczam tutaj ten krótki opis, ponieważ jest to podstawa teorii MTT, która z angielska zwie się Meaning-Text Theory. Zakłada ona istnienie

Ten artykuł przeczytasz do końca tylko z aktywną subskrypcją cyfrową.
Aby uzyskać dostęp, należy zakupić jeden z dostępnych pakietów:
Dostęp na 1 miesiąc do archiwum Przeglądu lub Dostęp na 12 miesięcy do archiwum Przeglądu
Porównaj dostępne pakiety
Wydanie: 2010, 26/2010

Kategorie: Nauka