Dostałem zaproszenie z Powerset do ich właśnie co otwartego dla szerszej rzeszy Powerlabs. O samej firmie i ich pomyśle na 'nową technologię wyszukiwania' było głośno jakiś czas temu.
Opis
Daje linki do szotów w tekście , bo flickr brzydko zmienił rozmiary :].
Strona jest zrobiona super-hiper-web2.0 wygląda niemalże jak last.fm :> (Autorzy starają się stworzyć wokół tego community, punkty za komentarze/wkład). Dostępnych jest pięć 'dem'. 4 bazujące na wikipedii Cytaty, Biznes, Sztuka i przygotowany specjalnie Halloween. Pozwalają one wyszukiwać frazy w stylu: "Co ... powiedział ... ?" (cytaty), "Kogo zabił ... ?" (halloween). Dokładnie widać na skrinszotach, nie chce mi się przepisywać, leniwy jestem :>. No więc wpisałem 'Co powiedział Linus Torvalds o BSD' a drugie 'Who killed electric sheep?', muszę powiedzieć, że jestem średnio zadowolony z uzyskanych rezultatów.
Najważniejszym i najbardziej reklamowanym demem jest PowerMouse czyli owa rozreklamowana przeglądarka. Wyszukuje ona na zasadzie połączeń między obiektami. Na skrinszocie widać 3 okienka do wpisania (something connection something), na innym część wyników po wpisaniu boy, oraz po wybraniu konkretnego wyniku.
Jeszcze zanim zapomnę, Powerlabs, jako źródła danych używają wikipedii. (wyniki niektóre są dziwne :>
Krytyka
No więc byłbym zachwycony tym genialnym wynalazkiem. Byłbym. Na pierwszy rzut oka widać, że jeśli jest robiona jakaś analiza tekstów, to jest ona robiona słabo, a szczerze, to wygląda to tak jakby całość głównie się opierała o łapanie kontekstu. Z NLP ma to niewiele wspólnego.
Druga rzecz, tak się nieszczęśliwie składa, że pisałem tekst na temat projektu Microsoftu automatycznego tworzenia bazy semantycznej. Zainteresowanych odsyłam tutaj a wszystkim polecam zebrane tam Przykłady.
Czym się różni projekt Microsoftu od powerset? Otóż Microsoft zatrudnił naukowców, którzy samym tematem zajmują się od kilkudziesięciu lat (chcąc nie chcąc kilka prac musiałem przeczytać), a nad Mindnetem pracują ponad 10 lat. Baza zarówno demonstracyjna jak i ta na której rzeczywiście pracują w MS oparta jest o kilka (czy może nawet kilkanaście) słowników. Mindnet czy też mnex nie jest nastawiony na szybkie wskocznie na rynek z superową web2.0 stroną ;) a tym bardziej na tworzenie wokół tego community.
Dalszy komentarz chyba zbędny ;)
gim.org.pl is down






