NeuroScope

NeuroScope to system służący do indeksowania dokumentów i wyszukiwania zawartych w nich informacji. Mówiąc prościej NeuroScope jest wyszukiwarką podobną na przykład do Google, ale działającą na konkretnym, wybranym przez użytkownika zbiorze danych. Takie narzędzie przydatne jest dla każdego, kto chce umożliwić wyszukiwanie informacji w swoim prywatnym zbiorze dokumentów, ale bez udostępniania go zewnętrznym mechanizmom indeksującym.

 

Precyzja wyszukiwania

NeuroScope wyróżnia się bardzo wysoką trafnością (jakością) wyszukiwania pełnotekstowego. Umożliwia wyszukiwanie informacji na podstawie słów i zwrotów (wyszukiwanie leksykalne) oraz na podstawie pełnej frazy (wyszukiwanie pełnotekstowe). Używając technologii lingwistycznych system potrafi odnaleźć informację bez względu na formy gramatyczne wyszukiwanych słów, pominąć wśród nich słowa nieistotne dla języka polskiego (np. spójniki) oraz rozwinąć skróty.

W systemie NeuroScope sposób oceny znalezionych wyników, czyli jakość dopasowania każdego wyniku do zadanego zapytania, jest konfigurowalny. Użytkownik ma możliwość określić które dokumenty bądź ich części są dla niego ważniejsze np. tytuł bądź abstrakt. Dzięki temu po zadaniu pytania najwyżej na liście odpowiedzi pojawią się oczekiwane przez niego wyniki. Dodatkowo system NeuroScope umożliwia pokazywanie tzw. strzępków, czyli automatycznie wygenerowanych fragmentów dokumentów zawierających wyszukiwany tekst. Pełnią one funkcję streszczeń i pozwalają użytkownikowi ocenić czy chodziło mu o dany dokument, bez obowiązku czytania całej treści.

Przechowywanie danych

NeuroScope nie używa zewnętrznych baz danych, przechowuje informacje we własnych indeksach. Indeks jest czymś podobnym do bazy danych, ma określoną strukturę, która definiuje format znajdujących się w nim dokumentów. Analogicznie jak w bazach danych, w systemie NeuroScope możemy mieć wiele indeksów o różnej strukturze i w każdym przechowywać odpowiednie rodzaje dokumentów. NeuroScope umożliwia bardzo elastyczne określenie struktury dokumentów w indeksie za pomocą cech opcjonalnych (ang. traits) kilku typów (np. text, number, boolean). Dodatkowo dla cech typu tekstowego specjalny zestaw flag umożliwia użytkownikowi zdecydowanie, które funkcjonalności mają być dostępne dla danego pola (np. dzielenie na zdania, wyszukiwanie pełnotekstowe).

Dodatkowe moduły

NeuroScope posiada moduł Correct do korygowania błędów w zapytaniach użytkownika,oraz moduł Suggest do generowania listy podpowiedzi.

NeuroScope serwer

System NeuroScope posiada architekturę klient–serwer. Serwer jest jądrem całego systemu. To on odpowiedzialny jest za indeksowanie oraz wyszukiwanie w treści zindeksowanych dokumentów. Jeden serwer może obsługiwać naraz wiele indeksów, natomiast do każdego z nich możliwe jest wysyłanie jednoczesnych zapytań z wielu klientów.

Serwer NeuroScope do komunikacji z użytkownikiem używa protokołu XML-RPC, zatem możliwe jest napisanie klienta praktycznie w każdym popularnym języku programowania oraz zintegrowanie go z niemal każdym systemem, w którym potrzebna jest funkcja wyszukiwania informacji tekstowych.

NeuroScope zoptymalizowany został zarówno pod kątem prędkości działania jak i zajętości pamięci. System indeksuje bez problemu do 4 GB tekstu i w mniej niż pół sekundy odpowiada na większość pełnotekstowych zapytań. W celu zmniejszenia zajętości pamięci dane językowe trzymane są tylko raz w pamięci współdzielonej przez różne indeksy.

Chcę wiedzieć więcej

Zostaw swój adres e-mail, wyślemy Ci szczegółowe informcje na temat systemu i oferty produktowej.

Pokrewne produkty

NeuroBiz

Portal zawierający dane na temat podmiotów gospodarczych funkcjonujących na polskim rynku, zaczerpnięte z dzienników urzędowych: Monitora Sądowego i Gospodarczego, Monitora Polskiego B oraz Monitora Spółdzielczego B, a w przyszłości także z innych źródeł.

Zobacz