Technologie wyszukiwania pełnotekstowego

LICZBA DNI: 3 (24h)

KOD KURSU: FULLTEXT

# solr

# lucene

# elasticsearch

# hibernate-search

# sphinx-search

Szkolenie na zamówienie

Szkolenie dostosowane do potrzeb Twojego zespołu. Dostępne WYŁĄCZNIE na zamówienie.

  • Dostosowany program
  • Indywidualna wycena
  • Dowolny termin

Interesuje Cię ta tematyka i szukasz szkolenia tylko dla siebie?

O szkoleniu

DLA KOGO?

Szkolenie adresowane jest do osób zainteresowanych funkcjonalnością wyszukiwania pełnotekstowego i różnych spoosbów jej wykorzystania.

WYMAGANIA

Od uczestników wymagana jest podstawowa umiejętność znajomość baz danych i języka SQL oraz programowania w języku Java.

ZALETY

Program obejmuje całościowo i wyczerpująco zagadnienia związane z wyszukiwaniem pełnotekstowym, przedstawia wiele ciekawych aspektów, typowe problemy oraz najlepsze praktyki.

W przeciwieństwie do większości tego typu szkoleń, zawiera ono część warsztatową, która pozwoli na ugruntowanie wiedzy również w praktycznym jej aspekcie.

Cele szkolenia

Poznanie czym jest wyszukiwanie pełnotekstowe, zagadnienia z nim związane, jakie są możliwości jego realizacji oraz najlepsze praktyki.

Poznanie szerokiej gamy produktów realizujących tą funkcjonalność uwzględniając rozwiązania zarówno bazodanowe jak i dedykowane biblioteki programistyczne, w szczególności te wiodące na rynku jak Apache Lucene, Apache Solr, Sphinx Search czy Hibernate Search.

Nauka zaprojektowania oraz oprogramowania systemu dostarczającego funkcjonalność wyszukiwania pełnotekstowego.

Omówienie tematu w bardzo szerokim aspekcie tak, aby uczestnik był przygotowany do realizacji tego zadania tak, aby spełniło ono wszystkie wymagania oraz potrafił wybrać rozwiązanie najlepsze w danej sytuacji.

Program

  • Idea wyszukiwania pełnotekstowego (full-text search, FTS)
  • Gdzie przydatne jest wyszukiwanie pełnotekstowe?
    • Strony WWW
    • Aplikacje webowe
    • Bazy danych
    • Poczta e-mail
  • Użycie LIKE
  • Realizacja
    • Stop-słowa
    • Lematyzacja
    • Stemming
    • Morfologia języków
    • Indeksy TF-IDF
    • Ocena dopasowania szukanego tekstu do tekstu znalezionego
    • Wyszukiwanie aproksymacyjne
    • Indeksy w bazie danych
      • Konfiguracja indeksów w bazie danych
      • Miejsce przetrzymywania indeksów
      • Wydajne indeksowanie
      • Utrzymywanie indeksów
      • Transakcyjność
  • Architektura separacji odpowiedzialności komend i zapytań (Command Query Responsibility Separation - CQRS)
  • Rozproszenie wyszukiwania
  • Przeszukiwanie pełnotekstowe w plikach różnego formatu (PDF, XML, MS Office, ...)
  • Skalowalność
  • Opensource'owe bazy danych
    • MySQL
      • Możliwosci Fulltext
      • Realizacja
    • PostgreSQL
      • Możliwości
      • Realizacja
  • Komercyjne bazy danych
    • MS SQL Server
      • Możliwości
      • Realizacja
      • Dostępność w produktach Microsoft Exchange i Microsoft SharePoint
      • Zalety i wady
    • Oracle
      • Możliwości Oracle Text
      • Realizacja
    • IBM DB2
  • NoSQL
  • Apache Lucene
    • Możliwości
    • Realizacja
      • Indeksowanie
      • Wyszukiwanie
      • Narzędzie do inspekcji indeksów - Luke
  • Apache Solr
    • Relacja z Apache Lucene
    • Możliwości
    • Przykłady wdrożeń
    • Konfiguracja (Schema.xml, Solrconfig.xml)
    • Realizacja
      • Architektura
      • Dokumenty
      • Indexy
      • Pola dynamiczne
      • Pluginy
      • Faceted search
  • Sphinx Search
    • Możliwości
    • Realizacja
      • SphinxAPI, SphinxQL
      • Główne moduły
      • Konfiguracja – plik sphinx.conf
      • Budowanie indexów
      • Zapytania
  • Hibernate Search
    • Możliwości
    • Realizacja
      • Integracja z Apache Lucene
      • Konfiguracja: hiberante.cfg.xml i hibernate.properties, API do konfiguracji
      • Architektura
      • Adnotacje Hibernate Search: Indexed, Analyzer, ClassBridge, DocumentId
      • Mapowanie encji
      • Hibernate Analyzer
      • Typy zapytań: TermQuery, WildcardQuery, PrefixQuery, PhraseQuery i inne
      • API do wyszukiwania: Query, QueryBuilder i inne
      • Strategie przebudowywania indeksu
  • Inne
    • Solandra
    • Elasticsearch
    • DataparkSearch
    • Ferret
    • mnoGoSearch
    • Xapian
    • Google Custom Search Index

POLITYKA COOKIES:

Korzystamy z plików cookies, by móc jak najlepiej dostosować stronę do Twoich potrzeb oraz wyświetlać Ci przydatne i adekwatnych dla Ciebie reklamy w serwisie i poza nim. Możesz kontrolować ustawienia ciasteczek w swoich ustawieniach swojej przeglądarki. Odwiedzając tę stronę, wyrażasz zgodę na wykorzystywanie przez nas plików cookies.