eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programminginteligentne wyszukiwanie › Re: inteligentne wyszukiwanie
  • Data: 2010-09-11 14:12:00
    Temat: Re: inteligentne wyszukiwanie
    Od: qertoip <q...@g...com> szukaj wiadomości tego autora
    [ pokaż wszystkie nagłówki ]

    On Sep 4, 8:16 pm, Mariusz Marszałkowski <m...@g...com> wrote:
    > Jest bardzo dużo plików tekstowych na dysku. Pliki trzeba
    > jakoś sprytnie zaindeksować, tak, aby później było możliwe
    > szybkie wyszukanie wszystkich plików które zawierają
    > jakąś frazę, albo nawet wzorzec, typu program*anie.
    > Idealnie byłoby jakby jeszcze był jakiś ranking, np.
    > tym większa liczba im strona lepiej pasuje do wzorca.

    Sphinx jest bardzo szybki i niezawodny. Domyślnie działa nad bazą
    danych, ale można go też nakarmić samemu (np. via XML). Pozostaje więc
    rekurencyjny odczyt plików tekstowych w zadanym katalogu. To jest
    łatwe zadanie niezależnie od języka. Drobnym problemem może być
    jeszcze niezawodne rozróżnienie plików tekstowych od binarnych. Jeśli
    platforma Javy, to polecam do tego bibliotekę istext.jar (GitHub).

    --
    http://qertoip.typepad.com - programista kontra rzeczywistość czyli
    blog zawodowego swetra

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: