-
Path: news-archive.icm.edu.pl!news.icm.edu.pl!news.nask.pl!news.nask.org.pl!news.inte
rnetia.pl!not-for-mail
From: Szyk <s...@o...pl>
Newsgroups: pl.comp.programming,pl.comp.lang.c
Subject: darmowy silnik wyszukiwarki
Date: Mon, 02 Jan 2012 19:20:21 +0100
Organization: Netia S.A.
Lines: 18
Message-ID: <jdssgg$fgl$1@mx1.internetia.pl>
NNTP-Posting-Host: 83-238-151-66.ip.netia.com.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8; format=flowed
Content-Transfer-Encoding: 8bit
X-Trace: mx1.internetia.pl 1325528400 15893 83.238.151.66 (2 Jan 2012 18:20:00 GMT)
X-Complaints-To: a...@i...pl
NNTP-Posting-Date: Mon, 2 Jan 2012 18:20:00 +0000 (UTC)
X-Tech-Contact: u...@i...pl
User-Agent: Mozilla/5.0 (Windows NT 6.1; rv:8.0) Gecko/20111105 Thunderbird/8.0
X-Server-Info: http://www.internetia.pl/
Xref: news-archive.icm.edu.pl pl.comp.programming:194593 pl.comp.lang.c:297504
[ ukryj nagłówki ]Witam
Mam plik XML ponad 20GB. Z tego pliku sobie wyciągam kawałki tekstu. Te
kawałki chcę sobie zindeksować, tak bym mógł określić częstość
występowania poszczególnych wyrazów i fraz (sekwencji kilku wyrazów -
kolejność wyrazów ma znacznie). Indeks wyszukiwarki chcę zrobić na
własny użytek. Indeks nie musi być super szybki ale musi odpowiadać w
jakimś rozsądnym czasie (do 10s).
Domyślam się, że istnieją jakieś darmowe silniki wyszukiwania (raczej
tylko w C/C++) jakie mogłyby sprostać temu zadaniu. Myślę też że problem
nie jest zbyt specyficzny by nie spytać się na grupach dyskusyjnych. Więc:
Jakie silniki wyszukiwania byście polecili do realizacji tego zadania.
dzięki i pozdrawiam
Szyk
Następne wpisy z tego wątku
- 09.01.12 14:22 MarlonB
- 09.01.12 16:07 Adam Przybyla
Najnowsze wątki z tej grupy
- Xiaomi [Chiny - przyp. JMJ] produkuje w całkowitych ciemnościach i bez ludzi
- Prezydent SZAP/USONA Trump ułaskawił prezydenta Hondurasu Hernandeza skazanego na 45 lat więzienia
- Rosjanie chwalą się prototypem komputera kwantowego. "Najważniejszy projekt naukowy Rosji"
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
Najnowsze wątki
- 2026-01-23 Stop na zielonym
- 2026-01-23 KSEFowy trolling
- 2026-01-23 KSEFowy trolling
- 2026-01-23 Warszawa => Software Development Team Leader (C#/.Net) <=
- 2026-01-23 Toruń => Sales Engineer (Database background) <=
- 2026-01-23 Toruń => Preseles Inżynier (background baz danych) <=
- 2026-01-23 antena gsm - kabel - antena gsm
- 2026-01-22 Złomnik ty pisowska SZMATO! ;-)
- 2026-01-22 PID - jeszcze raz
- 2026-01-22 konkret24.tvn24.pl "gwarantuje": za SAMO wylanie gnojówki pod domem tusk-ministra aresztu nie będzie! ;-)
- 2026-01-22 Prawo na wesoło: nakaz rozbiórki "dwóch przyczep samochodowych" jako budynku ;-)
- 2026-01-22 Airtagi
- 2026-01-22 Warszawa => Full Stack Developer (Go/React) <=
- 2026-01-22 Warszawa => Senior Account Manager <=
- 2026-01-21 Nissan Leaf II 40kWh - degradacja baterii, SOH, uszkodzona bateria




Ceny mieszkań zaskoczyły nawet ekspertów. Chodzi o taktykę deweloperów