-
Path: news-archive.icm.edu.pl!news.gazeta.pl!newsfeed.pionier.net.pl!newsfeed.straub-
nv.de!proxad.net!feeder1-2.proxad.net!74.125.46.134.MISMATCH!postnews.google.co
m!q22g2000yqm.googlegroups.com!not-for-mail
From: Mariusz Marszałkowski <m...@g...com>
Newsgroups: pl.comp.programming
Subject: Re: Wykrywanie sensu (:)
Date: Thu, 12 Aug 2010 06:13:49 -0700 (PDT)
Organization: http://groups.google.com
Lines: 28
Message-ID: <f...@q...googlegroups.com>
References: <i40dt9$ski$1@news.onet.pl>
<2...@p...googlegroups.com>
<i40pvl$u31$1@news.onet.pl>
NNTP-Posting-Host: 89.229.34.123
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: quoted-printable
X-Trace: posting.google.com 1281618830 31437 127.0.0.1 (12 Aug 2010 13:13:50 GMT)
X-Complaints-To: g...@g...com
NNTP-Posting-Date: Thu, 12 Aug 2010 13:13:50 +0000 (UTC)
Complaints-To: g...@g...com
Injection-Info: q22g2000yqm.googlegroups.com; posting-host=89.229.34.123;
posting-account=xjvq9QoAAAATMPC2X3btlHd_LkaJo_rj
User-Agent: G2/1.0
X-HTTP-UserAgent: Mozilla/5.0 (Windows; U; Windows NT 5.1; pl; rv:1.9.2.8)
Gecko/20100722 Firefox/3.6.8,gzip(gfe)
Xref: news-archive.icm.edu.pl pl.comp.programming:186467
[ ukryj nagłówki ]On 12 Sie, 14:38, MoonWolf <m...@p...com> wrote:
> Mariusz Marszałkowski denied rebel lies:
>
> > Jeśli zupełnie przypadkowy ciąg znaków chcesz odróżnić od zdania
> > w j. polskim, to bardzo proste. Jeśli chcesz żeby program powiedział,
> > czy przeciętny kowalski to zdanie zrozumie, to bardzo trudne.
>
> 'Sens' tak bardziej w cudzysłowie. Nie mam zamiaru porywać się na
> ustalanie kto to jest 'przeciętny Kowalski'. A mógłbyś nakierować za
> czym guglać
Zacząłbym od słownika j. polskiego, sprawdziłbym siłowo czy słowa
są w słowniku. Potem robią się schody. Może bym wczytał teksty
z Internetu i sprawdził jaka jest częstość słów w przeciętnych
tekstach.
Potrzeba duuuużo danych do takiej zabawy. Później sprawdziłbym jakie
jest prawdopodobieństwo że słowo aaa pojawia się po lub przed słowem
bbb
w odstępie 1,2,3..N słów.
Pozdrawiam
Następne wpisy z tego wątku
- 12.08.10 14:28 Mariusz Kruk
- 12.08.10 14:46 Mariusz Marszałkowski
- 12.08.10 16:04 MoonWolf
- 12.08.10 17:05 Mariusz Kruk
- 12.08.10 17:33 slawek
- 12.08.10 17:42 slawek
- 12.08.10 18:33 Marcin Kral
- 12.08.10 19:30 Mariusz Marszałkowski
- 12.08.10 20:11 Piotr M Kuć
- 12.08.10 21:13 Maciej Sobczak
- 12.08.10 21:32 Segmentation Fault
- 12.08.10 21:37 Segmentation Fault
- 12.08.10 23:11 Daniel Janus
- 13.08.10 06:53 slawek
- 13.08.10 07:17 Mariusz Kruk
Najnowsze wątki z tej grupy
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
Najnowsze wątki
- 2025-08-06 Gdynia => Konsultant wdrożeniowy (systemy controlingowe) <=
- 2025-08-06 Białystok => Inżynier oprogramowania .Net <=
- 2025-08-06 "[...] sejmowe wystąpienie posłanki Klaudii Jachiry, która zakończyła je słowami ,,Sława Ukrainie"."
- 2025-08-05 "Chiny przekraczają w wydobyciu 4 mld ton węgla, Indie i USA ponad 1 mld, a Rosja 500 mln ton [...]"
- 2025-08-05 Panuje się 181 159,42 zł./mies. na posła w 2026r.
- 2025-08-05 "Chiny przekraczają w wydobyciu 4 mld ton węgla, Indie i USA ponad 1 mld, a Rosja 500 mln ton [...]"
- 2025-08-05 Czy cos fi przechodzi przez trafo separujące?
- 2025-08-05 kajaki i promile
- 2025-08-05 Re: Tesla jest bezpieczna, wczoraj spaliła się doszczętnie na Ursynowie i nikomu się nic nie stało
- 2025-08-05 Gdynia => Przedstawiciel handlowy / KAM (branża TSL) <=
- 2025-08-05 Re: Atak na lekarza w Oławie. Policja zatrzymała sprawcę na lotnisku Polska Agencja Prasowa 4 sierpnia 2025, 12:16 FACEBOOK X E-MAIL KOPIUJ LINK W szpitalu w Oławie 37-letni pacjent zaatakował lekarza, po tym, jak ten odmówił mu wypisania długoterminowego
- 2025-08-05 B2B i książka przychodów i rozchodów
- 2025-08-04 Re: Atak na lekarza w Oławie. Policja zatrzymała sprawcę na lotnisku Polska Agencja Prasowa 4 sierpnia 2025, 12:16 FACEBOOK X E-MAIL KOPIUJ LINK W szpitalu w Oławie 37-letni pacjent zaatakował lekarza, po tym, jak ten odmówił mu wypisania długoterminowego
- 2025-08-04 Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- 2025-08-04 Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML