-
Path: news-archive.icm.edu.pl!news.icm.edu.pl!polsl.pl!not-for-mail
From: Adam Przybyla <a...@r...pl>
Newsgroups: pl.comp.programming
Subject: Re: Wykrywanie sensu (:)
Date: Fri, 13 Aug 2010 08:46:56 +0000 (UTC)
Organization: Politechnika Slaska, Gliwice
Lines: 17
Sender: Adam Przybyla <a...@s...ertel.com.pl>
Message-ID: <i430q0$1nr$1@polsl.pl>
References: <i40dt9$ski$1@news.onet.pl>
NNTP-Posting-Host: smtp.ertel.com.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
X-Trace: polsl.pl 1281689216 1787 62.182.231.178 (13 Aug 2010 08:46:56 GMT)
X-Complaints-To: n...@p...pl
NNTP-Posting-Date: Fri, 13 Aug 2010 08:46:56 +0000 (UTC)
User-Agent: tin/1.8.3-20070201 ("Scotasay") (UNIX) (Linux/2.6.18-194.8.1.el5xen
(i686))
Xref: news-archive.icm.edu.pl pl.comp.programming:186492
[ ukryj nagłówki ]MoonWolf <m...@p...com> wrote:
> Zastanawiam się czy istnieje sposób na wykrycie 'sensu' w ciągu znaków.
> Chodzi o sprawdzenie czy jest to przypadkowy ciąg, czy też zdanie w
> języku polskim. Da się coś takiego zrobić?
... jasne, ale w przypadku jezyka polskiego jest to bardzo trudne.
Podejrzewam, ze o ile sam program operujacy na poziomie analizy syntaktycznej bylby
juz trudny
do zrobienia, zwlaszcza, ze musialbys robic wszystko sam,
to juz operowanie na poziomie analizy semantycznej tych wyrazen, ktore zostalyby
wstepnie
zaklasyfikowane jako poprawne bylby o rzad wielkosci trudniejszy w realizacji.
Chocby kwestia odmiany, to ze jezyk polski nie jest jezykiem niepozycyjnym,
brak ogolnie dostepnej wiedzy an ten tamat (poza deklaratywna) to tylko niektore
problemy z jakimi musialbys powalczyc, ale zyczy powodzenia;-) Jedyny pomysl jai mi
przychodzi do glowy, to dorwanie jakiego korpusu jezyka polskiego, wpakowanie
go do bazy z wyszukiwaniem pelnotekstowym ala MySQL z silnikiem Sphinx'a, a potem
heurystyczna analiza wynikow. Oczywiscie, heurystyka do znalezienia we wlasnym
zakresie;-)
Z powazaniem
Adam Przybyla
Następne wpisy z tego wątku
- 20.08.10 15:19 Sebastian Kaliszewski
- 20.08.10 16:55 Waldek M.
Najnowsze wątki z tej grupy
- Rosjanie chwalą się prototypem komputera kwantowego. "Najważniejszy projekt naukowy Rosji"
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
Najnowsze wątki
- 2026-01-07 Jaka myjka ultradźwiękowa?
- 2026-01-07 POCO
- 2026-01-07 Kraków => Konsultant Microsoft Dynamics AX/365 SCM Consultant - Servi
- 2026-01-07 Kraków => Microsoft Dynamics AX/365 SCM Consultant - Service & Suppor
- 2026-01-06 I kolejny
- 2026-01-06 Retro organizer ale współcześnie
- 2026-01-06 Bowling
- 2026-01-06 Cyganie
- 2026-01-06 Rozwód w Santanderze z prostokątną kobietą...
- 2026-01-06 Skąd diody LED 1,5V?
- 2026-01-06 Nowum!!! -- Moje ID
- 2026-01-06 Metoda na fotoradar
- 2026-01-05 I jeszcze jeden
- 2026-01-05 Jaworek;)
- 2026-01-05 Warszawa => Project Manager (AI and innovation) <=




5 Najlepszych Programów do Księgowości w Chmurze - Ranking i Porównanie [2025]