-
Path: news-archive.icm.edu.pl!news.rmf.pl!nf1.ipartners.pl!ipartners.pl!plix.pl!newsf
eed1.plix.pl!newsfeed00.sul.t-online.de!t-online.de!border2.nntp.dca.giganews.c
om!nntp.giganews.com!nx01.iad01.newshosting.com!newshosting.com!newsfeed.neostr
ada.pl!unt-exc-02.news.neostrada.pl!unt-spo-b-01.news.neostrada.pl!news.neostra
da.pl.POSTED!not-for-mail
From: "slawek" <s...@h...pl>
Newsgroups: pl.comp.programming
References: <i40dt9$ski$1@news.onet.pl>
In-Reply-To: <i40dt9$ski$1@news.onet.pl>
Subject: Re: Wykrywanie sensu (:)
Date: Thu, 12 Aug 2010 19:33:59 +0200
MIME-Version: 1.0
Content-Type: text/plain; format=flowed; charset="iso-8859-2"; reply-type=original
Content-Transfer-Encoding: 8bit
X-Priority: 3
X-MSMail-Priority: Normal
Importance: Normal
X-Newsreader: Microsoft Windows Live Mail 14.0.8089.726
X-MimeOLE: Produced By Microsoft MimeOLE V14.0.8089.726
Lines: 31
Message-ID: <4c643086$0$22798$65785112@news.neostrada.pl>
Organization: Telekomunikacja Polska
NNTP-Posting-Host: 62.69.202.124
X-Trace: 1281634438 unt-rea-b-01.news.neostrada.pl 22798 62.69.202.124:60735
X-Complaints-To: a...@n...neostrada.pl
Xref: news-archive.icm.edu.pl pl.comp.programming:186472
[ ukryj nagłówki ]
Użytkownik "MoonWolf" <m...@p...com> napisał w wiadomości grup
dyskusyjnych:i40dt9$ski$...@n...onet.pl...
> Zastanawiam się czy istnieje sposób na wykrycie 'sensu' w ciągu znaków.
> Chodzi o sprawdzenie czy jest to przypadkowy ciąg, czy też zdanie w
> języku polskim. Da się coś takiego zrobić?
Podpowiem ci coś wprost odwrotnego - da się zrobić generator "bezsensu" -
ale taki, że będziesz potrzebował pewnego wysiłku, aby się połapać.
Czyli innymi słowy - da się "zawiesić" "oprogramowanie" mózgu na tyle
skutecznie, że - podobnie jak przy innych złudzeniach - jest to aż nie do
wiary.
Algorytm jest prosty, wymaga np. książki (jakiegoś długiego tekstu w danym
języku). Wybierasz losowe miejsce w książce i patrzysz, jaka jest w tym
miejscu litera zaczynająca wyraz. Następnie wybierasz inne losowe miejsce w
książce i szukasz litery takiej, że przed nią jest poprzednio znaleziona
litera. Potem jeszcze raz - ale szukasz bigramu (tj. dwóch liter, takich jak
pierwsza i druga). Odstęp też traktujesz jak literę. Odstęp resetuje - po
nim, gdy wypiszesz już ciąg znaków będący "słowem" (w istocie jest to
przypadkowy zlepek liter) - restartujesz.
Oczywiste jest, że tekst jest zupełnie przypadkowy. Jednak bez trudu można
np. odróżnić tak wygenerowany tekst "niemiecki" od "polskiego". Cały dowcip
w tym, że taka generacja tekstu zachowuje statystyczne jego właściwości.
Pojawiają się zlepki liter charakterystyczne dla danego języka.
slawek
Następne wpisy z tego wątku
- 12.08.10 17:42 slawek
- 12.08.10 18:33 Marcin Kral
- 12.08.10 19:30 Mariusz Marszałkowski
- 12.08.10 20:11 Piotr M Kuć
- 12.08.10 21:13 Maciej Sobczak
- 12.08.10 21:32 Segmentation Fault
- 12.08.10 21:37 Segmentation Fault
- 12.08.10 23:11 Daniel Janus
- 13.08.10 06:53 slawek
- 13.08.10 07:17 Mariusz Kruk
- 13.08.10 08:46 Adam Przybyla
- 20.08.10 15:19 Sebastian Kaliszewski
- 20.08.10 16:55 Waldek M.
Najnowsze wątki z tej grupy
- Xiaomi [Chiny - przyp. JMJ] produkuje w całkowitych ciemnościach i bez ludzi
- Prezydent SZAP/USONA Trump ułaskawił prezydenta Hondurasu Hernandeza skazanego na 45 lat więzienia
- Rosjanie chwalą się prototypem komputera kwantowego. "Najważniejszy projekt naukowy Rosji"
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
Najnowsze wątki
- 2026-01-13 STREFA CZYSTEGO TRANSPORTU. O tym nie mówią nam WŁADZE
- 2026-01-13 To nie koniec
- 2026-01-13 Warszawa => Recruiter 360 <=
- 2026-01-13 Katowice => Key Account Manager <=
- 2026-01-13 Warszawa => Senior Backend Java Developer <=
- 2026-01-13 Wrocław => ERP Implementation Consultant <=
- 2026-01-13 Elektryk a otwieranie drzwi :-)
- 2026-01-12 Schemat automatyki
- 2026-01-12 Xiaomi [Chiny - przyp. JMJ] produkuje w całkowitych ciemnościach i bez ludzi
- 2026-01-12 Polska Grupa Zbrojeniowa (85% udziałów) Likwiduje Stomil-Poznań - Zakład Działał Od 1928r.
- 2026-01-12 Teoretyczne zagadnienie - ogrzewanie budynku
- 2026-01-12 Xiaomi [Chiny - przyp. JMJ] produkuje w całkowitych ciemnościach i bez ludzi
- 2026-01-12 Xiaomi [Chiny - przyp. JMJ] produkuje w całkowitych ciemnościach i bez ludzi
- 2026-01-12 Polska Grupa Zbrojeniowa (85% udziałów) Likwiduje Stomil-Poznań - Zakład Działał Od 1928r.
- 2026-01-12 Xiaomi [Chiny - przyp. JMJ] produkuje w całkowitych ciemnościach i bez ludzi




5 Najlepszych Programów do Księgowości w Chmurze - Ranking i Porównanie [2025]