-
Path: news-archive.icm.edu.pl!news.rmf.pl!agh.edu.pl!news.agh.edu.pl!news.onet.pl!not
-for-mail
From: "Borneq" <b...@a...hidden.pl>
Newsgroups: pl.comp.programming
Subject: Re: Klasyfikacja bayesowska stron kodowych
Date: Sat, 31 Jul 2010 15:36:06 +0200
Organization: http://onet.pl
Lines: 11
Message-ID: <i318sm$94e$1@news.onet.pl>
References: <i317b8$4q1$1@news.onet.pl>
NNTP-Posting-Host: 194.117.241.226
Mime-Version: 1.0
Content-Type: text/plain; format=flowed; charset="iso-8859-2"; reply-type=response
Content-Transfer-Encoding: 8bit
X-Trace: news.onet.pl 1280583382 9358 194.117.241.226 (31 Jul 2010 13:36:22 GMT)
X-Complaints-To: n...@o...pl
NNTP-Posting-Date: Sat, 31 Jul 2010 13:36:22 +0000 (UTC)
X-Priority: 3
X-MSMail-Priority: Normal
X-Newsreader: Microsoft Outlook Express 6.00.2900.5931
X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2900.5931
Xref: news-archive.icm.edu.pl pl.comp.programming:186207
[ ukryj nagłówki ]Użytkownik "Borneq" <b...@a...hidden.pl> napisał w wiadomości
news:i317b8$4q1$1@news.onet.pl...
> W jaki sposób można rozpoznawać stronę kodową np. Latin2,
> Windows1250,UTF8 na podstawie tekstu, czy do tego mogą przydać się
> algorytmy bayesowskie?
Jeśli chodzi o Bayesa to najwięcej można znaleźć na temat klasyfikowania
spamu. A jak w przypadku znaków? są podobieństwa i różnice, np. dla hipotezy
UTF8 jeden znak ma kilka bajtów a te same bajty w innej hipotezie oznaczają
kilka kolejnych znaków.
Następne wpisy z tego wątku
- 31.07.10 22:26 Segmentation Fault
- 01.08.10 06:29 Paweł Kierski
- 01.08.10 08:56 Borneq
- 01.08.10 09:00 Borneq
- 01.08.10 12:25 Borneq
- 03.08.10 08:31 Segmentation Fault
- 03.08.10 23:45 Borneq
- 04.08.10 12:33 Segmentation Fault
- 04.08.10 19:19 Borneq
- 04.08.10 20:15 Segmentation Fault
- 05.08.10 11:43 Borneq
Najnowsze wątki z tej grupy
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
- Ada 2022 Language Reference Manual to be Published by Springer
- Press Release - AEiC 2023, Ada-Europe Reliable Softw. Technol.
- Ada-Europe - AEiC 2023 early registration deadline approaching
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2023
- Ile cykli zajmuje mnożenie liczb 64-bitowych?
Najnowsze wątki
- 2024-05-24 Chiński bestseller w Europie. Ford "martwi się nową konkurencją"
- 2024-05-24 Wiewiórki, szczury i myszy...
- 2024-05-24 Warszawa => QA Manager <=
- 2024-05-24 Warszawa => AI Specialist <=
- 2024-05-24 Zabrze => Analityk biznesowo-systemowy <=
- 2024-05-24 Ulm => Technischer Rollouter (d/m/w) <=
- 2024-05-24 Warszawa => Senior Rust Software Engineer <=
- 2024-05-24 Warszawa => Spedytor międzynarodowy <=
- 2024-05-24 Kraków => Head of International Freight Forwarding Department <=
- 2024-05-24 Warszawa => Senior Software Engineer PHP (BillPro) Contractor <=
- 2024-05-24 Warszawa => Senior Software Engineer PHP (BillPro) Kontraktor <=
- 2024-05-24 Warszawa => Cybersecurity Consultant <=
- 2024-05-24 Warszawa => Full Stack web developer (obszar .Net Core, Angular6+) <=
- 2024-05-24 Warszawa => React Native Developer <=
- 2024-05-24 Re: Ambasador USA zdradza: TVN Style nie jest firmą Unii Europejskiej :-)