eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingDetekcja strony kodowej (Bayes?) › Detekcja strony kodowej (Bayes?)
  • Data: 2019-12-27 14:53:31
    Temat: Detekcja strony kodowej (Bayes?)
    Od: Borneq <b...@a...hidden.pl> szukaj wiadomości tego autora
    [ pokaż wszystkie nagłówki ]

    Mam strony kodowe 8859-*, CP12?? oraz KOI8-R.
    Jak rozpoznać po tekście, np. za pomocą Bayesa, która to strona kodowa?
    Jak mam język polski (tu musi być dodatkowa wiedza, jaki to język) to
    używam tylko kilku znaków ośmiobitowych (reszta to Ascii 7-bitowe) więc
    sprawdzam aby 8-bitowe były z tego zbioru.
    A jak jest z takimi językami jak rosyjski, grecki, hebrajski, arabski,
    które mają cały alfabet zdefiniowany w wyższym Ascii?
    Tu potrzebna była by nauka na tekstach - bo niektóre znaki występują
    rzadziej i niektóre częściej, a poza tym kontekst znaków w sylabach.
    Jak zdetektować UTF8? Można próbować konwertować, i czy przekonwertuje
    się bez błędów lub z bardzo małą ilością błędów. Ale zastanawiam się nad
    stronami kodowymi.

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: