eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingPython: pliki tekstowe - różne kodowanie › Python: pliki tekstowe - różne kodowanie
  • Data: 2009-07-02 09:46:35
    Temat: Python: pliki tekstowe - różne kodowanie
    Od: "didi" <d...@d...com> szukaj wiadomości tego autora
    [ pokaż wszystkie nagłówki ]

    witam, poszło również na pl.comp.lang.python, ale tam jakby mniejszy ruch
    jest...

    mam kilkaset plików tekstowych, które muszę połączyć w jeden plik, usuwając
    wcześniej określone linie i dokonując zmian w poszczególnych polach w
    tekście (taka forma tekstowej bazy danych).

    Na początku zająłem się usuwaniem samych linii:

    outfile=open("name.txt",'w')
    for file in filenames:
    text=open(file)
    lines=text.readlines()
    outfile.writelines(lines[3:]) #zapisz wszystkie linie począwszy od
    3-ciej
    text.close
    outfile.close


    I problem jaki napotkałem to UnicodeDecodeError: 'charmap' codec can't
    decode byte ... in position ...:character mapt to <undifined>

    czyli wg mnie w jednym z plików pojawiło się inne kodowanie niż standardowe.
    Stąd program się wykrzaczył. Nie potrafię określić, jakiego rodzaju
    kodowanie pojawi się w plikach wejściowych, nie jest to zależne ode mnie.


    Kombinowałem z text=open(file,'rb') a następnie jakiś split('\r\n'), żeby
    uzyskać podział na linie i jednocześnie uniezależnić się od kodowania.
    Niestety za każdym razem dostawałem komunikat o braku możliwości użycia
    funkcji operujących na stringu na buforze API.

    Jakaś podpowiedź koledzy?


    --
    didi

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: