eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programming › Biblia jako XML, reprezentacja danych
Ilość wypowiedzi w tym wątku: 14

  • 1. Data: 2009-11-29 16:46:49
    Temat: Biblia jako XML, reprezentacja danych
    Od: "Wojciech \"Spook\" Sura" <s...@s...please.op.pl>

    Witam!

    Chciałbym przechować Pismo Święte w postaci pliku XML z podziałem na księgi,
    rozdziały i wersety. W Internecie udało mi się znaleźć tylko jedno miejsce z
    którego da się ściągnąć Biblię w tej postaci, ale wynikł pewien problem w
    reprezentacji danych.

    Otóż na samym początku, w księdze Genesis mamy następujący fragment:

    [Cytuję]
    (...)
    <werset numer="4">Oto są dzieje początków po stworzeniu nieba i
    ziemi.</werset>
    <header_2>Drugi opis stworzenia człowieka</header_2>
    Gdy Pan Bóg uczynił ziemię i niebo,
    <werset numer="5">nie było jeszcze żadnego krzewu polnego na ziemi, ani
    żadna trawa polna jeszcze nie wzeszła - bo Pan Bóg nie zsyłał deszczu na
    ziemię i nie było człowieka, który by uprawiał ziemię</werset>
    (...)
    [/Cytuję]

    I dalej mamy już normalnie. Zapytam pewnie jakiegoś biblistę, ale wygląda na
    to, że werset czwarty jest przedzielony na dwa kawałki nagłówkiem drugiego
    stopnia. Jestem też przekonany, że nie jest to jedyne miejsce takiej
    postaci, a co gorsza będę musiał narzeźbić jakiś parser do poprawienia tego
    błędu, bo cały tekst ma przeszło 190000 linijek i ręczne poprawki nie
    wchodzą w grę.

    No i tu mam zagwózdkę, bo nie wiem, jak to teraz ubrać w poprawnego XMLa.
    Powyższy kod jest oczywiście nieprawidłowy, bo - przynajmniej za mojej
    pamięci - gałąź może zawierać albo tekst albo podgałęzie, nigdy na raz. Mam
    kilka pomysłów, ale nie jestem zadowolony z żadnego rozwiązania:

    a) Ubrać urwany kawałek w znaczniki <werset> i nadać mu ten sam numer, jak
    werset poprzedzający nagłówek. Wtedy jednak powstaje pewna
    niejednoznaczność - co mam pokazać, jeśli użytkownik zażyczy sobie
    przeczytać właśnie ten werset?
    b) Podobnie, jak powyżej, ale dodać do znacznika jakiś parametr informujący
    o tym, że jest to kontynucja urwanego wersetu, coś pokroju <werset
    rodzaj="cd">. Tyle tylko, że wtedy będę musiał przygotować jakiś dodatkowy
    mechanizm analizujący to, co jest za danym wersetem, bo może się okazać, że
    werset jest połamany na kawałki, jak powyżej.
    c) Zrezygnować z oznaczania wersetów znacznikami, natomiast wprowadzić
    własne formatowanie wewnątrz rozdziału - przykładowo przyjąć, że @(1)
    oznacza, że jest to początek pierwszego wersetu. Niby wygodne do
    oprogramowania i przetworzenia, ale wydaje mi się, że jest to hackerskie
    rozwiązanie, z którym będę miał później same problemy.

    Rozwiązaniem byłoby oczywiście usunięcie znacznika nagłówka drugiego
    poziomu, ale w ten sposób pozbywam się treści, co oczywiście jest
    nieakceptowalne.

    Czy macie może jakiś lepszy pomysł?

    Pozdrawiam -- Spook.

    --
    ! ._______. Warning: Lucida Console sig! //) !
    ! || spk || www.spook.freshsite.pl / _ """*!
    ! ||_____|| spook at op.pl / ' | ""!
    ! | ___ | tlen: spoko_ws gg:1290136 /. __/"\ '!
    ! |_|[]_|_| May the SOURCE be with you! \/) \ !


  • 2. Data: 2009-11-29 17:11:49
    Temat: Re: Biblia jako XML, reprezentacja danych
    Od: Jacek Czerwinski <...@...z.pl>

    Wojciech "Spook" Sura pisze:
    > Witam!
    >
    > Chciałbym przechować Pismo Święte w postaci pliku XML z podziałem na
    > księgi, rozdziały i wersety. W Internecie udało mi się znaleźć tylko
    > jedno miejsce z którego da się ściągnąć Biblię w tej postaci, ale wynikł
    > pewien problem w reprezentacji danych.
    >
    > Otóż na samym początku, w księdze Genesis mamy następujący fragment:

    Różnic jest więcej. Fragmenty pochodzące z innych kodeksów (innych
    tradycji) itd, np. przekazane czy to przez Septuagintę, czy z bezp. z
    hebrajskiego itd.

    czy np w Psalmach co do tekstu jest w zasadzie zgodność, ale cięcie na
    konkretne psalmy jest w dwu tradycjach, i kilkadziesiąt psalmów ma
    podwójną numerację.
    Są wyjątkowo wersety nie czysto cyfrowe, ale a,b,c.
    Więc numer to nie taki sobie prosty numeryk.

    Jest gdzieś w ST (Daniel ?? Ezechiel?? nie pamiętam) odmienne cięcie na
    rozdziały)

    Podtytuły (w niektórych księgach) nie są integralną częścią tekstu
    biblijnego, najczęściej są pochodną tradycyjnej wielowiekowej redakcji
    (o dziwo nie spotkałem się by stało się to powodem wojny wyznaniowej).
    Jak Gutenberg drukował swoją Biblię, JUŻ WTEDY przyjął starsze od siebie
    konwencje wydawnicze.

    ( Wydana elektronicznie na CD z 15 lat temu Tysiąclatka szła na poziomie
    wizualnym, jak widać w druku, tak było pocięte (konkretnie to był HTML w
    dialekcie chyba FrontPage). Nie silili się na bardzo ambitną organizację. )

    Gdybym to robił, odpuścił bym bardzo ścisłą hierarchię. Jest strumień
    tekstu w wersji "max", są w nim opcjonalne fragmenty ... trzeba jakąś
    buchalterię aby zapanować, ale strumień jest daną podstawową. Fragmencik
    może być opcjonalny, ale nie spotkałem się (specem nie jestem) by była
    sporna kolejność, więc z sekwencją raczej będzie ok, najwyżej elementy
    opcjonalne


  • 3. Data: 2009-11-29 18:19:18
    Temat: Re: Biblia jako XML, reprezentacja danych
    Od: Jędrzej Dudkiewicz <j...@g...com>

    Wojciech "Spook" Sura pisze:
    > Witam!
    >
    > No i tu mam zagwózdkę, bo nie wiem, jak to teraz ubrać w poprawnego
    > XMLa. Powyższy kod jest oczywiście nieprawidłowy, bo - przynajmniej za
    > mojej pamięci - gałąź może zawierać albo tekst albo podgałęzie, nigdy na
    > raz.

    Jeżeli rozumiem o co Ci chodzi, to nieprawda.

    Masz tak:
    [39] element ::= EmptyElemTag
    | STag content ETag

    a `content' to:

    [43] content ::= CharData? ((element | Reference | CDSect | PI
    | Comment) CharData?)*

    Czyli może i tekst, i podgałęzie i to w dowolnej liczbie.

    JD


  • 4. Data: 2009-12-03 18:43:32
    Temat: Re: Biblia jako XML, reprezentacja danych
    Od: MinkoSoft <m...@g...com>

    On 29 Lis, 16:46, "Wojciech \"Spook\" Sura"
    <s...@s...please.op.pl> wrote:
    > Witam!
    >
    > Chciałbym przechować Pismo Święte w postaci pliku XML z podziałem na księgi,
    > rozdziały i wersety. W Internecie udało mi się znaleźć tylko jedno miejsce z
    > którego da się ściągnąć Biblię w tej postaci, ale wynikł pewien problem w
    > reprezentacji danych.
    >
    > Otóż na samym początku, w księdze Genesis mamy następujący fragment:
    >
    > [Cytuję]
    > (...)
    > <werset numer="4">Oto są dzieje początków po stworzeniu nieba i
    > ziemi.</werset>
    > <header_2>Drugi opis stworzenia człowieka</header_2>
    > Gdy Pan Bóg uczynił ziemię i niebo,
    > <werset numer="5">nie było jeszcze żadnego krzewu polnego na ziemi, ani
    > żadna trawa polna jeszcze nie wzeszła - bo Pan Bóg nie zsyłał deszczu na
    > ziemię i nie było człowieka, który by uprawiał ziemię</werset>
    > (...)
    > [/Cytuję]
    >
    > I dalej mamy już normalnie. Zapytam pewnie jakiegoś biblistę, ale wygląda na
    > to, że werset czwarty jest przedzielony na dwa kawałki nagłówkiem drugiego
    > stopnia. Jestem też przekonany, że nie jest to jedyne miejsce takiej
    > postaci, a co gorsza będę musiał narzeźbić jakiś parser do poprawienia tego
    > błędu, bo cały tekst ma przeszło 190000 linijek i ręczne poprawki nie
    > wchodzą w grę.
    >
    > No i tu mam zagwózdkę, bo nie wiem, jak to teraz ubrać w poprawnego XMLa.
    > Powyższy kod jest oczywiście nieprawidłowy, bo - przynajmniej za mojej
    > pamięci - gałąź może zawierać albo tekst albo podgałęzie, nigdy na raz. Mam
    > kilka pomysłów, ale nie jestem zadowolony z żadnego rozwiązania:
    >
    > a) Ubrać urwany kawałek w znaczniki <werset> i nadać mu ten sam numer, jak
    > werset poprzedzający nagłówek. Wtedy jednak powstaje pewna
    > niejednoznaczność - co mam pokazać, jeśli użytkownik zażyczy sobie
    > przeczytać właśnie ten werset?
    > b) Podobnie, jak powyżej, ale dodać do znacznika jakiś parametr informujący
    > o tym, że jest to kontynucja urwanego wersetu, coś pokroju <werset
    > rodzaj="cd">. Tyle tylko, że wtedy będę musiał przygotować jakiś dodatkowy
    > mechanizm analizujący to, co jest za danym wersetem, bo może się okazać, że
    > werset jest połamany na kawałki, jak powyżej.
    > c) Zrezygnować z oznaczania wersetów znacznikami, natomiast wprowadzić
    > własne formatowanie wewnątrz rozdziału - przykładowo przyjąć, że @(1)
    > oznacza, że jest to początek pierwszego wersetu. Niby wygodne do
    > oprogramowania i przetworzenia, ale wydaje mi się, że jest to hackerskie
    > rozwiązanie, z którym będę miał później same problemy.
    >
    > Rozwiązaniem byłoby oczywiście usunięcie znacznika nagłówka drugiego
    > poziomu, ale w ten sposób pozbywam się treści, co oczywiście jest
    > nieakceptowalne.
    >
    > Czy macie może jakiś lepszy pomysł?
    >
    > Pozdrawiam -- Spook.
    >
    > --
    > ! ._______. Warning: Lucida Console sig!    //)    !
    > ! || spk ||    www.spook.freshsite.pl     / _ """*!
    > ! ||_____||        spook at op.pl         / '  | ""!
    > ! |  ___  |   tlen: spoko_ws gg:1290136  /. __/"\ '!
    > ! |_|[]_|_|  May the SOURCE be with you! \/)     \ !

    A tak BTW to po cholerę Ci biblia w XML-u?


  • 5. Data: 2009-12-04 14:13:14
    Temat: Re: Biblia jako XML, reprezentacja danych
    Od: MoonWolf <m...@p...com>

    MinkoSoft denied rebel lies:

    [ciach mnóstwo linii]

    > A tak BTW to po cholerę Ci biblia w XML-u?

    Uczą tam jak odpowiadać na usenecie.

    --
    <:> Roger, MoonWolf Out <:>|The power of the Force is
    (::) (::)|insignificant next to this
    (:) JID:m...@j...org(:)|battle station


  • 6. Data: 2010-01-05 22:19:28
    Temat: Re: Biblia jako XML, reprezentacja danych
    Od: "Wojciech \"Spook\" Sura" <s...@s...please.op.pl>

    Użytkownik "Wojciech "Spook" Sura" <s...@s...please.op.pl> napisał
    w wiadomości news:heu8ha$94r$1@inews.gazeta.pl...
    (...)

    Zawziąłem się i wyrażeniami regularnymi połamałem całą dostępną w Internecie
    Biblię Tysiąclecia (http://online.biblia.pl) do XMLa. Jeśli ktoś jest
    zainteresowany, niech mi podeśle email, to mogę mu udostępnić.

    Pozdrawiam -- Spook.

    --
    ! ._______. Warning: Lucida Console sig! //) !
    ! || spk || www.spook.freshsite.pl / _ """*!
    ! ||_____|| spook at op.pl / ' | ""!
    ! | ___ | tlen: spoko_ws gg:1290136 /. __/"\ '!
    ! |_|[]_|_| May the SOURCE be with you! \/) \ !


  • 7. Data: 2010-01-05 23:14:07
    Temat: Re: Biblia jako XML, reprezentacja danych
    Od: "Borneq" <b...@a...hidden.pl>

    Użytkownik "Wojciech "Spook" Sura" <s...@s...please.op.pl> napisał w
    wiadomości news:hi0dt9$lv9$1@inews.gazeta.pl...
    > Zawziąłem się i wyrażeniami regularnymi połamałem całą dostępną w Internecie
    > Biblię Tysiąclecia (http://online.biblia.pl) do XMLa. Jeśli ktoś jest
    > zainteresowany, niech mi podeśle email, to mogę mu udostępnić.

    U mnie nie wchodzi link http://online.biblia.pl.
    Czy tekst w XML wykorzystasz w swoim programie przeszukującym Biblię ?


  • 8. Data: 2010-01-06 07:16:34
    Temat: Re: Biblia jako XML, reprezentacja danych
    Od: "Wojciech \"Spook\" Sura" <w...@s...medi.com.pl>

    Borneq wrote:
    > U mnie nie wchodzi link http://online.biblia.pl.

    Żeby było śmieszniej, u mnie już też nie. Ostatnio była tam informacja, że
    serwis jest chwilowo niedostępny, a teraz mam całkowity brak odpowiedzi. W
    każdym razie chodzi mi o wersję dostępną pod linkiem "Biblia tysiąclecia
    online" na stronie www.biblia.pl ("wersja" chrześcijańska, dla ścisłości).

    Jeśli ktoś jest zainteresowany, mam też zrzuty HTMLi z których parsowałem
    tekst, jest tego około 1.4k.

    > Czy tekst w XML wykorzystasz w swoim programie przeszukującym Biblię ?

    Najprawdopodobniej tak - przynajmniej w wersji na PDA. Jeśli będę się bawił
    w pisanie takiego programu na PC, to zapewne utworzę sobie niewielką bazę
    danych wyszukiwania na wzór bazy PHPBB i wykorzystam Firebirda Embedded.

    Pozdrawiam -- Spook.



  • 9. Data: 2015-11-16 11:58:15
    Temat: Re: Biblia jako XML, reprezentacja danych
    Od: k...@g...com

    W dniu środa, 6 stycznia 2010 08:16:34 UTC+1 użytkownik Wojciech "Spook" Sura
    napisał:
    > Borneq wrote:
    > > U mnie nie wchodzi link http://online.biblia.pl.
    >
    > ?eby by?o ?mieszniej, u mnie ju? te? nie. Ostatnio by?a tam informacja, ?e
    > serwis jest chwilowo niedost?pny, a teraz mam ca?kowity brak odpowiedzi. W
    > ka?dym razie chodzi mi o wersj? dost?pn? pod linkiem "Biblia tysi?clecia
    > online" na stronie www.biblia.pl ("wersja" chrze?cija?ska, dla ?cis?o?ci).
    >
    > Je?li kto? jest zainteresowany, mam te? zrzuty HTMLi z kt?rych parsowa?em
    > tekst, jest tego oko?o 1.4k.
    >
    > > Czy tekst w XML wykorzystasz w swoim programie przeszukuj?cym Bibli? ?
    >
    > Najprawdopodobniej tak - przynajmniej w wersji na PDA. Je?li b?d? si? bawi?
    > w pisanie takiego programu na PC, to zapewne utworz? sobie niewielk? baz?
    > danych wyszukiwania na wz?r bazy PHPBB i wykorzystam Firebirda Embedded.
    >
    > Pozdrawiam -- Spook.

    Witam!
    Panie Wojciechu, czy jest możliwość otrzymania od Pana "Biblii Tysiąclecia" w
    formacie XML? Potrzebuję ją do wyświetlania wersetów biblijnych w kościele w
    programie OpenSong.

    Pozdrawiam:
    Grzegorz Krasiński


  • 10. Data: 2017-02-28 23:07:18
    Temat: Re: Biblia jako XML, reprezentacja danych
    Od: s...@g...com


    >
    > Witam!
    > Panie Wojciechu, czy jest możliwość otrzymania od Pana "Biblii Tysiąclecia" w
    formacie XML? Potrzebuję ją do wyświetlania wersetów biblijnych w kościele w
    programie OpenSong.
    >
    > Pozdrawiam:
    > Grzegorz Krasiński

    Podpinam się pod prośbę. Rówież do OpenSong-a.
    Pozdrawiam
    Ewa Kurzyńska

strony : [ 1 ] . 2


Szukaj w grupach

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: