-
Path: news-archive.icm.edu.pl!news.rmf.pl!agh.edu.pl!news.agh.edu.pl!news.onet.pl!not
-for-mail
From: Jacek Czerwinski <...@...z.pl>
Newsgroups: pl.comp.programming
Subject: Re: Biblia jako XML, reprezentacja danych
Date: Sun, 29 Nov 2009 18:11:49 +0100
Organization: http://onet.pl
Lines: 40
Message-ID: <heua0o$ddc$1@news.onet.pl>
References: <heu8ha$94r$1@inews.gazeta.pl>
NNTP-Posting-Host: 77-254-140-159.adsl.inetia.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8; format=flowed
Content-Transfer-Encoding: 8bit
X-Trace: news.onet.pl 1259514712 13740 77.254.140.159 (29 Nov 2009 17:11:52 GMT)
X-Complaints-To: n...@o...pl
NNTP-Posting-Date: Sun, 29 Nov 2009 17:11:52 +0000 (UTC)
User-Agent: Thunderbird 2.0.0.23 (Windows/20090812)
In-Reply-To: <heu8ha$94r$1@inews.gazeta.pl>
Xref: news-archive.icm.edu.pl pl.comp.programming:184191
[ ukryj nagłówki ]Wojciech "Spook" Sura pisze:
> Witam!
>
> Chciałbym przechować Pismo Święte w postaci pliku XML z podziałem na
> księgi, rozdziały i wersety. W Internecie udało mi się znaleźć tylko
> jedno miejsce z którego da się ściągnąć Biblię w tej postaci, ale wynikł
> pewien problem w reprezentacji danych.
>
> Otóż na samym początku, w księdze Genesis mamy następujący fragment:
Różnic jest więcej. Fragmenty pochodzące z innych kodeksów (innych
tradycji) itd, np. przekazane czy to przez Septuagintę, czy z bezp. z
hebrajskiego itd.
czy np w Psalmach co do tekstu jest w zasadzie zgodność, ale cięcie na
konkretne psalmy jest w dwu tradycjach, i kilkadziesiąt psalmów ma
podwójną numerację.
Są wyjątkowo wersety nie czysto cyfrowe, ale a,b,c.
Więc numer to nie taki sobie prosty numeryk.
Jest gdzieś w ST (Daniel ?? Ezechiel?? nie pamiętam) odmienne cięcie na
rozdziały)
Podtytuły (w niektórych księgach) nie są integralną częścią tekstu
biblijnego, najczęściej są pochodną tradycyjnej wielowiekowej redakcji
(o dziwo nie spotkałem się by stało się to powodem wojny wyznaniowej).
Jak Gutenberg drukował swoją Biblię, JUŻ WTEDY przyjął starsze od siebie
konwencje wydawnicze.
( Wydana elektronicznie na CD z 15 lat temu Tysiąclatka szła na poziomie
wizualnym, jak widać w druku, tak było pocięte (konkretnie to był HTML w
dialekcie chyba FrontPage). Nie silili się na bardzo ambitną organizację. )
Gdybym to robił, odpuścił bym bardzo ścisłą hierarchię. Jest strumień
tekstu w wersji "max", są w nim opcjonalne fragmenty ... trzeba jakąś
buchalterię aby zapanować, ale strumień jest daną podstawową. Fragmencik
może być opcjonalny, ale nie spotkałem się (specem nie jestem) by była
sporna kolejność, więc z sekwencją raczej będzie ok, najwyżej elementy
opcjonalne
Następne wpisy z tego wątku
- 29.11.09 18:19 Jędrzej Dudkiewicz
- 03.12.09 18:43 MinkoSoft
- 04.12.09 14:13 MoonWolf
- 05.01.10 22:19 Wojciech \"Spook\" Sura
- 05.01.10 23:14 Borneq
- 06.01.10 07:16 Wojciech \"Spook\" Sura
- 16.11.15 11:58 k...@g...com
- 28.02.17 23:07 s...@g...com
- 01.03.17 21:40 t...@g...com
- 06.04.17 22:24 m...@g...com
- 24.04.18 15:23 m...@g...com
- 26.04.18 01:34 M.M.
Najnowsze wątki z tej grupy
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
Najnowsze wątki
- 2025-08-06 Gdynia => Konsultant wdrożeniowy (systemy controlingowe) <=
- 2025-08-06 Białystok => Inżynier oprogramowania .Net <=
- 2025-08-06 "[...] sejmowe wystąpienie posłanki Klaudii Jachiry, która zakończyła je słowami ,,Sława Ukrainie"."
- 2025-08-05 "Chiny przekraczają w wydobyciu 4 mld ton węgla, Indie i USA ponad 1 mld, a Rosja 500 mln ton [...]"
- 2025-08-05 Panuje się 181 159,42 zł./mies. na posła w 2026r.
- 2025-08-05 "Chiny przekraczają w wydobyciu 4 mld ton węgla, Indie i USA ponad 1 mld, a Rosja 500 mln ton [...]"
- 2025-08-05 Czy cos fi przechodzi przez trafo separujące?
- 2025-08-05 kajaki i promile
- 2025-08-05 Re: Tesla jest bezpieczna, wczoraj spaliła się doszczętnie na Ursynowie i nikomu się nic nie stało
- 2025-08-05 Gdynia => Przedstawiciel handlowy / KAM (branża TSL) <=
- 2025-08-05 Re: Atak na lekarza w Oławie. Policja zatrzymała sprawcę na lotnisku Polska Agencja Prasowa 4 sierpnia 2025, 12:16 FACEBOOK X E-MAIL KOPIUJ LINK W szpitalu w Oławie 37-letni pacjent zaatakował lekarza, po tym, jak ten odmówił mu wypisania długoterminowego
- 2025-08-05 B2B i książka przychodów i rozchodów
- 2025-08-04 Re: Atak na lekarza w Oławie. Policja zatrzymała sprawcę na lotnisku Polska Agencja Prasowa 4 sierpnia 2025, 12:16 FACEBOOK X E-MAIL KOPIUJ LINK W szpitalu w Oławie 37-letni pacjent zaatakował lekarza, po tym, jak ten odmówił mu wypisania długoterminowego
- 2025-08-04 Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- 2025-08-04 Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML