-
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
atman.pl!.POSTED!not-for-mail
From: "Borneq" <b...@a...hidden.pl>
Newsgroups: pl.comp.programming
Subject: Re: Porównywanie tekstów i DNA
Date: Sun, 5 May 2013 22:56:36 +0200
Organization: ATMAN - ATM S.A.
Lines: 28
Message-ID: <km6h26$c1c$1@node1.news.atman.pl>
References: <km3t3c$rmm$1@node2.news.atman.pl>
<c...@4...com>
<km3vmp$u77$1@node2.news.atman.pl>
<9...@4...com>
<km44ph$3q5$1@node2.news.atman.pl> <km4545$nl$1@node1.news.atman.pl>
NNTP-Posting-Host: 91.239.205.62
Mime-Version: 1.0
Content-Type: text/plain; format=flowed; charset="utf-8"; reply-type=response
Content-Transfer-Encoding: 8bit
X-Trace: node1.news.atman.pl 1367787398 12332 91.239.205.62 (5 May 2013 20:56:38 GMT)
X-Complaints-To: u...@a...pl
NNTP-Posting-Date: Sun, 5 May 2013 20:56:38 +0000 (UTC)
X-Priority: 3
X-MSMail-Priority: Normal
X-Newsreader: Microsoft Outlook Express 6.00.2900.5931
X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2900.6157
Xref: news-archive.icm.edu.pl pl.comp.programming:203147
[ ukryj nagłówki ]Użytkownik "bartekltg" <b...@g...com> napisał w wiadomości
news:km4545$nl$1@node1.news.atman.pl...
> http://en.wikipedia.org/wiki/Levenshtein_distance
> http://en.wikipedia.org/wiki/Damerau%E2%80%93Levensh
tein_distance
> prześledz też, jakimi algorytmami nakarmiony jest "diff"
Patrzyłem jak diff działa na dowolnych napisach, w odróżnieniu od
specjalnych przekładów, nie za bardoz daje się wybrać innej ściezki
modyfikacji, która by nie była optymalna w sensie LCS, za to miała inne
cechy.
Natomiast zauważyłem jeszcze coś:, wziąłem napisy wygeneorwane losowo:
aacaacaabbab i acaacbcacccaaab
Diff pokazało:
aacaa caabbab
a caacbcacccaa ab
Tymczasem w ciagu jest aż 5 znaków takich samych w pierwszym i drugim
napisie
aacaac a abbab
acaacbcacccaa ab
Co więcej, jest to tak samo optymalne jak to co daje diff, minimalna liczba
edycji i jest lepszym rozwiązaniem, bo spotyka się przy porównywaniu linii
tekstów, gdzie w przypadku gdy dwie linie są takie same np. linie puste,
pokazuje nie tą różnicę co trzeba.
Tutaj i tak i tak mamy rozwiązanie optymalne, cz dałoby się dostroić
algorytm w ten sposób, aby mając dwa kawałki wspólnego ciągu o długościach
przykładowo 5 i 1 albo 4 i 2 wybierze pierwszą możliwość maksymalizując
długość podciągu dłuższego kosztem krótszego?
Następne wpisy z tego wątku
- 06.05.13 17:43 bartekltg
Najnowsze wątki z tej grupy
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
Najnowsze wątki
- 2025-08-06 Gdynia => Konsultant wdrożeniowy (systemy controlingowe) <=
- 2025-08-06 Białystok => Inżynier oprogramowania .Net <=
- 2025-08-06 "[...] sejmowe wystąpienie posłanki Klaudii Jachiry, która zakończyła je słowami ,,Sława Ukrainie"."
- 2025-08-05 "Chiny przekraczają w wydobyciu 4 mld ton węgla, Indie i USA ponad 1 mld, a Rosja 500 mln ton [...]"
- 2025-08-05 Panuje się 181 159,42 zł./mies. na posła w 2026r.
- 2025-08-05 "Chiny przekraczają w wydobyciu 4 mld ton węgla, Indie i USA ponad 1 mld, a Rosja 500 mln ton [...]"
- 2025-08-05 Czy cos fi przechodzi przez trafo separujące?
- 2025-08-05 kajaki i promile
- 2025-08-05 Re: Tesla jest bezpieczna, wczoraj spaliła się doszczętnie na Ursynowie i nikomu się nic nie stało
- 2025-08-05 Gdynia => Przedstawiciel handlowy / KAM (branża TSL) <=
- 2025-08-05 Re: Atak na lekarza w Oławie. Policja zatrzymała sprawcę na lotnisku Polska Agencja Prasowa 4 sierpnia 2025, 12:16 FACEBOOK X E-MAIL KOPIUJ LINK W szpitalu w Oławie 37-letni pacjent zaatakował lekarza, po tym, jak ten odmówił mu wypisania długoterminowego
- 2025-08-05 B2B i książka przychodów i rozchodów
- 2025-08-04 Re: Atak na lekarza w Oławie. Policja zatrzymała sprawcę na lotnisku Polska Agencja Prasowa 4 sierpnia 2025, 12:16 FACEBOOK X E-MAIL KOPIUJ LINK W szpitalu w Oławie 37-letni pacjent zaatakował lekarza, po tym, jak ten odmówił mu wypisania długoterminowego
- 2025-08-04 Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- 2025-08-04 Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML