eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingKtoś używał 1000genomes? › Re: Ktoś używał 1000genomes? Diff
  • Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed2.atman.pl!newsfeed.atman.pl!.P
    OSTED!not-for-mail
    From: Borneq <b...@a...hidden.pl>
    Newsgroups: pl.comp.programming
    Subject: Re: Ktoś używał 1000genomes? Diff
    Date: Mon, 5 Feb 2018 13:53:07 +0100
    Organization: ATMAN - ATM S.A.
    Lines: 21
    Message-ID: <p59k3h$ofh$1@node1.news.atman.pl>
    References: <p587gc$652$1@node2.news.atman.pl> <p588eh$71r$1@node2.news.atman.pl>
    <e...@g...com>
    NNTP-Posting-Host: public-gprs351732.centertel.pl
    Mime-Version: 1.0
    Content-Type: text/plain; charset=utf-8; format=flowed
    Content-Transfer-Encoding: 8bit
    X-Trace: node1.news.atman.pl 1517835185 25073 37.47.5.53 (5 Feb 2018 12:53:05 GMT)
    X-Complaints-To: u...@a...pl
    NNTP-Posting-Date: Mon, 5 Feb 2018 12:53:05 +0000 (UTC)
    User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64; rv:52.0) Gecko/20100101
    Thunderbird/52.6.0
    In-Reply-To: <e...@g...com>
    Content-Language: pl
    Xref: news-archive.icm.edu.pl pl.comp.programming:212267
    [ ukryj nagłówki ]

    W dniu 05.02.2018 o 10:31, M.M. pisze:
    > Dziedzina wiedzy dziedziną wiedzy, ale porównania się robi i używa się
    > do tego analogicznych algorytmów jak do porównywania ciągów znaków.

    Czytałem o algorytmie Myersa wspaniale wytłumaczonym na blogu jcoglan.
    Znajduje maksymalny wspólny podciąg, ale rozwiązań może być wiele. W
    podstawowej wersji ma tę miłą właściwość że gromadzi inserty i delety
    razem. Jednak wersja profesjonalna, używająca liniowego a nie
    kwadratowego miejsca pamięci, nie ma tej właściwości.
    Przykład:
    https://blog.jcoglan.com/2017/03/22/myers-diff-in-li
    near-space-theory/

    Jak można by to poprawić? Może najpierw rekurencyjnie dzielić na bloki,
    ale gdy blok nie przekracza 50 wierszy, robić wersję standardową?
    Poza tym, implementacja Butlera z CodeProject dla liniowego:
    782104906830590
    683059078210490
    daje lepsze rezultaty niż można by się spodziewać.

    Git ma jeszcze możliwość opcji --patience, która poprawia, jednak
    wyszukując unikalne wiersze - nie nadaje się np. do genomu.

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: