-
Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed2.atman.pl!newsfeed.atman.pl!.P
OSTED!not-for-mail
From: Borneq <b...@a...hidden.pl>
Newsgroups: pl.comp.programming
Subject: Wykrywanie plagiatów offline
Date: Tue, 24 Nov 2015 11:52:10 +0100
Organization: ATMAN - ATM S.A.
Lines: 17
Message-ID: <n31fgq$n0t$1@node2.news.atman.pl>
NNTP-Posting-Host: 91.239.205.105
Mime-Version: 1.0
Content-Type: text/plain; charset=utf-8; format=flowed
Content-Transfer-Encoding: 8bit
X-Trace: node2.news.atman.pl 1448362330 23581 91.239.205.105 (24 Nov 2015 10:52:10
GMT)
X-Complaints-To: u...@a...pl
NNTP-Posting-Date: Tue, 24 Nov 2015 10:52:10 +0000 (UTC)
User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64; rv:38.0) Gecko/20100101
Thunderbird/38.3.0
X-Mozilla-News-Host: news://news.atman.pl:119
Xref: news-archive.icm.edu.pl pl.comp.programming:208861
[ ukryj nagłówki ]Nie chodzi mi tutaj o wyszukiwaniu w Google fragmentów ale o podanie
dwóch plików : źródłowego i wynikowego, źródłowych może być kilka,
zresztą wynikowych też.
I ma powiedzieć ile procent z tego jest plagiatu i wskazać te miejsca.
Do porównywania tekstów służy najdłuższy wspólny podciąg, ale tutaj jest
bezużyteczny.
Bo np. mam tekst, dzielę go na 5 bloków (rozdziałów), mieszam ich
kolejność i mam wynikowy plik.
Detektor powinien w takim wypadku powiedzieć że 100% tekstu jest
plagiatem, w jakiś sposób rozpoznając początki i końce bloku.
A teraz zmieniam jedno słowo w bloku; nie powinien traktować bloków jako
różne ale jako prawie podobne, mógłby też podzielić ten blok na dwa i
stwierdzić że skoro bloki 3 i 4 w jednym pliku występują jako 3 i 4 w
drugim w tej kolejności to jest to jeden blok z małą zmianą.
Ewentualne rozszerzenia to słownik synonimów, ale w języku polskim
trudność z uwagi na odmianę słów, zarówno słowo się odmieni jak i jego
synonim.
Następne wpisy z tego wątku
- 24.11.15 12:17 M.M.
- 24.11.15 14:21 bartekltg
- 24.11.15 15:07 M.M.
- 24.11.15 15:14 bartekltg
- 24.11.15 15:36 M.M.
- 24.11.15 16:24 platformowe głupki
- 24.11.15 17:09 M.M.
- 24.11.15 17:16 bartekltg
- 24.11.15 17:17 bartekltg
- 24.11.15 17:37 M.M.
- 24.11.15 20:01 platformowe głupki
- 24.11.15 22:54 szemrany
- 24.11.15 22:56 szemrany
- 24.11.15 23:00 M.M.
- 24.11.15 23:06 szemrany
Najnowsze wątki z tej grupy
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
- Ada 2022 Language Reference Manual to be Published by Springer
- Press Release - AEiC 2023, Ada-Europe Reliable Softw. Technol.
- Ada-Europe - AEiC 2023 early registration deadline approaching
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2023
- Ile cykli zajmuje mnożenie liczb 64-bitowych?
Najnowsze wątki
- 2024-05-18 Warszawa => Software .Net Developer <=
- 2024-05-18 Warszawa => Mid/Senior QA Engineer <=
- 2024-05-18 Ulm => Solution Architect (sichere Kommunikation und IoT-Loesungen <=
- 2024-05-18 Katowice => Head of Virtualization Platform Management and Operating S
- 2024-05-18 Warszawa => SAP WM Consultant / Execution <=
- 2024-05-18 Wrocław => Consultant/Implementer Comarch ERP XL <=
- 2024-05-18 Gdańsk => Head of International Freight Forwarding Department <=
- 2024-05-18 Warszawa => Account Manager (Recruitment Services) <=
- 2024-05-18 Łódź => Salesperson - CRM Systems <=
- 2024-05-18 Łódź => Handlowiec - Systemy CRM <=
- 2024-05-17 ZŁOMNIK o pracy w TVN TURBO, nowych przepisach i współczesnej motoryzacji. Turbo Taryfa!
- 2024-05-17 Białystok => DevOps Engineer Conexa First (Contractor) <=
- 2024-05-17 Warszawa => Starszy inżynier oprogramowania (Rust) <=
- 2024-05-17 Zabrze => Junior HelpDesk <=
- 2024-05-17 Bieruń => Administrator i wdrożeniowiec Lotus Notes/Domino <=