-
Data: 2019-11-18 15:38:02
Temat: Re: DeepL
Od: Borneq <b...@a...hidden.p> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu 10.11.2019 o 10:16, Borneq pisze:
> No i stało się. Zainstalowałem DeepL lokalnie na komputerze, do tej pory
> używałem przez internet. Działa szybciej niż przez internet, nie trzeba
z pdf z https://github.com/lmthang/thesis
przykład gdzie nie ma słownika tylko korpus równolegly
Chodzi o to, jakie maksymalne informacje można wydobyć z korpusa.
parallel corpus
She loves cats = Elle aime les chats
She loves him = Elle l'aime
He adores cute cats = Il adore les chats mignons
He has a cat = Il a un chat
pytanie: jak przetłumaczyć na podstawie tych 4 zdań "She loves cute cats"?
ja dochodzę do wniosku że
Elle aime les chats mignons
deepL: Elle adore les chats mignons - słuszniej, ale nie wynika to z
tych 4 zdań
można się dowiedzieć że
she = elle
loves = aime (cats)|l'aime(him) przy czym te słowa są zadziwiająco
podobne, czyli nie inne tylko inna forma
w rzeczywistości l'aime jest dużo mocniejsze (lubi-kocha) a nie inna forma
cats = les chats //nawet podobne ale nie trzeba się tym sugerować
him = albo znika w tym zdaniu, stając się domyślny albo staje się
przedrostkiem - w rzeczywistości jeśli obiektem jest "on", wtedy się
opuszcza
he = Il
adores = adore
cute = mignons + zamiana miejscami słów we frazie
has - a
a cat = un cat, tylko skąd wiedzieć że to nie "a" zostało przetłumaczone
na "a"?? - potrzebne są albo
wstępne informacje językowe albo więcej zdań w korpusie
Gdyby zapytać się o : He has a cat -> Elle a un chat
można stwierdzić nawet bez wiedzy o tym czy "a" to "has" czy "a" to "a"
Tylko należy zauważyć że te zdania są bardzo krótkie i dość łatwo można
je dopasować
Następne wpisy z tego wątku
- 18.11.19 16:06 M.M.
- 18.11.19 19:42 Borneq
- 18.11.19 20:11 Borneq
- 18.11.19 23:18 M.M.
- 18.11.19 23:24 M.M.
- 22.11.19 15:20 M.M.
Najnowsze wątki z tej grupy
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
Najnowsze wątki
- 2025-07-21 cashback
- 2025-07-21 Pomarańczowy rakietnyj on de telefon ;)
- 2025-07-21 Gdańsk => Kotlin Developer <=
- 2025-07-21 Warszawa => Sales Executive / KAM <=
- 2025-07-21 Gdańsk => Programista Kotlin <=
- 2025-07-21 Białystok => Mainframe (z/OS, Assembler) Developer <=
- 2025-07-21 opornosc falowa
- 2025-07-21 Katowice => Key Account Manager IT <=
- 2025-07-21 Wrocław => Controlling systems Consultant <=
- 2025-07-21 Żerniki => Dyspozytor Międzynarodowy <=
- 2025-07-20 Absurdalny zakaz fotografowania będzie nowelizowany
- 2025-07-20 Takie tam...
- 2025-07-20 https://newsgrouper.org/pl.soc.prawo blokuje posty: 154 posts blocked.
- 2025-07-20 Bateria 9V 6F22, alkaliczna v cynkowa, samorozładowanie, bateria wysokiej trwałości do miernika
- 2025-07-20 Tani zakup z ali?