-
Path: news-archive.icm.edu.pl!news.icm.edu.pl!news.man.lodz.pl!newsfeed.pionier.net.p
l!3.eu.feeder.erje.net!feeder.erje.net!weretis.net!feeder8.news.weretis.net!new
s.mixmin.net!aioe.org!xVfaAYnW1Uimsb6QZpGQeg.user.46.165.242.75.POSTED!not-for-
mail
From: Mateusz Viste <m...@x...invalid>
Newsgroups: pl.misc.elektronika
Subject: Re: Kopia dysku
Date: Sat, 15 Oct 2022 10:59:16 +0200
Organization: . . .
Message-ID: <tidsp4$1psj$2@gioia.aioe.org>
References: <6343f944$0$474$65785112@news.neostrada.pl>
<6343f944$0$474$65785112@news.neostrada.pl>
<a...@n...neostrada.pl>
<ti3n0e$1f88$1@gioia.aioe.org> <7Pn1L.683711$qD%2.602420@fx08.ams1>
<ti6snf$1hn1$1@gioia.aioe.org> <gbn2L.1084154$vFVf.541999@fx02.ams1>
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: quoted-printable
Injection-Info: gioia.aioe.org; logging-data="59283";
posting-host="xVfaAYnW1Uimsb6QZpGQeg.user.gioia.aioe.org";
mail-complaints-to="a...@a...org";
X-Notice: Filtered by postfilter v. 0.9.2
Xref: news-archive.icm.edu.pl pl.misc.elektronika:774865
[ ukryj nagłówki ]2022-10-15 o 00:31 GMT, Marcin Debowski napisał:
> > A kiedy będziesz potrzebował któregoś z tych obrazów dd, to albo
> > wyciągasz go BORGiem na serwerze (a dalej tradycyjnie, na dyskietce
> > czy co tam używasz), albo montujesz BORGa FUSE-em i eksportujesz
> > zasób NFSem lub inną Sambą.
>
> A ta kompresja to jest na poziomie bloków jakiegoś wewnętrznego
> systemu plików, skoro, jak napisałeś gdzieindziej, zmiana w dużym
> pliku nie oznacza jego nowej, pełnej kopii?
Nie tyle w wewnętrznym "systemie plików", co w sposobie, w jaki BORG
trzyma dane (tj. formacie swojej bazy danych). Przy czym sama kompresja
tak naprawdę niewiele daje. Dużo bardziej interesująca jest
deduplikacja. Kiedy masz dwa pliki, których zawartość pokrywa się np. w
90%, to BORG potrafi to wykryć i zapisuje 90% ich zawartości tylko raz.
Masz natomiast rację w tym, że jest to podejście blokowe, poniekąd
podobne zresztą do tego, które znamy z torrentów. Deduplikacja działa
tak, że BORG każdy plik dzieli na bloki. Dla każdego bloku oblicza hash
i taką parę HASH=BLOK sobie zapisuje w swojej bazie. Jeśli widzi, że
hash o takiej wartości już wcześniej wystąpił, to nie zapisuje go
kolejny raz, tylko trzyma odnośnik do niego. Co istotne: nieważne, czy
blok pochodzi z tego samego pliku, czy z dwóch różnych, czy nawet z
różnych źródeł lub różnych okresów backupu: BORG trzyma go tylko raz.
Czyli jeśli mam gigabajtowy plik wideo, który sobie skopiuję na dysk
pod inną nazwą, potem wyślę na laptop żony, i dodatkowo zapiszę na
domowym NASie, to po backupach tych trzech komputerów w bazie BORGa
plik nadal będzie zapisany tylko raz, a nie 4x jak to miałoby miejsce
przy konwencjonalnym podejściu.
Do tego deduplikacja zachodzi już na kliencie, czyli zamiast wysyłać
całość danych do serwera backupowego, klient BORGa wysyła mu listę
znalezionych plików, i dla każdego pliku listę bloków (hashy), z
których się składa. Serwer wówczas pyta tylko o te bloki, których
jeszcze nie zna, dzięki czemu wysyłamy relatywnie mało danych (dużo
mniej, niż wysłałby rsync).
BORG daje też fajny podgląd na to, jak skuteczny jest każdy z etapów.
Tutaj przykład obecnego stanu mojego repo:
----------------------------------------------------
--------------
Original size Compressed size Deduplicated size
All archives: 2.32 TB 1.87 TB 110.30 GB
Unique chunks Total chunks
Chunk index: 575'596 12'846'752
----------------------------------------------------
--------------
Takie repo można zamontować (read-only) borgfs-em, wówczas użytkownik
widzi normalną strukturę katalogów, a borgfs zajmuje się w tle
odpowiednim mapowaniem danych.
Mateusz
Następne wpisy z tego wątku
- 16.10.22 11:15 Marcin Debowski
- 20.10.22 09:28 Adam
- 20.10.22 12:10 heby
Najnowsze wątki z tej grupy
- Czy cos fi przechodzi przez trafo separujące?
- śrubka masy
- Ciekawostka na dziś lock bity
- [OT] napisy w YT
- Było 83V
- Stare komputery
- Odbiornik ADS-B i wzmacniacze
- Thunderbird i dysk...
- opornosc falowa
- Bateria 9V 6F22, alkaliczna v cynkowa, samorozładowanie, bateria wysokiej trwałości do miernika
- Tani zakup z ali?
- w czasach LED komary mają ciężko
- walizka z kodami
- Rejestrator temperatur - termopara, siec
- Router LTE z możliwością zmian MTU
Najnowsze wątki
- 2025-08-06 Gdynia => Konsultant wdrożeniowy (systemy controlingowe) <=
- 2025-08-06 Białystok => Inżynier oprogramowania .Net <=
- 2025-08-06 "[...] sejmowe wystąpienie posłanki Klaudii Jachiry, która zakończyła je słowami ,,Sława Ukrainie"."
- 2025-08-05 "Chiny przekraczają w wydobyciu 4 mld ton węgla, Indie i USA ponad 1 mld, a Rosja 500 mln ton [...]"
- 2025-08-05 Panuje się 181 159,42 zł./mies. na posła w 2026r.
- 2025-08-05 "Chiny przekraczają w wydobyciu 4 mld ton węgla, Indie i USA ponad 1 mld, a Rosja 500 mln ton [...]"
- 2025-08-05 Czy cos fi przechodzi przez trafo separujące?
- 2025-08-05 kajaki i promile
- 2025-08-05 Re: Tesla jest bezpieczna, wczoraj spaliła się doszczętnie na Ursynowie i nikomu się nic nie stało
- 2025-08-05 Gdynia => Przedstawiciel handlowy / KAM (branża TSL) <=
- 2025-08-05 Re: Atak na lekarza w Oławie. Policja zatrzymała sprawcę na lotnisku Polska Agencja Prasowa 4 sierpnia 2025, 12:16 FACEBOOK X E-MAIL KOPIUJ LINK W szpitalu w Oławie 37-letni pacjent zaatakował lekarza, po tym, jak ten odmówił mu wypisania długoterminowego
- 2025-08-05 B2B i książka przychodów i rozchodów
- 2025-08-04 Re: Atak na lekarza w Oławie. Policja zatrzymała sprawcę na lotnisku Polska Agencja Prasowa 4 sierpnia 2025, 12:16 FACEBOOK X E-MAIL KOPIUJ LINK W szpitalu w Oławie 37-letni pacjent zaatakował lekarza, po tym, jak ten odmówił mu wypisania długoterminowego
- 2025-08-04 Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- 2025-08-04 Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML