Szanowny Użytkowniku,
Informujemy, że za 30 dni tj. 30 listopada 2024 r. serwis internetowy Forum PC LAB zostanie zamknięty.
Administrator Serwisu Forum PC LAB - Ringier Axel Springer Polska sp. z o.o. z siedzibą w Warszawie: wypowiada całość usług Serwisu Forum PC LAB z zachowaniem miesięcznego okresu wypowiedzenia.
Administrator Serwisu Forum PC LAB informuje, że:
- Z dniem 29 listopada 2024 r. zakończy się świadczenie wszystkich usług Serwisu Forum PC LAB. Ważną przyczyną uzasadniającą wypowiedzenie jest zamknięcie Serwisu Forum PC LAB
- Dotychczas zamowione przez Użytkownika usługi Serwisu Forum PC LAB będą świadczone w okresie wypowiedzenia tj. do dnia 29 listopada 2024 r.
- Po ogłoszeniu zamknięcia Serwisu Forum od dnia 30 października 2024 r. zakładanie nowych kont w serwisie Forum PC LAB nie będzie możliwe
- Wraz z zamknięciem Serwisu Forum PC LAB, tj. dnia 29 listopada 2024 r. nie będzie już dostępny katalog treści Forum PC LAB. Do tego czasu Użytkownicy Forum PC LAB mają dostęp do swoich treści w zakładce "Profil", gdzie mają możliwość ich skopiowania lub archiwizowania w formie screenshotów.
- Administrator danych osobowych Użytkowników - Ringier Axel Springer Polska sp. z o.o. z siedzibą w Warszawie zapewnia realizację praw podmiotów danych osobowych przez cały okres świadczenia usług Serwisu Forum PC LAB. Szczegółowe informacje znajdziesz w Polityce Prywatności
Administrator informuje, iż wraz z zamknięciem Serwisu Forum PC LAB, dane osobowe Użytkowników Serwisu Forum PC LAB zostaną trwale usunięte ze względu na brak podstawy ich dalszego przetwarzania. Proces trwałego usuwania danych z kopii zapasowych może przekroczyć termin zamknięcia Forum PC LAB o kilka miesięcy. Wyjątek może stanowić przetwarzanie danych użytkownika do czasu zakończenia toczących się postepowań.
elenorf
-
Liczba zawartości
16 -
Rejestracja
-
Ostatnia wizyta
Odpowiedzi dodane przez elenorf
-
-
Jest promocyjna animacja z UJ:
https://nauka.uj.edu.pl/aktualnosci/-/journal_content/56_INSTANCE_Sz8leL0jYQen/74541952/144376676
https://www.youtube.com/watch?v=uXtmN9fE01k
W której okazuje się że ANS będzie w zbliżającym się JPEG XL - głównie od Google, chyba ma szansę wyprzeć JPG, GIF, PNG:
-
Jest wideo tutorial o ANS:
I wykład z Berkeley:
-
Ostatnio Free Software Foundation wsparło walkę z patentem:
Po czym Electronic Frontier Foundation poinformowało że jest non-final rejection, prosząc Google o zaprzestanie dalszego starania o ten patent: https://www.eff.org/deeplinks/2018/08/after-patent-office-rejection-it-time-google-abandon-its-attempt-patent-use-public
W czerwcu sprawa doszła na górę redita (~25k): https://old.reddit.com/r/programming/duplicates/8q3kp8/inventor_says_google_is_patenting_work_he_put_in/
Teraz znowu (~30k): https://old.reddit.com/r/technology/duplicates/9c7kw6/google_is_trying_to_patent_use_of_a_data/
-
Rzeczywiście, coś przycięło. Spora burza w necie, np.
I pojawił się wykład Dudy, od połowy jest o ANS (slajdy: https://www.dropbox.com/s/axji416fo8cm4u6/sfi.pdf )
-
-
Polskie kodowanie od kilku miesięcy jest w jądrze Linuxa (od 4.14): https://www.phoronix.com/scan.php?page=news_item&px=Linux-4.14-Zstd-Pull
Niedługo będzie w naszych mailach - trwa standaryzacja MIME ( https://en.wikipedia.org/wiki/MIME ): https://datatracker.ietf.org/doc/draft-kucherawy-dispatch-zstd/
Szkoda że nie ma jakiegoś wideo które łatwo by je tłumaczyło ...
ps. patent gugła wstępnie odrzucony, ale oczywiście walczą dalej: https://encode.ru/threads/2648-Published-rANS-patent-by-Storeleap?p=54339&viewfull=1#post54339
-
Gorący reddit sprzed dwóch dni:
Też na szczycie Hacker News: https://news.ycombinator.com/item?id=15059159
-
Zrobiła się draka z tym patentem, np. http://www.gazetakrakowska.pl/wiadomosci/krakow/a/uj-kontra-google-poszlo-o-patent,12336284/
Patent i protest jest tutaj: https://encode.ru/threads/2648-Published-rANS-patent-by-Storeleap/page3
-
Sprawa z Googlem trafiła właśnie na główną Wykopu: https://www.wykop.pl/link/3818701/google-probuje-opatentowac-kodowanie-z-uj-2800-pkt-400-komentarzy-na-reddit/
-
Właśnie Google próbuje patentować podstawowe zastosowanie ANS - 400+ komentarzy:
-
"Kodowanie z UJ zmienia świat":
http://www.nauka.uj.edu.pl/aktualnosci/-/journal_content/56_INSTANCE_Sz8leL0jYQen/74541952/135372600
update: pojawiła się spora dyskusja na wykopie:
http://www.wykop.pl/link/3553549/kodowanie-z-uj-zmienia-swiat/
-
Ponoć próbowali dodać do głównego 7-zip, ale autor nie jest przychylny.
Co do innych języków: http://facebook.github.io/zstd/#other-languages
the Guardian pisze że przeszedł z zlib na zstd:
-
Tyle to umiem odczytać z etykiet. Ale skąd się np. biorą różne kropki w ramach tego samego kompresora, czym się od siebie różnią?
Jak napisałem, 22 kropki odpowiadają ustawieniu które wybierasz: od -1 do -22. Tradeoff między kosztem i stopniem kompresji.
W gzip miałeś 9 możliwości: od -1 do -9, więc jest 9 kropek.
Z oryginalnego artykułu o zstd: https://code.facebook.com/posts/1658392934479273/smaller-and-faster-data-compression-with-zstandard/
"At Facebook, we find the default level 3 suitable for many use cases, but from time to time, we will adjust this slightly depending upon what our bottleneck is (often we are trying to saturate a network connection or disk spindle); other times, we care more about the stored size and will use a higher level."
Żadnym ekspertem od kompresji nie jestem, ale uczyli mnie, że współcześnie kody Huffmana to już raczej nie rdzeń a bardzie dodatkowa kompresja pomocnicza. Tak, że na pewno postęp, ale raczej nie przełom.Kodowanie entropijne (Huffman, arytmetyczne, teraz ANS) to jest jakby serce kompresora.
Wcześniej masz różne transformacje, jak Lempel-Ziv w zip, rar, zstd: kopiujesz powtarzające się podciągi, np. https://pl.wikipedia.org/wiki/LZ78
Potem zliczasz wystąpienia symboli żeby oszacować prawdopodobieństwa (modelowanie statystyczne) i na końcu "pompujesz" tą całą informację przez koder entropijny - który optymalnie powinien użyć log(1/p) dla symbolu o prawdopodobieństwie p (zna zamodelowane prawdopodobieństwa).
Huffman używa pełnych bitów, przybliżając prawdopodobieństwa potęgami 1/2 - dając nieoptymalną kompresję.
Arytmetyczne i ANS używają praktycznie dokładnych prawdopodobieństw - potrafią operować na ułamkowych bitach dzięki specjalnemu buforowi (przedział w arytmetycznym, jedna liczba naturalna w ANS).
Przed 2014 to finalne "przepompowanie informacji" było Huffmanem (szybkie ale niedokładne) lub kodowaniem arytmetycznym (dokładne ale kosztowne).
Natomiast nowe kompresory robią to ANS który jest dokładny i szybki ... no i z Polski.
-
Obrazek to z open source kompresora Facebook zstd - po lewej masz szybkość kompresji (kropki to wybrany parametr od 1 do 22): od np. 4x szybciej niż standardowy zlib (zip-y), aż do znacznie lepszej maksymalnej kompresji ... potem dekodowanie jest ze 3x szybsze niż dla zip.
Jest 7-zip z zstd: https://github.com/mcmilk/7-Zip-zstd/releases
Na poziomie kodowania "entropijnego" (serce kompresorów), w 2013 state-of-art dla dekodowania Huffmana (m.in. zip, rar, jpg, png, mp3, pdf) to było ~200MB/s rdzeń i7, dla arytmetycznego (lepsza kompresja, m.in. współczesne kompresory wideo, LZNA (7-zip, xz)) rzędu 50MB/s.
Obecnie implementacje Huffmana przyśpieszyły do ~1000MB/s na tym samym procesorze ... a ANS (kompresja jak w arytmetycznym) do ~1500MB/s.
Czyli ~30x przyśpieszenie na poziomie software w ciągu 3 lat dla podstawowej czynności: https://sites.google.com/site/powturbo/entropy-coder
-
Chyba wszyscy informatycy słyszeli o kodowaniu Huffmana - jest ono szybkie ale niedokładne (przybliża prawdopodobieństwa potęgami 1/2), lepszy stopień kompresji daje kodowanie arytmetyczne, tyle że jest znacznie bardziej kosztowne obliczeniowo (potrzebuje mnożenia).
Okazuje się że od 2014 nowe kompresory są oparte już na innym kodowaniu (ANS), które pochodzi z Uniwersytetu Jagiellońskiego - jest ono dokładne i tanie obliczeniowo (nie potrzebuje mnożenia):
Wikipedia: https://en.wikipedia.org/wiki/Asymmetric_Numeral_Systems
wiadomość z UJ: http://www.uj.edu.pl/wiadomosci/-/journal_content/56_INSTANCE_d82lKZvhit4m/10172/134381865
materiały: http://encode.ru/threads/2078-List-of-Asymmetric-Numeral-Systems-implementations
Przykładowo obecnie domyślny kompresor Apple (LZFSE), czy open-source kompresor z Facebook (Zstandard), który ma aspiracje do wyparcia standardowego gzip/zlib (zip-y) jako że jest kilkukrotnie szybszy i pozwala na znacznie lepszą kompresję:
https://github.com/facebook/zstd


Kodowanie Huffmana wypierane przez ANS pochodzące z Polski (m.in. Apple, Facebook, Google)
w Programowanie
Napisano
Po Google, teraz próba patentowania przez Microsoft: https://www.theregister.com/2021/03/13/microsoft_ans_patent/
JPEG XL na ANS już można włączyć m.in. w Chrome, Firefox, Edge https://en.wikipedia.org/wiki/JPEG_XL
Świeża dyskusja: https://news.ycombinator.com/item?id=27577328