Vývoj DjVu v datech

Z thewoodcraft.org
Stránka byla naposledy editována 17.8.2023

Přehled verzí DjVu formátu

Vývoj DjVu formátu, a balíku nástrojů pro práci s tímto formátem s pracovním názvem DjVu Shop, probíhal v AT&T Laboratories v letech 1996-1999.

Konverze se prováděla pouze na příkazovém řádku. Jaký bude výsledek konverze bylo vidět až po konverzi, když se dokument otevřel v prohlížečce. Volba optimálních parametrů tak závisela na zkušenosti a odhadu tvůrce DjVu dokumentů.

DjVu dokument verze 16, 17

První beta verze aplikace DjVu Shop ukládala dokumenty ve verzi 16. A jako verzi 17 její, stále ještě neveřejný nástupce, DjVu Shop 2.0 Beta2.

DjVu dokument verze 18 a 19

Protože z uživatelského hlediska nebylo opakované zadávání konverzních parametrů komfortní, byl DjVu Shop (již pod vlajkou LizardTechu)) rozšířen o možnost využívat tzv. profil. Parametry uvedené v profilu nebylo nutné při konverzi zadávat na příkazové řádce. Stačilo pouze uvést - podle typu dokumentu - jaký profil se má použít.

Tato verze aplikace DjVu Shop 2.0.2, která ukládala soubory jako DjVu dokument verze 18, byla první komerčně distribuovanou aplikací pro tvorbu DjVu dokumentů.

Poslední verze DjVu formátu pod vlajkou AT&T měla číslo 19, ale dokumenty s tímto číslem verze se prakticky nevyskytují.

DjVu dokument verze 20

V dubnu 1999 totiž odkoupila práva na DjVu Shop od AT&T Laboratories fa. LizardTech a tato změna se projevila v tom, že rovnou změnila číslo verze na 20.

DjVu dokument verze 21

Po změně majitele práv následovalo v září 1999 rozšíření specifikace formátu a s tím i spojená změna čísla verze.

Nový formát pro svázané dokumenty
Tvorbu vázaných DjVu dokumentů umožňovala již aplikace DjVu Shop. A to buď konverzí dokumentů z bitmapových obrázků formátu BMP, GIF či JPG, nebo svázáním již hotových stránek v nativním DjVu formátu IW44. Problémem těchto svazků však bylo, že index svázaného dokumentu byl uchováván ve zvláštním souboru (djvudir.iff), bez kterého DjVu prohlížečka nebyla schopna s dokumentem pracovat jako se svazkem.
V původní specifikaci DjVu formátu, kterou uvolnila firma AT&T v dubnu r. 1999 však nebyla o svazcích žádná zmínka. Z toho lze soudit, že AT&T nepovažovalo stávající řešení vícestránkových svazků za konečné. LizardTech tedy změnil formát svazků[1] a rozšířil stávající specifikaci formátu DjVu.
Sdílená obrazová data u svazků
Formát svazků byl dále rozšířen o blok sdílených dat 'Djbz'. Tento blok obsahuje set zakomprimovaných vzorků (shapes), které se na jednotlivých stránkách svazku mohou opakovat. Vrstva 'Sjbz' jednotlivých stránek ve svazku tak nemusí obsahovat všechny vzorky, ale pouze ty, které nejsou součástí tohoto sdíleného bloku.
Skrytá textová vrstva
K obrazové vrstvě přibyla také skrytá textová vrstva.

S rozšířením formátu přišel LizardTech také s novými aplikacemi pro tvorbu DjVu dokumentů u kterých změnil číslo verze v názvu z 2.0 na 3.0.

DjVu Solo

Aby firma podpořila rozšíření DjVu formátu, nabídla k osobnímu použití bezplatnou aplikaci DjVu Solo 3.0[2] (kterou později nahradila verzí DjVu Solo 3.1). Všechny verze aplikace DjVu Solo ukládají konvertované dokumenty jako DjVu dokument verze 21.

Aplikace DjVu Solo byla určená pouze pro platformu MS Windows a licenčním ujednáním bylo omezeno veřejné publikování vytvořených dokumentů prostřednictvím internetu.

Document Express

Pro komerční účely a publikování DjVu dokumentů prostřednictvím internetu nabídla firma tři variace produktu pod názvem DocumentExpress[3]. První dvě variace Desktop a Proffesional byly z uživatelského hlediska velmi podobné. Lišily se především v tom, že lacinější verze Document Express Desktop umožňovala zpracovávat pouze jednostránkové dokumenty, kdežto Document Express Proffesional umožňoval pracovat se svazky.[4]

Variace Document Express Enterprise nebyla určena pro desktopové použití, ale pro nasazení na server. V této oblasti však Microsoft nedominoval, tak jako na desktopech, proto nebyla nabízena jen verze pro platformu MS Windows, ale do verze 5.1 i verze pro unix.[5]

Uvolnění formátu DjVu pod GPL2 licencí

Formát DjVu byl uvolněn pod licencí GPL2 v březnu 2001. Nejprve verze 2.0 a posléze i verze 3.5. Na jejím základě začal Léon Bottou[6] vyvíjet, jakožto odvozené dílo, opensource knihovnu DjVulibre.

Dvě důležité části původního DjVu enkodéru - Z-kodér a techniku maskování pozadí která se používá u iw44 enkodéru, však chrání několik patentů z nichž většinu vlastní AT&T[7]. Firma Lizardtech proto aby bylo možné formát pod GPL2 uvolnit získala na tyto patenty rozsáhlá práva a veřejným prohlášením poskytla pro tento formát a s ním spojené patenty pro použití v rámci GPL software trvalou volnou licenci.[8]

Text několika odstavců tohoto prohlášení však nebyl zcela jednoznačný a mohl bránit dalšímu vývoji opensource DjVu knihovny, proto dopisem z 19. června 2002 LizardTech pozměnil text omezujících odstavců tak, aby bylo zřejmé, že se omezení vztahuje pouze na jeho originální kód. Tím, že LizardTech výslovně zmínil, že se omezení vztahuje pouze na původní část kódu, umožnil další vývoj knihovny DjVuLibre pod GPL2, která kromě těchto původních patentově chráněných technologií knihovna již žádný jiný patentově chráněný kód nebsahuje[9].

DjVu dokument verze 22

DocumentExpress verze 3.5 a 3.5.4 ukládal dokumenty ve formátu DjVu verze 22 (resp. 23). Od verze 3.6, kdy byla implementována další rozšíření formátu DjVu, pak jako DjVu verze 24.

  • Jak DjVu Solo, tak DocumentExpress umožňovaly při konverzi dokumentů do DjVu zvolit podle typu předlohy jeden ze čtyř přednastavených profilů - skenovaný dokument, barevná fotografie, černobílý dokument a indexovaný dokument.
  • Objevily se také náhledy
  • Svazky dokumentů bylo možné uložit buď jako pevný, nebo volný svazek.
  • Obě aplikace také umožňovaly tvorbu hyperlinků

Rozdíl mezi komerční aplikací DocumentExpress a aplikací DjVu Solo byl především v dalších opravných algoritmech, které LizzardTech implementoval pouze u svých komerčních produktů. Aplikace pomocí těchto algoritmů při konverzi používá optimální segmentaci barevných vrstev, což se projeví zvláště při zpracování dokumentů, které byly nějakým způsobem poškozené (resp. obsahovují strojopis, čárovou grafiku atd.). Při obdobné kvalitě zpracování tak lze u DjVu souboru téže stránky dosáhnout mnohem lepšího kompresního poměru.

Dalším rozšířením komerční aplikace byla virtuální tiskárna, která umožňovala přímý tisk do DjVu


OCR od verze 3.5 omezení pouze na latinku

4.1.0 - nové možnosti poznámek - bitmapa, čára základní geometrické obrazce, polygon, přišpendlená poznámka Prvně se objevily záložky

V roce 2004 se objevila verze 5.0 (zmizely poznámky neboť značně zpomalovaly čtení a zvětšovaly objem souboru) Byly zakoupeny práva na engine ReadIris a objevil se nový modul Enterprise Workflow Manager

také se objevil vodoznak. Umožňoval ho přidávat výlučně Workflow manager Editace profilů -scénáře

Rozdíl mezi virtuálním tiskem do djvu a konverzí postscriptu do Djvu

V roce 2005 se objevila verze 6.0 [10]

  • Možnost editace záložek
  • rozšířené možnosti hyperlinků
  • Znovu se objevila možnost měření, která sice byla již ve verzi 4, musela však být zapsána v souboru.

DocumentExpress verze 6.0 ukládá dokumenty následovně: Starší dokument do kterého se přidá nějaké rozšíření se uloží jako verze 26. Pokud je tento dokument editován znovu a tato rozšíření se odstraní, pak se uloží jako verze 25. je to kvůli tomu, že prohlížečka pak zbytečně neprovádí některé procesy.


Secure DjVu

Upravený DjVu formát obsahující kryptované chunky - Secure DjVu (neboli "zabezpečené" DjVu) je implementován pouze v komerčním produktu DjVuExpress Enterprise a to od verze 6.1, kterou začal prodávat ještě LizardTech od června 2007

Specifikaci této úpravy formátu DjVu uvolnila fa. Celartem 25. září 2007. Tato "specifikace" však pouze popisuje jakým způsobem je kryptování implementováno na strukturu DjVu dokumentu. Vlastní kryptovací metody však součástí specifikace nejsou. Z toho důvodu nelze napsat opensource prohlížeč, který by byl schopen pracovat s takto "zabezpečenými" DjVu dokumenty. Tj. který by umožňoval jejich čtení.

I když by technicky bylo možné implementovat nějakou opensource kryptovací metodu, znamenalo by to ve skutečnosti pouze podporu proprietárního prohlížeče, neboť tu by mohl díky otevřenosti kódu Celartem bez problémů do svého produktu implementovat.

Navíc formát SecureDjVu není pouhým rozšířením původního DjVu formátu, ale dosti zásadním způsobem překopává jeho vnitřní strukturu. Ta umožňuje umístit do SDJV i nekryptované DjVu dokumenty, ale nezachovává zpětnou kompatibilitu.

Nejspíš i to je důvodem, proč DjVuLibre dokumenty tohoto typu ignoruje.

Celartem - Caminova 2007-?

Na konci roku 2007 koupila LizardTech japonská firma Celartem. Vedení této firmy pravděpodobně rozhodlo, že LizardTech bude do budoucna nabízet již pouze své produkty na základě formátu MrSid a tak přislíbené vydání aplikace Document Express Enterprise Edition 7.0 již proběhlo pod jejich vlajkou.

Zřejmě to však nebylo asi nejlepší řešení, neboť další vývoj a prodej produktové řady DocumentExpress převzala nově založená dceřinná společnost Celartemu založená r.2009 Caminova. Ta vydala r.2009 Document Express Editor verze 6.5 a v lednu 2010 vyšla i nová verze aplikace Document Express 7.5 Enterprise. Z hlediska funkcionality se však zdá, že žádný zásadní vývoj u těchto aplikací od r.2007 neproběhnul.

Konec komerčních DjVu aplikací

Po roce 2010 se firma LizardTech plně přeorientovala na GIS aplikace a oblast elektronického zpracování dokumentů přenechala komerčně úspěšnějším produktům firmy Adobe, které pracují s formátem PDF.

Konec komerčních aplikací neznamenal konec DjVu formátu. Bohužel opensource aplikace, která by nabídla obdobný komfort při editaci DjVu dokumentu jako DjVu Solo 3.1 zatím nevznikla. Objevily se ale jiné nástroje, které posunuly především možnosti zpracování textové vrstvy získané přes OCR. V současné době tak většina DjVu dokumentů vzniká konverzí z PDF.


  1. U původního formátu svazků (který nebyl součástí specifikace DjVu) každá jednotlivá stránka svázaného dokumentu odkazovala na index (identifikovaný jako 'DIR0'). Prohlížečka tedy nepracovala s jedním kořenovým dokumentem, ale s každou stránkou samostatně. V případě, že byl index poškozen (nebo byl nedostupný) přestaly stránky fungovat jako svazek. Nová specifikace vyřešila otázku svazků obráceně. Při prohlížení nepracuje prohlížečka rovnou s jednotlivými stránky svazku, ale s jedním kořenovým DjVu dokumentem, který obsahuje blok dat s indexem (indentifikovaný jako DIRM). Ten, podle typu svazku, obsahuje buď offsety na jednotlivé stránky nebo jména fyzických souborů, které jsou součástí svazku.
  2. O existenci formátu DjVu se autor tohoto manuálu prvně dozvěděl v roce 1999, během studií na Masarykově Univerzitě v Brně. Nejstarší zachovaný dokument v DjVu formátu (vlastní provenience) byl vytvořen během prvních pokusů v r. 2003, tehdy ještě na platformě MS Windows, právě aplikací DjVu Solo.
  3. Jen pro zajímavost zde uvádím jaké byly prodejní ceny těchto aplikací na jaře 2005:
    • Document Express Desktop 4.1 - $195
    • Document Express Professional 4.1 - $249
    • Document Express Enterprise 5.1 - $6500(!)
    Pozn.: v r. 2005 kurz koruny vůči dolaru poprvé v historii klesnul k hranici 22Kč/$1
    V současné době (podzim 2010) nabízí fa. Caminova tyto aplikace:
    • Document Express Desktop 6.5 - $39
    • Document Express Professional 6.5 - $149
    • Document Express Enterprise 7.5 - aktuální cenu se nepodařilo zatím zjistit
  4. V současné době obě variace vychází z původní verze Proffesional a jsou označovány jako DjVu Editor. Liší se tím, že variace Desktop neobsahuje OCR engine.
  5. Od verze 7.0 je však Document Express Enterprise díky vazbě na .NET a autorizační mechanismy MS svázan již výlučně s platformou MS Windows.
  6. Léon Bottou je jeden z původních vývojářů formátu DjVu
  7. Podrobně je popsána celá záležitost s patenty přímo ve zdrojových kódech DjVuLibre.
  8. Text tohoto prohlášení i elektronickou kopii dopisu v níž LizardTech upřesnil co je předmětem omezení můžete nalézt mezi Přílohami
  9. I když byl součástí uvolněného kódu původní Z-kodéru, který používal patentově chráněný aritmetický MEL kodér, používá DjVuLibre pro kompresi přepsanou opensource variantu s názvem ZP-kodér. I ta pochopitelně používá metody, které jsou patentově chráněné, ty však (na rozdíl MEL kodéru) LizardTech pro GPL použití uvolnil.
  10. verze 5.1 byla dodávaná ve dvou variacích Unlimited a Limited, která byla omezená na 25000 konverzí. DocumentExpress LizzardTech nikdy nenabídnul jako OEM, nebo jako Academic Edition.