Korektury a příprava stránek k překladu

Z thewoodcraft.org
Stránka byla naposledy editována 1.8.2024

Hlavním tématem wiki TheWoodcraft.org je vše kolem woodcraftu, ale neméně důležitou součástí jsou i manuály. Kdo s wiki začíná, ten se bez nich obejde, protože základní editace wiki je snadná. Přihlášenému uživateli stačí kliknout na záložku „Editovat” a může rovnou psát. Neboť i ty základní věci, jako např. „Jak udělám nový odstavec?“, „Jak udělám tučný text?”, „Jak udělám nadpis?”, jsou snadné. A i začátečník zvládně opravit překlep – stačí otevřít stránku k editaci, vyhledat text kde je chyba, opravit a opravený kód uložit. Ale dá se toho dělat mnohem víc, ovšem to už záleží jen na vás, co se chcete dozvědět a naučit.

Každý z vás může být užitečný. Nebojte se ptát. Relativně nejsnazší cestou, jak se něco naučit, jsou korektury stránek digitalizovaných dokumentů. Nemusíte nic vymýšlet. Stačí umět číst a psát. A pokud chcete sami začít publikovat, můžete začít v rámci své uživatelské stránky. O těch ale píšu jinde (viz Uživatel:Keny/ Uživatelské stránky).

Tato stránka je pro ty, co se zajímají o to, jaké uvozovky psát, jaký je rozdíl mezi použitými pomlčkami, nebo jim vrtá hlavou, jaký význam mají tři tečky…

PoznámkaO použití výpustek při citacích, viz též Nápověda:Jak psát poznámky pod čarou

Psaní neobvyklých znaků pomocí kódů

Korektury se většinou neobejdou bez psaní méně obvyklých znaků. Řada lidí ani neví, jak se správně jmenují, proto jsem už před nějakým časem napsal stránku o tom jak převádět text do elektronické formy, kde je i tabulka méně obvyklých znaků s nimiž se lze nejčastěji setkat při korekturách.

Ty můžete odtamtud, v případě potřeby, kopírovat pomocí copy (CTRL+c) → paste (CTRL+v), ale nakonec stejně zjistíte, že je jednodušší si těch pár kódů zapamatovat. Každý operační systém totiž disponuje nějakým způsobem, jak se dají napsat.

PoznámkaKódy znaků lze použít ke zobrazení znaku i v HTML sekvenci. Např. znak (SPHERICAL ANGLE) má ASCII kód ∢ a UNICODE ∢
MS Windows
V prostředí MS Windows, lze psát neobvyklé znaky pomocí ASCII kódů. A to tak, že se přidrží levý ALT a naťuká číselný kód, který odpovídá číslu příslušného znaku v tabulce ASCII.
Linux
V linuxovém prostředí existuje možností více. U všech distribucí by mělo fungovat (podobně jako u MS Windows) zadání přes kód příslušného znaku. Rozdíl je pouze v tom, že se nezadává kód ASCII, ale UNICODE.
Dělá se to ale trochu jiným způsobem. A to tak, že se nejprve musí aktivovat zadávání znaku přes jeho unicode hodnotu a to tím, že…
  1. Stisknete současně klávesy CTRL+SHIFT+u, načež se zobrazí podtržené malé u
  2. V tuto chvíli můžete stisknuté klávesy pustit a začít psát UNICODE kód. Nemusíte při tom řešit aktuálně zvolený layout klávesnice. Akceptovány jsou výchozí hodnoty kláves. Tedy horní řada kláves jako čísla a písmena, jako písmena.
  3. Po zapsání kódu, např. u2222 stisknete Enter a místo zmíněné sekvence se zobrazí znak
Linuxové prostředí ale nabízí také alternativní možnost psaní neobvyklých znaků s využitím klávesy Compose.
Tato metoda je založena na skládání znaků. Např. znak se zapíše tak, že se po stisku klávesy Compose postupně stiskne (, c a )

Symboly kláves pro popis sekvencí:

Klávesa Compose, též Multi key symbol (U+2384 COMPOSITION SYMBOL)
Klávesa mezerník, též Space, symbol (U+23B5 BOTTOM SQUARE BRACKET)
Klávesa Enter, též Return, symbol (U+23CE RETURN SYMBOL)
Souběžné přidržení klávesy, symbol + (U+002B PLUS SIGN)
Následující klávesa, symbol (U+2192 RIGHTWARDS ARROW)
Výsledek zobrazený po zadání sekvence, symbol (U+21D2 RIGHTWARDS DOUBLE ARROW)
Kulaté závorky naznačují, že je potřeba zadávat znaky při stisknuté klávese Alt.

Zápis výše uvedených sekvencí zadání znaku prostřednictvím kódu: MS Windows: Alt + ( 8 → 7 → 3 → 8 ) ⇒ ∢ Linux: Ctrl + Shift + u → 2 → 2 → 2 → 2 → ⏎ ⇒ ∢

PříkladKlávesa Compose (Multi_Key) nemusí být ve výchozím stavu k žádné konkrétní klávese na klávesnici přiřazená, ale pro linuxový X server není problém si ji namapovat na některou z nepoužívaných kláves. Takto mám přemapovanou klávesu č. 94 já:
user@stroj:~$ cat .Xmodmap 
! Set compose key
keycode 94 = Multi_key
! Replace Down key
keycode 135 = Hyper_L
Více viz můj blogpost ze 30. ledna 2017: Psaní zřídkavě užívaných znaků v linuxovém prostředí
PoznámkaPozn: Na klávesu č. 135 mám namapovanou aplikaci, která mi dělá screenshot aktivního okna.
Mac OS
U operačního systému Mac OS se využívá pro psaní neobvyklých znaků klávesa Option [1] ale není to tak intuitivní jako když se používá Compose klávesa.[2] Je také možné zadávat neobvyklé znaky pomocí UNICODE kódu, ovšem na rozdíl od linuxu se tahle možnost musí nejprve povolit v nastavení klávesnice.

Výpustky v textu a jejich příprava na překlad

Interpretace znaku (trojtečka, též výpustka, eng. ellipsis, pl. wielokropek) závisí na umístění v textu:

Tři tečky umístěné hned za slovem
Následuje-li trojtečka bezprostředně za posledním znakem, naznačují odmlčení, resp. nedopovězení vyřčené věty. V textu též naznačuje, že podstatu sdělení lze dále (blíže neurčeným způsobem) rozvíjet. Např. větu „Jdi spát, nebo…” můžeme číst buď jako skrytou výhružku, či nabídku jiné alternativy činnosti. Záleží na kontextu.
Tři tečky oddělené mezerou
Naznačují, že část sdělení, která není pro čtenáře důležitá, byla vypuštěna. Proto se také v češtině používá pro 3 tečky následující po sobě výraz výpustka. Chceme-li napsat, jak někdo počítá po jedné do sta, stačí napsat: „Jedna, dvě, …, padesát, … sto!“

U textů, určených překladu se s tímto znakem setkáváme nejčastěji u citací.

, který se má překládat, se vymezuje pomocí elementu <translate> … </translate> Všimli jste si? I v tomto konkrétním případě zastupuje trojtečka vypuštěný text.

Vyskytne-li se v něm trojtečka, která zastupuje vypuštěný text, musí být vyjmuta z překladu. A protože z textu toho může být vyjmuto víc, použijeme slovní pojmenování dots, nikoliv číselné. Takto: <translate> … <tvar|dots>…</> … </translate> V jedné logické větě, určené k překladu, by se víc než jedna výpustka objevit neměla, ale kdyby snad náhodou, bude vyjmutý obsah v obou případech stejný, tudíž nemůže dojít záměně.

Je-li v jedné větě výpustek víc, je víc než zřejmé, že jde o sdělení složené z několika vět. Proto je třeba věnovat při korekturách digitalizovaných textů umístěných do wiki zvýšenou pozornost obsahu sdělení. Protože ten, kdo značkuje text, ho rozděluje na logické celky se kterými budou pracovat překladatelé. Ukážeme si to na příkladu:

Příklad
Tonda řekl: „Půjdeme ven, … a kromě toho si zahrajeme fotbal.”

První část sdělení tvoří samostatný logický celek, který by mohl znít taky takto:

„Půjdeme ven,” řekl Tonda a pokračoval:

proto výše uvedenou větu rozdělíme takto:

<translate>Tonda řekl: „Půjdeme ven,</translate>
…
<translate>a kromě toho si zahrajeme fotbal.”</translate>

Dál už bude záležet na překladateli, jak si s tím poradí.

Pomlčky

Není pomlčka jako pomlčka. Pomlčka, kterou najdete na klávesnici - je ve skutečnosti znak (U+002D HYPHEN-MINUS). Na této wiki se využívá především u medialonů. Pokud má někdo dvě příjmení, používá se jako spojovník (bez mezer), jinak odděluje občanské jméno od přezdívky (z obou stran je oddělen mezerami). Viz např. Vladimír Hulín-Mihalec - Lelašikah

Klasická pomlčka (U+2013 EN DASH)[3] je znak s jiným UNICODE kódem a mimo ni existuje i tzv. dlouhá pomlčka (U+2014 EM DASH)[4].

Dlouhou pomlčku lze v textu použít jako alternativu k normální pomlčce oddělené od textu mezerami. V takovém případě se ovšem píše bez mezer. Na wiki TheWoodcraft.org, však oddělujeme pomlčku mezerami vždy! Mezerami se neodděluje pouze spojovník. jako např. v sousloví „fire-drill”, atp.

Dlouhá pomlčka se také používá před jmény u citátů. Viz příklad:

   „Nepochválím-li se sám, nikdo to za mne neudělá.“
   —Jára Cimrman 

Zcela specifickým typem pomlčky je pomlčka, která se používá při psaní čísel (U+2012 FIGURE DASH), která má stejnou délku jako je šířka čísla u zvoleného fontu – to ovšem platí jen u fontů kde všechna čísla mají stejnou šířku znaku. Tato pomlčka se používá všude tam, kde je zapotřebí místo čísla uvést pomlčku. To ovšem neplatí při zápisu rozsahu čísel, kde slovní vyjádření "od … do …" zastupuje pomlčka.

Spojovníky a zlomková čára

Jsou to znaky podobné pomlčkám, které však mají svůj specifický význam. Znak spojovník (U+2010 HYPHEN), který z laického pohledu vypadá rovněž jako pomlčka, se zobrazuje, jen pokud dojde na dělení slova. Díky němu textový editor (resp. webový prohlížeč) pozná, pokud se slovo ocitne na konci řádku, kde ho rozdělit a kterou část má umístit na další řádek. Od znaku (U+002D HYPHEN-MINUS) se liší tím, že pokud není zrovna text zalomený, není vidět.

Ovšem spojovník se nepoužívá v typografii jen při dělení slov na konci řádku, ale také ke spojení dvou slov do jednoho, např. u jména, nebo v případě, že za slovesem následuje koncovka „-li”. Pro tyto případy exituje tzv. nezalomitelný spojovník (U+2011 NON-BREAKING HYPHEN).

Skrytý spojovník se do textu na wiki TheWoodcraft.org nejčastěji vloudí při kopírování textu. U digitalizovaných dokumentů záleží na tom, co rozpozná software použitý k OCR.

Všeobecně platí že zde používáme jen nezalomitelné spojovníky (U+2011 NON-BREAKING HYPHEN) a znak - (U+002D HYPHEN-MINUS). Pokud tedy na některé stránce narazíte na slovo rozdělené spojovníkem, je potřeba spojovník odstranit, nebo (pokud jde o spojení dvou slov) nahradit spojovníkem nezalomitelným. Slova, rozdělená spojovníkem na konci stránky vždy scelujeme.

PoznámkaPosledním znakem podobným pomlčce, ovšem se zcela jiným významem, je vodorovná čára (U+2015 HORIZONTAL BAR), která bývá často zaměňována za dlouhou pomlčku, ovšem ve skutečnosti jde o vodorovnou alternativu matematického lomítka "⁄" (U+2044 FRACTION SLASH).

Mezery

Kromě nezalomitelného spojovníku, je potřeba zmínit také nezalomitelnou mezeru. Webové prohlížeče totiž neřeší počítačovou sazbu – zobrazují jen to, co je v kódu a tak jak jim přikazuje aktuální CSS styl. Obvykle tedy pro ně mezera je znakem, kde mohou text zalomit. Jsou ale situace kdy chceme, aby slova odddělené mezerami, zůstaly pohromadě na jednom řádku. To je situace, kdy potřebujeme použít nezalomitelnou mezeru. Ta ovšem může být dvou typů. „Pružná” a „nepružná” (angl. hard space či též fixed space)(U+00A0 NO-BREAK SPACE).[5]. Liší se od sebe tím, že u pružné mezery si upravuje šířku prohlížeč dynamicky.

Mezera s nulovou šířkou

Tenhle speciální znak využívám hlavně u manuálů, kdy nechci aby wiki interpretovala zobrazený kód. Pro wiki je totiž mezera s nulovou šířkou (U+200B ZERO WIDTH SPACE) znak jako každý jiný.

Upozornění Mezera s nulovou šířkou je velice záludný znak, který může zkomplikovat život těm, co by chtěli kód z příkladu 1:1 zkopírovat.

Uvozovky

Pravidla pro psaní uvozovek, nejsou jednoduchá. Na české wikipedii je o tom celá stránka, přečtěte si ji! Najdete tam i tabulku, ve které je uvedeno, jak který z těch znaků správně napsat. Jiné uvozovky se totiž používají v českém textu[6], jiné v anglickém[7] a jiné v polském[8]. Na wiki TheWoodcraft.org najdete texty ve více jazycích, takže se potkáte i s různými typy uvozovek.

Tady se zmíním především o použití tzv. strojopisných uvozovek, což sice typografického hlediska nejsou ty správné uvozovky, nicméně je najdete na každé klávesnici. Pro ně je typické, že NEMAJÍ levý (otevírací) a pravý (uzavírací) znak – v obou případech se používá jeden a ten samý.

Uvozovky "
Tento typ uvozovek je „záchraným kruhem” pro ty, co nemají možnost použít správný typ uvozovek, či neví jaké uvozovky mají v konkrétní situaci použít. Obvykle se do nich uzavírají hodnoty atributů, které se občas vyskytují ve wikikódu. Například je-li potřeba uvést u tabulky třídu (class), která se má použít.
Apostrof '
Apostrof NENÍ uvozovka, i když se také používá jako alternativa jednoduchých uvozovek. Apostrofy[9] se v rámci wiki kódu využívají ke zvýraznění textu, viz Nápověda: Jak editovat stránku. U českého textu se s nimi setkáme jen výjimečně, ale v angličtině se používá hodně.[10] V angličtině se také často setkáme i tím, že vypadá jako anglická jednoduchá uzavírací uvozovka, či znak, kterým je v textu naznačen ráz [11] V této formě se obvykle používá, pokud se vyskytne na začátku, nebo na konci slova.

A nyní již k uvozovkám v typografii. U těch se vždy liší otevírací znak od uzavíracího, ale bohužel neexistuje žádná jednotná celosvětová konvence kdy a co se má používat. Záleží tedy na citu, osobním vkusu autora a místních zvyklostech.

Jednoduché uvozovky
U českých textů vypadají takto: ₉ ⁶[12] ale v angličtině <tvar name="2">⁶ ⁹[13]. U anglických textů se jednoduché uvozovky používají jako sekundární, tj. je-li citována nějaká citace.
Dvojité uvozovky
U českých textů vypadají takto ₉₉ ⁶⁶[14], ale v angličtině ⁶⁶ ⁹⁹[15]. U anglický textů se lze také setkat s tím, že jsou uvedeny uvozovky jen na začátku odstavce. Podle českých pravidel je v uvozovkách celý odstavec, pokud nemá text v uvozovkách odstavců více. V takovém případě se uvádí jen otevírací uvozovka u prvního odstavce a uzavírací u posledního.
Francouzské uvozovky (též zvané boční)
Na které narazíme spíš u starších českých textů, bývají většinou zdvojené » «[16], ale i jednoduché › ‹[17].
Občas se používají i jako alternativní znak pro symbol odrážky.

Psaní závorek

Závorky jsou u wikikódu velice důležité. Jednoduché se používají v textu, ale zdvojené a ztrojené už mají svůj speciální význam. Je to párový znak, to znamená, že pokud levou závorkou něco otevřeme, měli bychom to pravou závorkou také uzavřít. Chybějící závorka – to je nejčastější chyba, která se může snadno přihodit když pracujete se šablonami.

Závorky jsou různých typů, proto je důležité znát, vědět jak se jim říká, jak se píší a kdy, a k čemu se používají:

Kulaté závorky ( )
V MediaWiki žádný speciální význam nemají.
Špičaté závorky < >
Používá se pro ně též synonymum „šipky”, či „menšítko” (pro levou závorku) a „většítko” (pro pravou závorku). Sám používám výraz lomená závorka, ale pro ty se používá jiný znak: ⟨ ⟩[18]. S těmito závorkami se pracuje v HTML. Systém MediaWiki je interpretuje jedině tehdy, když vymezují nějaký HTML element, který se má zpracovat.
Hranaté závorky [ ]
Jsou základním formátovacím prvkem pro generování odkazů. Viz nápověda.
Složené závorky { }
Jsou základním formátovacím prvkem pro práci se šablonami. Viz nápověda.

Jak navazovat

Digitalizovaný text se nedá z principu zpracovat stejným způsobem jako originální text na papíře. Doporučuji tedy nejprve přečíst můj článek na téma Korektury digitalizovaných knih a slovo o logice psaného textu, který vše podrobně rozebírá.

Zde se omezím jen na to, jak u digitalizovaných stránek správně ošetřit obsah, který pokračuje. Nejčastěji se to týká odstavce (kontinuální text), ale může se to týkat i tabulky, číslovaných odstavců, atp.

Navazování textu

Při korektuře je tedy potřeba sledovat, jak stránka končí. Pokud text pokračuje…

…na následující stránce
Použijeme bezprostředně na konci odstavce susbstituční šablonu {{NEXT}} a pokud končí spojovníkem, doplníme chybějící část podle následující strany. Bude-li text pokračovat novým odstavcem, umístíme substituční šablonu {{NEXT}} na nový řádek.
…na stránce, co následuje až za stránkou s ilustrací
Postupujeme stejným způsobem. Ale po uložení otevřeme kód opět k editaci, a přidáme šabloně {{next}} jako parametr číslo stránky, kde text pokračuje.

Na cílové stránce, kde je pokračování textu použijeme podle situace buď substituční šablonu {{CONT}} pokud text navazuje, nebo {{FROM}} začíná-li novým odstavcem.

Upozornění Substituční šablona {{CONT}} se umisťuje bezprostředně na začátek textu. Mezeru za ni v žádném případě nepatří! Protože by se ocitla po vložení stránky na singlepage stránku na začátku řádku a text by ze zobrazil jako typu precopy (neproporcionálním strojopisem). Ale nezapomeňte vynechat první řádek.

Bez toho, by při spojení stránek na singlepage stránce došlo ke spojená posledního slova z předchozí stránky s prvním ze stránky následující bez mezery – ten vynechaný řádek bude interpretován jako mezera. Ovšem kdyby ty prázdné řádky byly dva, bylo by to interpretováno jako nový odstavec. Takže pozor.

Substituční šablona {{FROM}}, by měla být umístěna na samostatném řádku a text dalšího odstavec začínat až o řádek níž. Jinak pokud jde o pokračování z některé jiné než předchozí stránky, lze i v tomto případě použít jako parametr číslo stránky.

Začíná-li následující stránka nadpisem – vynechte před nadpisem alespoň jeden řádek.

Navazování odsazeného textu

Navazování tabulek

Jak řešit články na pokračování


  1. V prostředí MS Windows: levý ALT + 9001 – levý ALT + 9002; v linuxovém prostředí CTRL+SHIFT+U 2325
  2. Údajně by mělo jít nastavit klávesu Compose i v prostředí MacOS http://lolengine.net/blog/2012/06/17/compose-key-on-os-x
  3. V prostředí MS Windows se klasická pomlčka napíše přes levý ALT + 0150. V linuxu lze ji lze napsat přes unicode kód, nebo s využitím klávesy Compose přes dva mínusy za kterými následuje tečka ⎄ → - → - → . ⇒ –
  4. V prostředí MS Windows se dlouhá pomlčka napíše přes levý ALT + 0151. V linuxu lze ji lze napsat přes unicode kód, nebo tím, že stiskneme Compose a poté třikrát mínus ⎄ → - → - → - ⇒ —
  5. V prostředí MS Windows ji napíšeme přes levý Alt + 160 nebo levý Alt + 255 a v linuxu můžeme využít buď zápis přes UNICODE, kombinaci pravý Alt + Space, nebo stisk klávesy Compose a dvakrát mezerník ⎄ → ⎵ → ⎵ ⇒ ⎵
    • „České uvozovky” jsou na začátku dole a na konci nahoře. V českých textech se používají i boční (francouzské) uvozovky, a »zdvojené«, nebo ›jednouché‹, které ukazují dovnitř.
    • Je-li součástí přímé řeči celý odstavec, píše se uvozovka na jeho začátku a na konci. Je-li těch odstavců více, píše se jen na začátku prvního a na konci posledního odstavce.
    • “Americké” uvozovky, jsou nahoře na začátku i na konci.
    • Je-li součástí přímé řeči celý odstavec, píše uvozovka jen na začátku každého odstavce co do ní patří.
    • „Polské uvozovky” se píší stejně jako české, až na to že ty boční se v polských textech používají obráceně (ukazují ven): «zdvojené», ale i ‹jednouché›
  6. V prostředí MS Windows napíšeme apostrof ' buď přímo přes klávesnici, nebo ASCII kódem přes levý ALT + 039; v linuxovém prostředí také buď přímo přes klávesnici, nebo UNICODE kódem CTRL+SHIFT+U a 0027 resp. ⎄ → ' → ' ⇒ ´
  7. Využívá se u zkrácenin jako např. I am == I'm, I am == I'm, she is == she's a pod. K naznačení vlastnického vztahu: Boy's comment (chlapecký komentář), Boys’ Hostel (chlapecké ubytování), nebo the dog's tail (psí ohon). Či při uvedení množného čísla tam, kde by jinak následovalo mnoho znaků s za sebou.
  8. I když vypadá stejně, má tento znak svůj vlastní UNICODE kód CTRL+SHIFT+U a 02bc
  9. V prostředí MS Windows se otevírací dolní jednoduchá uvozovka napíše přes levý ALT + 0130 (v linuxovém prostředí CTRL+SHIFT+U a 201a resp. ⎄ → ' → , ⇒ ‚). A horní jednoduchá uzavírací uvozovka přes levý ALT + 0145 (v linuxovém prostředí CTRL+SHIFT+U a 2018 resp. ⎄ → ' → > ⇒ ’).
  10. Otevírací horní jednoduchá uvozovka napíše přes levý ALT + 0145 (v linuxovém prostředí CTRL+SHIFT+U a 2018 resp. ⎄ → ' → < ⇒ ‘). A horní jednoduchá uzavírací uvozovka přes levý ALT + 0146 (v linuxovém prostředí CTRL+SHIFT+U a 2019 resp. ⎄ → ' → > ⇒ ’).
  11. 14,0 14,1 V prostředí MS Windows se otevírací dolní uvozovka ₉₉ napíše přes levý ALT + 0132 (v linuxovém prostředí CTRL+SHIFT+U a 201e resp. ⎄ → " → , ⇒ „). A horní uzavírací uvozovka ⁶⁶ přes levý ALT + 0147 (v linuxovém prostředí CTRL+SHIFT+U a 201c resp. ⎄ → " → < ⇒ “).
  12. Otevírací horní uvozovka ⁶⁶ napíše přes levý ALT + 0148 (v linuxovém prostředí CTRL+SHIFT+U a 201c resp. ⎄ → " → < ⇒ “). A horní uzavírací uvozovka ⁹⁹ přes levý ALT + 0146 (v linuxovém prostředí CTRL+SHIFT+U a 201d resp. ⎄ → " → > ⇒ ”).
  13. Otevírací uvozovka » napíše přes levý ALT + 0187 (v linuxovém prostředí CTRL+SHIFT+U a 00bb resp. ⎄ → > → > ⇒ »). A uzavírací uvozovka « přes levý ALT + 0171 (v linuxovém prostředí CTRL+SHIFT+U a 00ab resp. ⎄ → < → < ⇒ «).
  14. Otevírací uvozovka napíše přes levý ALT + 0155 (v linuxovém prostředí CTRL+SHIFT+U a 203a resp. ⎄ → . → > ⇒ ›). A uzavírací uvozovka přes levý ALT + 0139 (v linuxovém prostředí CTRL+SHIFT+U a 2039 resp. ⎄ → . → < ⇒ ‹).
  15. V prostředí MS Windows: levý ALT + 9001 – levý ALT + 9002; v linuxovém prostředí CTRL+SHIFT+U a 27e8 – CTRL+SHIFT+U 27e9