O projektu
Snad jako každého nás unesla schopnost zahraničních nástrojů komplexně opravovat chyby v angličtině. Chyb kolem sebe v češtině vídáme opravdu nemálo, a tak nás napadlo se o něco podobného pokusit i pro naši mateřštinu.
Více než dva roky vývoje
Po více než dvou letech vývoje tak představujeme výsledek našeho úsilí. Ještě nejsme v cíli, i s omezenými zdroji jsme ale došli daleko dál, než kterýkoliv jiný dostupný nástroj. A naše cesta tady rozhodně nekončí. Nejlepší způsob, jak nám pomoct vytvořit ještě lepší korekthor, je pořídit si předplatné. Vyjde vás to na méně než jedno kafe měsíčně za nejpokročilejší automatickou opravu češtiny!
Pro koho korekthor je?
Korekthor nenahradí znalost češtiny (alespoň zatím). Poslouží ale jako druhý pár očí, který vás na chyby upozorní. Přitom vy byste je možná přehlédli. Vyhodnocení, zda na doporučení nástroje dáte, je už na vás.
Neuronové sítě
Po vzoru úspěšných zahraničních nástrojů jsme místo algoritmického přístupu sáhli po neuronových sítích. Ty si modelujeme i trénujeme sami. Korekthor tak narozdíl od kteréhokoliv jiného dostupného systému dokáže opravit i chyby závislé na kontextu.
Co všechno korekthor opraví?
Níže najdete výčet chyb, které se korekthor snaží opravovat. Různé chyby označuje korekthor s různou úspěšností.
Chyby hledané neuronovými sítěmi
- Chybějící/přebývající čárka
- Velká písmena u slov, kde záleží na jejich kontextu
- I/Y/A na konci slov
- Rozdíl mezi slovy jakýkoliv a kterýkoliv
- Chybné tvary zájmena jenž
- Rozdíl mezi J a N na začátku zájmena (ji/ni, jíž/níž apod.)
- Rozdíl mezi jsi a si
- Rozdíl mezi kromě a mimo
- Chybné tvary zájmen který a jaký
- Rozdíl mezi mě a mně
- Chybějící/přebytečná mezera za jednotkou (např. 10%/10 %)
- Chybná délka předložky (s/se, z/ze apod.)
- Rozdíl mezi S a Z na začátku slova
- Rozdíl mezi s sebou a sebou
- Oprava překlepů, které vytvoří platné slovo ze slovníku
Chyby hledané algoritmicky
- Rozdíl mezi spojovníkem a pomlčkou
- Oprava anglických uvozovek ("x") na české („x“)
- Chybná pozice interpunkce na konci citace („x,“/„x“,)
- Změna třech teček na výpustku
- Oprava překlepů, které nevytvoří platné slovo ze slovníku
- Odstranění symbolu ,-
- Nahrazení běžných mezer za nedělitelné mezery
- Velká písmena u slov, kde nezáleží na jejich kontextu
- Odstanění násobných interpunkcí a mezer