Uživatelská editace - Přepis OCR

Systém RETROBI nabízí uživatelům možnost upravovat podoby textového přepisu lístku, čímž umožňuje průběžně zpřesňovat vyhledávání a okamžité získání validních a formátovaných dat pro export. Uživatelská editace je přístupná registrovaným uživatelům a je koncipována jako dvoustupňová: lze volit mezi přepisem OCR a segmentací lístku (Možnost segmentovat lístek zatím není pro katalog Staročeské sbírky aktivována.

Výchozí textová data v systému tvoří automaticky získané OCR přepisy jednotlivých lístků, které samozřejmě vzhledem k jejich různorodosti mohou mít velmi rozdílnou kvalitu, což se pak zpětně odráží v možnostech vyhledávání v textových datech. Údaje z ručně psaných lístků či lístků se špatnou obrazovou kvalitou (průklepový papír, vpisky atp.) tak nemusí být pro vyhledávání vůbec dostupné. Ambicí systému RETROBI je nabídnout uživatelům možnost korigovat prezentovaná data a korigovaná data nabízet k okamžitému využití. Přepisy OCR či segmentace lístků tak mohou výrazně napomoci jak lepším možnostem vyhledávání, tak lze jejich pomocí získat přehlednější a kvalitnější podobu exportovaných dat.

Přepis OCR

Základní úrovní je editace OCR přepisu lístku. Editační okno má registrovaný uživatel k dispozici u každého jednotlivého lístku i s předvyplněnou stávající podobou OCR přepisu lístku. V editačním okně může uživatel text OCR přepisu korigovat a následně uložit do systému.

Momentem uložení do systému získá lístek status "Přepsaný". V nově vytvořeném přepisu je možno vyhledávat a je možno jej přes funkci schránka exportovat v libovolné rešerši. Zároveň je o tomto automaticky informován administrátor systému, který v případě správného přepisu může lístek uzamknout a pro další přepis uzavřít. Do této doby je u lístku připojena informace, že byl editován uživatelem, a je možno jej do definitivního uzamčení nadále editovat.

Rozcestník