Transkribus

Transkribus to platforma dostępna jako aplikacja desktopowa (Windows, macOS, Linux) oraz usługa webowa, rozwijana przez READ-COOP. Służy do rozpoznawania pisma ręcznego (HTR) i druku (OCR) w dokumentach historycznych, takich jak księgi metrykalne, akta sądowe, rejestry ludności czy listy.
Narzędzie działa w oparciu o modele uczenia maszynowego, które można trenować na własnych materiałach lub korzystać z gotowych modeli dla wybranych języków i stylów pisma.
Główne funkcjonalności
-
automatyczna transkrypcja pisma ręcznego (HTR),
-
rozpoznawanie druku (OCR),
-
możliwość trenowania własnych modeli pisma,
-
obsługa dokumentów wielostronicowych,
-
segmentacja stron (linie, regiony tekstu),
-
eksport transkrypcji do formatów tekstowych (TXT, DOCX, PDF, XML),
-
praca zespołowa i wersjonowanie transkrypcji.
Wykorzystanie narzędzia w genealogii
Transkribus jest szczególnie przydatny genealogom pracującym z:
-
XIX-wiecznymi i wcześniejszymi metrykami kościelnymi,
-
aktami stanu cywilnego w języku rosyjskim, łacińskim lub niemieckim,
-
dużymi seriami dokumentów o powtarzalnej strukturze.
Pozwala znacząco skrócić czas ręcznej transkrypcji aktów, zwłaszcza gdy:
-
badania obejmują setki stron z tej samej parafii lub urzędu,
-
pismo jest jednolite (np. jeden proboszcz, jeden urzędnik),
-
celem jest dalsza analiza danych, a nie tylko pojedynczy odczyt.
Wskazówki i porady
-
Najlepsze efekty daje trenowanie własnego modelu na kilkudziesięciu ręcznie przepisanych stronach.
-
Narzędzie wymaga wstępnej nauki i cierpliwości, nie jest to rozwiązanie typu „kliknij i gotowe”.
-
Wyniki zawsze należy weryfikować ręcznie, szczególnie imiona, nazwiska i daty.
-
Model wytrenowany dla jednej parafii lub regionu często sprawdza się także w sąsiednich.



