Transkribus

Transkribus logo

Transkribus to platforma dostępna jako aplikacja desktopowa (Windows, macOS, Linux) oraz usługa webowa, rozwijana przez READ-COOP. Służy do rozpoznawania pisma ręcznego (HTR) i druku (OCR) w dokumentach historycznych, takich jak księgi metrykalne, akta sądowe, rejestry ludności czy listy.

Narzędzie działa w oparciu o modele uczenia maszynowego, które można trenować na własnych materiałach lub korzystać z gotowych modeli dla wybranych języków i stylów pisma.

Główne funkcjonalności

  • automatyczna transkrypcja pisma ręcznego (HTR),

  • rozpoznawanie druku (OCR),

  • możliwość trenowania własnych modeli pisma,

  • obsługa dokumentów wielostronicowych,

  • segmentacja stron (linie, regiony tekstu),

  • eksport transkrypcji do formatów tekstowych (TXT, DOCX, PDF, XML),

  • praca zespołowa i wersjonowanie transkrypcji.

Wykorzystanie narzędzia w genealogii

Transkribus jest szczególnie przydatny genealogom pracującym z:

  • XIX-wiecznymi i wcześniejszymi metrykami kościelnymi,

  • aktami stanu cywilnego w języku rosyjskim, łacińskim lub niemieckim,

  • dużymi seriami dokumentów o powtarzalnej strukturze.

Pozwala znacząco skrócić czas ręcznej transkrypcji aktów, zwłaszcza gdy:

  • badania obejmują setki stron z tej samej parafii lub urzędu,

  • pismo jest jednolite (np. jeden proboszcz, jeden urzędnik),

  • celem jest dalsza analiza danych, a nie tylko pojedynczy odczyt.

Wskazówki i porady

  • Najlepsze efekty daje trenowanie własnego modelu na kilkudziesięciu ręcznie przepisanych stronach.

  • Narzędzie wymaga wstępnej nauki i cierpliwości, nie jest to rozwiązanie typu „kliknij i gotowe”.

  • Wyniki zawsze należy weryfikować ręcznie, szczególnie imiona, nazwiska i daty.

  • Model wytrenowany dla jednej parafii lub regionu często sprawdza się także w sąsiednich.