|
- 2017
Dijakronijski korpus bugarskoga jezika: trenutno stanje i perspektiveDOI: 10.21857/yrvgqtkj39 Keywords: dijakronijski korpus bugarskoga jezika, tra?ilica, specijalizirani program za Povijesni rje?nik bugarskoga jezika, morfolo?ko ozna?ivanje, gramati?ki rje?nik srednjovjekovnoga bugarskoga Abstract: Sa?etak U ?lanku se iznosi povijest stvaranja Dijakronijskoga korpusa bugarskoga jezika i digitalnih alata za obradu srednjovjekovnih crkvenoslavenskih tekstova potrebnih za izradu Povijesnoga rje?nika bugarskoga jezika na svemre?ju. Dijakronijski korpus uklju?uje tekstove razli?itih ?anrova kojima je dokazano bugarsko podrijetlo. Korpus je zasnovan na vlastitom programu koji omogu?uje primjereno komentiranje s paleografske, kodikolo?ke i tekstolo?ke to?ke gledi?ta. Tekstovi su digitalno tipizirani s pomo?u posebno konstruiranih starocrkvenoslavenskih UTF fontova. Trenutno imamo na raspolaganju tri fonta i pretvara? koji prethodno tipizirane tekstove koji nisu u Unicodeu prenosi u dokumente u Unicodeu. Do sada je u korpusu objavljeno vi?e od 130 tekstova, a jo? ih je u postupku pripreme za prijenos na mre?ne stranice. Korpus se nalazi na: http://histdict.uni-sofia.bg. Svaki je tekst uveden rubrikom koja sadr?i podatke o njegovu izvoru, dataciji, izdanju, autoru ili autorima itd. Mre?ne stranice uklju?uju i potpuno digitaliziranu ina?icu Starocrkvenoslavenskoga rje?nika (bug. Старобългарски речник), u?injenoga u Institutu za bugarski jezik BAS-a. Oboje, korpus i rje?nik, objavljeni su kao izvori u otvorenom pristupu, s tim da je korisnicima dopu?teno vidjeti samo potpuno ure?ene tekstove. Poseban je program stvoren za potrebe autora Povijesnoga rje?nika bugarskoga jezika. S obzirom na ?injenicu da je taj povijesni rje?nik zasnovan na digitalnoj ina?ici Starocrkvenoslavenskoga rje?nika, program omogu?uje ure?ivanje postoje?ih natuknica i stvaranje novih. Tako?er, izra?ena je tra?ilica kojoj je svrha olak?ati rad na novom rje?niku. Nedavno smo se usredoto?ili na stvaranje morfolo?koga ozna?iva?a (eng. tagger), ?iji je prototip tako?er dostupan na mre?nim stranicama. Morfolo?ki je ozna?iva? zasnovan na punom rasponu morfolo?kih oznaka te na gramati?kom rje?niku srednjobugarskoga rje?nika. Puni raspon morfolo?kih oznaka i gramati?ki rje?nik tako?er su dostupni na mre?nim stranicama, a zajedni?ki daju potpuni opis svih oblika u srednjocrkvenoslavenskim tekstovima
|