Transducers for annotating weather information in meteorological texts in Serbian
Transduktori za označavanje podataka o vremenskim prilikama u meteorološkim tekstovima na srpskom jeziku
Апстракт
We present a process of extracting information on meteorological phenomena from texts in Serbian. We used finite state automata and transducers for both text processing and information extraction, through software specialized for linguistic text processing. Information extraction was done by an- notating text segments. The extraction rules were described with transducers (finite state transducers and recursive transition networks). Some details of used transducers are presented in this paper, aiming to demonstrate the application of different electronic resources for Serbian, especially the electronic morphological dictionary. Transducers are very efficient tools for language processing. In the case of processing Serbian, it is very important to create different resources and corpora which could allow linguistic research. Therefore, we plan to form a collection of transducers and make it publicly available for different kinds of research in the computational linguistics domain.
U radu je prikazan jedan proces izdvajanja informacija o meteorološkim pojavama iz tekstova na srpskom jeziku. Obrada teksta, kao i samo izdvajanje informacija, vršeno je uz pomoć konačnih automata i transduktora, kreiranih i primenjenih pomoću programa specijalizovanih za lingvističku obradu teksta. Samo izdvajanje informacija vršeno je obeležavanjem segmenata teksta. Sva pravila korišćena za obeležavanje predstavljena su transduktorima (konačnim transduktorima i rekurzivnim mrežama prelaza). U radu su detaljno prikazani neki od korišćenih transduktora, sa ciljem da se demonstrira upotreba različitih elektronskih resursa srpskog jezika, na prvom mestu elektronskih morfoloških rečnika. Sami transduktori su veoma efikasno sredstvo za obradu jezika. U slučaju obrade srpskog jezika, kreiranje različitih resursa i korpusa koji bi omogućili lingvistička istraživanja veo- ma je važno. Stoga je planirano da se u budućnosti formira kolekcija transduktora koja bi bila javno dostupna i raspoloži...va za različite vrste istraživanja iz oblasti računarske lingvistike.
Кључне речи:
information extraction / Serbian / natural language processing / finite state transducers / recursive transition networks / ekstrakcija informacija / srpski jezik / obrada prirodnih jezika / konačni transduktori / rekurzivne mreže prelazaИзвор:
Infoteka, 2012, 13, 2, 36-51Издавач:
- Zajednica biblioteka univerziteta u Srbiji, Beograd
Институција/група
Poljoprivredni fakultetTY - JOUR AU - Pajić, Vesna AU - Vujičić-Stanković, Staša AU - Pajić, Miloš PY - 2012 UR - http://aspace.agrif.bg.ac.rs/handle/123456789/3059 AB - We present a process of extracting information on meteorological phenomena from texts in Serbian. We used finite state automata and transducers for both text processing and information extraction, through software specialized for linguistic text processing. Information extraction was done by an- notating text segments. The extraction rules were described with transducers (finite state transducers and recursive transition networks). Some details of used transducers are presented in this paper, aiming to demonstrate the application of different electronic resources for Serbian, especially the electronic morphological dictionary. Transducers are very efficient tools for language processing. In the case of processing Serbian, it is very important to create different resources and corpora which could allow linguistic research. Therefore, we plan to form a collection of transducers and make it publicly available for different kinds of research in the computational linguistics domain. AB - U radu je prikazan jedan proces izdvajanja informacija o meteorološkim pojavama iz tekstova na srpskom jeziku. Obrada teksta, kao i samo izdvajanje informacija, vršeno je uz pomoć konačnih automata i transduktora, kreiranih i primenjenih pomoću programa specijalizovanih za lingvističku obradu teksta. Samo izdvajanje informacija vršeno je obeležavanjem segmenata teksta. Sva pravila korišćena za obeležavanje predstavljena su transduktorima (konačnim transduktorima i rekurzivnim mrežama prelaza). U radu su detaljno prikazani neki od korišćenih transduktora, sa ciljem da se demonstrira upotreba različitih elektronskih resursa srpskog jezika, na prvom mestu elektronskih morfoloških rečnika. Sami transduktori su veoma efikasno sredstvo za obradu jezika. U slučaju obrade srpskog jezika, kreiranje različitih resursa i korpusa koji bi omogućili lingvistička istraživanja veo- ma je važno. Stoga je planirano da se u budućnosti formira kolekcija transduktora koja bi bila javno dostupna i raspoloživa za različite vrste istraživanja iz oblasti računarske lingvistike. PB - Zajednica biblioteka univerziteta u Srbiji, Beograd T2 - Infoteka T1 - Transducers for annotating weather information in meteorological texts in Serbian T1 - Transduktori za označavanje podataka o vremenskim prilikama u meteorološkim tekstovima na srpskom jeziku EP - 51 IS - 2 SP - 36 VL - 13 UR - https://hdl.handle.net/21.15107/rcub_agrospace_3059 ER -
@article{ author = "Pajić, Vesna and Vujičić-Stanković, Staša and Pajić, Miloš", year = "2012", abstract = "We present a process of extracting information on meteorological phenomena from texts in Serbian. We used finite state automata and transducers for both text processing and information extraction, through software specialized for linguistic text processing. Information extraction was done by an- notating text segments. The extraction rules were described with transducers (finite state transducers and recursive transition networks). Some details of used transducers are presented in this paper, aiming to demonstrate the application of different electronic resources for Serbian, especially the electronic morphological dictionary. Transducers are very efficient tools for language processing. In the case of processing Serbian, it is very important to create different resources and corpora which could allow linguistic research. Therefore, we plan to form a collection of transducers and make it publicly available for different kinds of research in the computational linguistics domain., U radu je prikazan jedan proces izdvajanja informacija o meteorološkim pojavama iz tekstova na srpskom jeziku. Obrada teksta, kao i samo izdvajanje informacija, vršeno je uz pomoć konačnih automata i transduktora, kreiranih i primenjenih pomoću programa specijalizovanih za lingvističku obradu teksta. Samo izdvajanje informacija vršeno je obeležavanjem segmenata teksta. Sva pravila korišćena za obeležavanje predstavljena su transduktorima (konačnim transduktorima i rekurzivnim mrežama prelaza). U radu su detaljno prikazani neki od korišćenih transduktora, sa ciljem da se demonstrira upotreba različitih elektronskih resursa srpskog jezika, na prvom mestu elektronskih morfoloških rečnika. Sami transduktori su veoma efikasno sredstvo za obradu jezika. U slučaju obrade srpskog jezika, kreiranje različitih resursa i korpusa koji bi omogućili lingvistička istraživanja veo- ma je važno. Stoga je planirano da se u budućnosti formira kolekcija transduktora koja bi bila javno dostupna i raspoloživa za različite vrste istraživanja iz oblasti računarske lingvistike.", publisher = "Zajednica biblioteka univerziteta u Srbiji, Beograd", journal = "Infoteka", title = "Transducers for annotating weather information in meteorological texts in Serbian, Transduktori za označavanje podataka o vremenskim prilikama u meteorološkim tekstovima na srpskom jeziku", pages = "51-36", number = "2", volume = "13", url = "https://hdl.handle.net/21.15107/rcub_agrospace_3059" }
Pajić, V., Vujičić-Stanković, S.,& Pajić, M.. (2012). Transducers for annotating weather information in meteorological texts in Serbian. in Infoteka Zajednica biblioteka univerziteta u Srbiji, Beograd., 13(2), 36-51. https://hdl.handle.net/21.15107/rcub_agrospace_3059
Pajić V, Vujičić-Stanković S, Pajić M. Transducers for annotating weather information in meteorological texts in Serbian. in Infoteka. 2012;13(2):36-51. https://hdl.handle.net/21.15107/rcub_agrospace_3059 .
Pajić, Vesna, Vujičić-Stanković, Staša, Pajić, Miloš, "Transducers for annotating weather information in meteorological texts in Serbian" in Infoteka, 13, no. 2 (2012):36-51, https://hdl.handle.net/21.15107/rcub_agrospace_3059 .