Przejdź do głównej treści

Widok zawartości stron Widok zawartości stron

Pomiń baner

Widok zawartości stron Widok zawartości stron

Humanistyka cyfrowa

Trzydniowe seminarium pod tytułem PODSTAWY HUMANISTYKI CYFROWEJ DLA PRZEKŁADOZNWCÓW:

 

Widok zawartości stron Widok zawartości stron

prof. Maciej Piasecki, dr Ewa Rudnicka, prof. Piotr Pęzik - CLARIN-PL w badaniach translatorycznych, pracy tłumacza i badaniach nad literaturą.

prof. Maciej Piasecki, dr Ewa Rudnicka, prof. Piotr Pęzik - CLARIN-PL w badaniach translatorycznych, pracy tłumacza i badaniach nad literaturą.

Abstrakt:

Otwarta infrastruktura badawcza CLARIN-PL (http://clarin-pl.eu) oferuje bardzo bogatą gamę różnorodnych zasobów i narzędzi badawczych dla nauk humanistycznych i społecznych. W trakcie wystąpienia skupimy się na tych, które mają bezpośrednie zastosowanie w tłumaczeniach oraz przekładoznawstwie. Ponadto przedstawimy szereg dalszych innowacyjnych narzędzi i metod analizy tekstów rozwijanych przez CLARIN-PL, które mogą znaleźć zastosowanie w tych dziedzinach. Przekładoznawcy mogą być szczególnie zainteresowani: dwujęzycznymi zasobami leksykalnymi, korpusami wielojęzycznymi oraz narzędziami do ich budowy, przeszukiwania i analizy. Jądrem zasobów leksykalnych CLARIN-PL jest Słowosieć (http://plwordnet.pwr.edu.pl) - wielki relacyjny słownik języka polskiego i jego kompletne rzutowanie na rozszerzony Princeton WordNet 3.1, analogiczny zasób dla języka angielskiego. Omówimy zarówno samą strukturę Słowosieci jak i założenia oraz doświadczenia wyniesione z procesu ręcznego rzutowania pomiędzy oboma leksykalnymi bazami danych. Omówimy stosowane narzędzia leksykograficzne oraz możliwości wykorzystania samych zasobów, jak też opracowanej technologii w tłumaczeniach i przekładoznawstwie. Następnie przedstawimy przegląd dwu lub wielojęzycznych korpusów tekstów wraz z systemami ich przeszukiwania, analizy, rzutowania i analizy kolokacji. Zaprezentujemy również przegląd aplikacji badawczych do analizy stylometrycznej, semantycznej, tematycznej, analizy wydźwięku oraz porównywania korpusów, które mogą być stosowane dla tekstów w kilku językach. Omówimy ich przykładowe zastosowania w przekładoznawstwie. W ostatniej część wykładu skoncentrujemy się na przedstawieniu możliwości oferowanych przez rozwijane w CLARIN-PL eksperymentalne, badawcze metody analizy semantycznej tekstów wykorzystujące neuronowe modele językowe, zarówno na poziomie leksykalnym, jak i struktury tekstu.

 

Wykladowcy:

Zdjęcie portretowe dr hab. inż. Macieja PiaseckiegoDr hab. inż. Maciej Piasecki, prof. PWr. w ramach Katedry Sztucznej Inteligencji Politechniki Wrocławskiej. Jest autorem licznych prac naukowych w dziedzinach: inżynierii języka naturalnego, językoznawstwa komputerowego, leksykografii, humanistyki cyfrowej a także sztucznej inteligencji w szerszym zakresie. Jest jednym ze współtwórców CLARIN-PL (http://clarin-pl.eu) – polskiej części europejskiej infrastruktury badawczej technologii językowych CLARIN ERIC (http://clarin.eu). Od 2012 jest polskim koordynatorem narodowym CLARIN oraz koordynatorem konsorcjum naukowego CLARIN-PL. W latach 2018-2022 pełnił przez dwie kadencję rolę przewodniczącego rady National Coordinators Forum of CLARIN ERIC. Od 2005 roku kieruje nieprzerwanie pracami zespołu budującego i rozwijającego Słowosieć (ang. plWordNet, http://plwordnet.pwr.edu.pl) wielki relacyjny słownik semantyczny języka polskiego wraz z jego kompletnym rzutowaniem na Princeton WordNet dla języka angielskiego. Jest członkiem rady międzynarodowego towarzystwa naukowego Global WordNet Association. Koordynował i kierował pracami wielu dużych projektów badawczych, badawczo-rozwojowych oraz infrastrukturalnych, w tym CLARIN-PL-Biz (http://clarin.biz) – jednego z największych polskich projektów w dziedzinie rozwoju sztucznej inteligencji. Jest współautorem wielu zasobów i narzędzi językowych, szczególnie dla języka polskiego. Pracuje jako członek komitetów programowych wielu międzynarodowych konferencji naukowych z dziedziny inżynierii języka naturalnego, językoznawstwa komputerowego i sztucznej inteligencji.

 

Zdjęcie portretowe dr Ewy RudnickiejDr Ewa Rudnicka, adiunkt w Katedrze Sztucznej Inteligencji Wydziału Informatyki i Telekomunikacji Politechniki Wrocławskiej, wcześniej związana z Instytutem Filologii Angielskiej Uniwersytetu Wrocławskiego. Od 2012 pracuje w Centrum Technologii Językowych CLARIN-PL (przy KSI PWr.) jako koordynator prac lingwistycznych w obrębie dwujęzycznych zasobów leksykalnych oraz powiązanych korpusów wielojęzycznych i innych zasobów językowych. Prace te obejmujące przede wszystkim rzutowanie Słowosieć (ang. plWordNet, wielki relacyjny słownik semantyczny języka polskiego) na Princeton WordNet 3.1 w połączeniu z enWordNet (znaczące rozszerzenie WordNet 3.1). W rezultacie powstał jeden z największych otwartych, polsko-angielskich słowników semantycznych. Uczestniczy również w pracach związanych z budową i rozszerzaniem innych wielojęzycznych zasobów językowych. Zainteresowania naukowe dr Rudnickiej koncentrują się ostatnio na zagadnieniu ekwiwalencji translatorycznej oraz jego interpretacji w kontekście dwujęzycznych leksykalnych sieci semantycznych, np.

  • In Search of Gaps between Languages and Wordnets: the Case of Polish-English WordNet. Ewa Rudnicka,  Łukasz Grabowski,  Maciej Piasecki,  Tomasz Naskręt. International Journal of Lexicography, Volume 36, Issue 1, March 2023, Pages 68–92, https://doi.org/10.1093/ijl/ecac005 (otwarty dostęp);

  • Sense Equivalence in plWordNet to Princeton WordNet Mapping. Ewa Rudnicka,  Maciej Piasecki,  Francis Bond,  Łukasz Grabowski,  Tadeusz Piotrowski. International Journal of Lexicography, Volume 32, Issue 3, September 2019, Pages 296–325, https://doi.org/10.1093/ijl/ecz004 (otwarty dostęp).

 

Zdjęcie portretowe dr hab. Piotra PędzikaDr hab. Piotr Pęzik, prof. UŁ pracuje w Instytucie Anglistyki. Jest autorem prac naukowych i rozwiązań informatycznych z dziedziny językoznawstwa korpusowego i komputerowego. Odbył kilkuletni staż naukowy w grupie Ekstrakcji Informacji Europejskiego Instytutu Bioinformatyki w Cambridge, był konsultantem Institut für Deutsche Sprache w Mannheim w zakresie wielkoskalowych narzędzi korpusowych, członkiem Aston Institute for Forensic Linguistics oraz członkiem Konsorcjum Narodowego Korpusu Języka Polskiego. Pracował jako konsultant naukowy sektora prywatnego (np. Pfizer UK, Transition Technologies, Voicelab.AI) w zakresie systemów ekstrakcji informacji z danych językowych. Autor wyszukiwarek frazeo.pl i monitorcorpus.com, słowników kombinatorycznych HASK EN i HASK PL, korpusów konwersacyjnych SpokesPL/ Spokes-BIZ, główny autor wyszukiwarki PELCRA dla NKJP oraz wyszukiwarki korpusu tekstów równoległych Paralela. W części prac naukowych podejmuje tematykę wykorzystania dużych korpusów referencyjnych i równoległych w warsztacie i dydaktyce tłumaczy, zwłaszcza w obszarze frazeostylistyki tłumaczeniowej.