Przejdź do głównej treści

Widok zawartości stron Widok zawartości stron

Pomiń baner

Widok zawartości stron Widok zawartości stron

Humanistyka cyfrowa

Trzydniowe seminarium pod tytułem PODSTAWY HUMANISTYKI CYFROWEJ DLA PRZEKŁADOZNWCÓW:

 

Widok zawartości stron Widok zawartości stron

prof. Maciej Piasecki, dr Ewa Rudnicka, prof. Piotr Pęzik - CLARIN ERIC — CLARIN-PL: otwarta infrastruktura badawcza technologii językowych współtworzona przez użytkowników. 

prof. Maciej Piasecki, dr Ewa Rudnicka, prof. Piotr Pęzik - CLARIN ERIC — CLARIN-PL: otwarta infrastruktura badawcza technologii językowych współtworzona przez użytkowników. 

Abstrakt:

Technologia językowa umożliwia analizę tekstów i nagrań mowy, lecz w dalszym ciągu jej zastosowanie wymaga od użytkownika pewnej wiedzy informatycznej i językoznawczej. CLARIN ERIC to europejska infrastruktura badawcza dla nauk humanistycznych i społecznych (http://clarin.eu), której głównym celem jest ułatwianie i wspieranie zastosowań technologii językowych w badaniach. CLARIN-PL (http://clarin-pl.eu) jest integralną polską częścią CLARIN ukierunkowaną na język polski oraz zastosowania wielojęzyczne. W ramach wystąpienia przedstawimy ofertę CLARIN dla użytkowników naukowych obejmującą: językowe zasoby naukowe, narzędzia do przetwarzania tekstów, analityczne aplikacje badawcze oraz system repozytoriów i centrów infrastruktury (technologicznych i wiedzy). CLARIN, a w szczególności CLARIN-PL (dzięki finansowaniu przez MNiE), jest otwartą infrastrukturą badawczą, od samego początku (2008 rok) zaangażowaną w rozwój otwartej nauki. CLARIN-PL jest w dużej mierze rozwijana we współpracy z użytkownikami w oparciu o konkretne problemy badawcze i zbiory danych.

W toku wystąpienia przybliżymy uczestnikom elementy oferty CLARIN-PL, które wiążą się szczególnie z tematyką Letniej Szkoły Przekładoznawstwa: wielojęzycznych zasobów językowych (leksykalnych i korpusów), narzędzi leksykograficznych i korpusowych oraz narzędzi wspierających badania ilościowe i jakościowe nad literaturą. Do poszczególnych zagadnień wrócimy bardziej szczegółowo w drugim wykładzie.

 

Wykladowcy:

Zdjęcie portretowe dr hab. inż. Macieja PiaseckiegoDr hab. inż. Maciej Piasecki, prof. PWr. w ramach Katedry Sztucznej Inteligencji Politechniki Wrocławskiej. Jest autorem licznych prac naukowych w dziedzinach: inżynierii języka naturalnego, językoznawstwa komputerowego, leksykografii, humanistyki cyfrowej a także sztucznej inteligencji w szerszym zakresie. Jest jednym ze współtwórców CLARIN-PL (http://clarin-pl.eu) – polskiej części europejskiej infrastruktury badawczej technologii językowych CLARIN ERIC (http://clarin.eu). Od 2012 jest polskim koordynatorem narodowym CLARIN oraz koordynatorem konsorcjum naukowego CLARIN-PL. W latach 2018-2022 pełnił przez dwie kadencję rolę przewodniczącego rady National Coordinators Forum of CLARIN ERIC. Od 2005 roku kieruje nieprzerwanie pracami zespołu budującego i rozwijającego Słowosieć (ang. plWordNet, http://plwordnet.pwr.edu.pl) wielki relacyjny słownik semantyczny języka polskiego wraz z jego kompletnym rzutowaniem na Princeton WordNet dla języka angielskiego. Jest członkiem rady międzynarodowego towarzystwa naukowego Global WordNet Association. Koordynował i kierował pracami wielu dużych projektów badawczych, badawczo-rozwojowych oraz infrastrukturalnych, w tym CLARIN-PL-Biz (http://clarin.biz) – jednego z największych polskich projektów w dziedzinie rozwoju sztucznej inteligencji. Jest współautorem wielu zasobów i narzędzi językowych, szczególnie dla języka polskiego. Pracuje jako członek komitetów programowych wielu międzynarodowych konferencji naukowych z dziedziny inżynierii języka naturalnego, językoznawstwa komputerowego i sztucznej inteligencji.

 

Zdjęcie portretowe dr Ewy RudnickiejDr Ewa Rudnicka, adiunkt w Katedrze Sztucznej Inteligencji Wydziału Informatyki i Telekomunikacji Politechniki Wrocławskiej, wcześniej związana z Instytutem Filologii Angielskiej Uniwersytetu Wrocławskiego. Od 2012 pracuje w Centrum Technologii Językowych CLARIN-PL (przy KSI PWr.) jako koordynator prac lingwistycznych w obrębie dwujęzycznych zasobów leksykalnych oraz powiązanych korpusów wielojęzycznych i innych zasobów językowych. Prace te obejmujące przede wszystkim rzutowanie Słowosieć (ang. plWordNet, wielki relacyjny słownik semantyczny języka polskiego) na Princeton WordNet 3.1 w połączeniu z enWordNet (znaczące rozszerzenie WordNet 3.1). W rezultacie powstał jeden z największych otwartych, polsko-angielskich słowników semantycznych. Uczestniczy również w pracach związanych z budową i rozszerzaniem innych wielojęzycznych zasobów językowych. Zainteresowania naukowe dr Rudnickiej koncentrują się ostatnio na zagadnieniu ekwiwalencji translatorycznej oraz jego interpretacji w kontekście dwujęzycznych leksykalnych sieci semantycznych, np.

  • In Search of Gaps between Languages and Wordnets: the Case of Polish-English WordNet. Ewa Rudnicka,  Łukasz Grabowski,  Maciej Piasecki,  Tomasz Naskręt. International Journal of Lexicography, Volume 36, Issue 1, March 2023, Pages 68–92, https://doi.org/10.1093/ijl/ecac005 (otwarty dostęp);

  • Sense Equivalence in plWordNet to Princeton WordNet Mapping. Ewa Rudnicka,  Maciej Piasecki,  Francis Bond,  Łukasz Grabowski,  Tadeusz Piotrowski. International Journal of Lexicography, Volume 32, Issue 3, September 2019, Pages 296–325, https://doi.org/10.1093/ijl/ecz004 (otwarty dostęp).

 

Zdjęcie portretowe dr hab. Piotra PędzikaDr hab. Piotr Pęzik, prof. UŁ pracuje w Instytucie Anglistyki. Jest autorem prac naukowych i rozwiązań informatycznych z dziedziny językoznawstwa korpusowego i komputerowego. Odbył kilkuletni staż naukowy w grupie Ekstrakcji Informacji Europejskiego Instytutu Bioinformatyki w Cambridge, był konsultantem Institut für Deutsche Sprache w Mannheim w zakresie wielkoskalowych narzędzi korpusowych, członkiem Aston Institute for Forensic Linguistics oraz członkiem Konsorcjum Narodowego Korpusu Języka Polskiego. Pracował jako konsultant naukowy sektora prywatnego (np. Pfizer UK, Transition Technologies, Voicelab.AI) w zakresie systemów ekstrakcji informacji z danych językowych. Autor wyszukiwarek frazeo.pl i monitorcorpus.com, słowników kombinatorycznych HASK EN i HASK PL, korpusów konwersacyjnych SpokesPL/ Spokes-BIZ, główny autor wyszukiwarki PELCRA dla NKJP oraz wyszukiwarki korpusu tekstów równoległych Paralela. W części prac naukowych podejmuje tematykę wykorzystania dużych korpusów referencyjnych i równoległych w warsztacie i dydaktyce tłumaczy, zwłaszcza w obszarze frazeostylistyki tłumaczeniowej.