Budowa i charakterystyka Korpusu Polskich Czasopism Naukoznawczych
Emanuel Kulczycki
Abstrakt
Cel/teza: Artykuł przedstawia Korpus Polskich Czasopism Naukoznawczych (KPCN), to jest specjalistyczny korpus stworzony w celu wsparcia badań w dziedzinie naukoznawstwa oraz jego rozwoju w Polsce.
Koncepcja/Metody badań: Budowa korpusu oparta była na digitalizacji wcześniej niezdigitalizowanych artykułów oraz pobieraniu tekstów ze stron internetowych czasopism naukowych i bibliotek cyfrowych, które zostały poddane metodom przetwarzania języka naturalnego.
Wyniki i wnioski: Możliwości KPCN zademonstrowano poprzez analizę modelowania tematycznego czasopisma „Nauka Polska”. Obecna wersja KPCN obejmuje 12 polskich czasopism naukowych z lat 1918–2020, zawierających łącznie 51 822 dokumenty.
Ograniczenia badań: Badanie uznaje pewne ograniczenia korpusu, zwłaszcza w kontekście przetwarzania języka naturalnego i optycznego rozpoznawania tekstu. Pomimo zauważonych ograniczeń, artykuł bada również możliwości przyszłego rozwoju korpusu.
Zastosowania praktyczne: W przyszłości korpus może ułatwić rekonstrukcję dyskursów związanych z nauką i szkolnictwem wyższym w Polsce, przyczyniając się do zwiększenia rozpoznawalności polskiego naukoznawstwa na arenie międzynarodowej.
Oryginalność/wartość: Budowa tego korpusu stanowi oryginalne przedsięwzięcie, obejmujące digitalizację i przetwarzanie artykułów naukowych z dziedziny naukoznawstwa. Ten wysiłek zaowocował stworzeniem unikatowego narzędzia do analizy dyskursów.
Słowa kluczowe
Bibliometria. Korpus tematyczny. Modelowanie tematyczne. Naukoznawstwo. Polska nauka.
Bibliografia
Choynowski, M. (1948). Life of Science. Synthese, 6(5/6), 248–251.
Fortunato, S., Bergstrom, C. T., Börner, K., Evans, J. A., Helbing, D., Milojević, S., Petersen, A. M., Radicchi, F., Sinatra, R., Uzzi, B., Vespignani, A., Waltman, L., Wang, D., & Barabási, A.-L. (2018). Science of science. Science, 359(6379), eaao0185-eaao0185. https://doi.org/10.1126/science.aao0185
Han, X. (2020). Evolution of research topics in LIS between 1996 and 2019: An analysis based on latent Dirichlet allocation topic model. Scientometrics, 125(3), 2561–2595. https://doi.org/10.1007/s11192-020-03721-0
Hübner, P. (1994). Siła przeciw rozumowi: Losy Polskiej Akademii Umiejętności w latach 1939–1989. Kraków: Wydawn. i Druk. „Secesja”.
Jo, T. (2019). Text Mining (Vol. 45). Springer International Publishing. https://doi.org/10.1007/978-3-319-91815-0
Kao, A., & Poteet, S. R. (2007). Natural language processing and text mining. Springer Science & Business Media.
Kawalec, P. (2017). Wizualizacja publikacji naukoznawczych – na przykładzie wybranych artykułów z „Zagadnień Naukoznawstwa”. Zagadnienia Naukoznawstwa, 53(4), 373–388.
Kawalec, P. (2019). Najnowsze postępy naukoznawstwa. Ruch Filozoficzny, 75(2), 33. https://doi.org/10.12775/RF.2019.019
Kawalec, P. (2020). Analiza poziomu umiędzynarodowienia Zagadnień Naukoznawstwa w kontekście światowych studiów nad nauką i szkolnictwem wyższym. Zagadnienia Naukoznawstwa, 55(1(219)), 33. https://doi.org/10.12775/ZN.2019.002
Kokowski, M. (2015). The Science of Science (Naukoznawstwo) in Poland: The Changing Theoretical Perspectives and Political Contexts – A Historical Sketch from the 1910s to 1993. Organon, 47, 147–237.
Kokowski, M. (2016). The Science of Science (naukoznawstwo) in Poland: Defending and Removing the Past in the Cold War. In: W E. Aronova & S. Turchetti (Eds.), Science Studies during the Cold War and Beyond (pp. 149–176). Palgrave Macmillan US. https://doi.org/10.1057/978-1-137-55943-2_7
Kowalczyk, K., Paszkowska, A., & Wójcik, J. (1969). Bibliografia zawartości „Życia Nauki” 1946–1952. Wrocław: Zakład Narodowy im. Ossolińskich.
Od Redakcji. (1994). Nauka, 1, 3–4.
Ossowska, M., & Ossowski, S. (1935). Nauka o nauce. Nauka Polska, 20, 1–12.
Ossowska, M., & Ossowski, S. (1964). The science of science. Minerva, 3(1), 72–82.
Ostrowicka, H., & Spychalska-Stasiak, J. (2017). Uodpowiedzialnianie akademii – formacje wiedzy i władza parametryzacji w dyskursie akademickim. Nauka i Szkolnictwo Wyższe, 49(1(49)), 105–132. https://doi.org/10.14746/NISW.2017.1.6
Rutkowski, J. (1947). O zadaniach Kół Naukoznawczych. Nauka Polska. Jej Potrzeby, Organizacja i Rozwój, 25, 303–309.
Sbalchiero, S., & Eder, M. (2020). Topic modeling, long texts and the best number of topics. Some problems and solutions. Quality & Quantity, 54(4), 1095–1108. https://doi.org/10.1007/s11135-020-00976-w
Schofield, A., Magnusson, M., & Mimno, D. (2017). Pulling Out the Stops: Rethinking Stopword Removal for Topic Models. In: Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics: Volume 2, Short Papers, 432–436. https://doi.org/10.18653/v1/E17-2069
Sugimoto, C. R., Li, D., Russell, T. G., Finlay, S. C., & Ding, Y. (2011). The shifting sands of disciplinary development: Analyzing North American Library and Information Science dissertations using latent Dirichlet allocation. Journal of the American Society for Information Science and Technology, 62(1), 185–204. https://doi.org/10.1002/asi.21435
Walentynowicz, B. (1975). The Science of Science in Poland: Present State and Prospects of Development. Social Studies of Science, 5(2), 213–222.
Wang, D., & Barabási, A.-L. (2021). The Science of Science (1st ed.). Cambridge University Press. https://doi.org/10.1017/9781108610834
Wang, Y.-X., & Zhang, Y.-J. (2013). Nonnegative Matrix Factorization: A Comprehensive Review. In: IEEE Transactions on Knowledge and Data Engineering, 25(6), 1336–1353. https://doi.org/10.1109/TKDE.2012.51
Zamecki, S. (2006). Wprowadzenie. Kwartalnik Historii Nauki i Techniki, 51(1), 5–7.
Zamecki, S. (2016). Problematyka naukoznawcza na łamach periodyku „Nauka Polska. Jej Potrzeby, Organizacja i Rozwój”. Studium historyczno-metodologiczne. Lata 1918–1947: T. CLXVI. Warszawa: Wydawnictwo IHN PAN.
Zamecki, S. (2017). O niektórych potrzebach nauki polskiej omawianych na łamach periodyku „Nauka Polska. Jej Potrzeby, Organizacja i Rozwój”. Lata 1918–1947. Aneks. Warszawa: Wydawnictwo IHN PAN.
Zamecki, S. (2018). Problematyka naukoznawcza na łamach periodyku „Nauka Polska. Jej Potrzeby, Organizacja i Rozwój”. Studium historyczno-metodologiczne. Lata 1992–2016. Warszawa: Wydawnictwo IHN PAN.
Zamecki, S. (2020). „Kwartalnik Historii Nauki i Techniki”—Ludzie i problemy. Lata 1956–1993. Warszawa: Wydawnictwo IHN PAN.
Utwór dostępny jest na licencji Creative Commons Uznanie autorstwa – Użycie niekomercyjne – Bez utworów zależnych 4.0 Międzynarodowe.
CC BY-NC-ND 4.0 Uznanie autorstwa - Użycie niekomercyjne - Bez utworów zależnych 4.0 Międzynarodowe