Wybrane metody prognozowania tempa rozwoju dyscyplin naukowych (indeks citing half-life, metoda regresji nieliniowej, linearyzowanej i wielomianowej drugiego stopnia)


Łukasz Opaliński 
http://orcid.org/0000-0003-2797-2777

Afiliacja: Oddział Informacji Naukowej, Biblioteka Politechniki Rzeszowskiej,  Polska

Marcin Jaromin 
http://orcid.org/0000-0002-7256-7271

Afiliacja: Zakład Biotechnologii i Bioinformatyki, Wydział Chemiczny, Politechnika Rzeszowska,  Polska

Abstrakt

Cel/Teza: Dokonano przeglądu oraz porównano wybrane statystyczne metody prognozowania tempa ewolucji dyscyplin naukowych. Materiał empiryczny badania stanowiły cytowania uzyskane przez publikacje należące do wybranych dyscyplin. Jednocześnie zaakcentowano problem warunków możliwości uogólnienia wyników badań prób losowych na szerszą populację generalną dokumentów.
Koncepcja/Metody badań: Na przykładzie danych empirycznych, na które złożyło się prawie 25 tys. cytowań, zademonstrowano metodę tworzenia przedziałów ufności dla indeksu citing half-life oraz metody ukierunkowane na uogólnienie i prognozę zidentyfikowanych w badaniu trendów. Były to: metoda regresji nieliniowej, metoda regresji linearyzowanej i metoda regresji wielomianowej drugiego stopnia.
Wyniki i wnioski: Problemy, jakie napotkały metody regresyjne, to fakt niespełniania przez nie określonych warunków Gaussa-Markova. Dla przeanalizowanych danych wykluczyło to zastosowanie podstawowych form modeli regresji jako narzędzi prognostycznych. Wymagane są korekty lub wykorzystanie innego rodzaju modeli, co stanowi perspektywę dalszych badań.
Oryginalność/Wartość poznawcza: W artykule zestawiono metody ilościowe, które nie są powszechnie stosowane w celu ewaluacji tempa rozwoju nauki. Zademonstrowano ich potencjał i użyteczność w tym względzie oraz zaznaczono potrzebę dalszego ich doskonalenia i testowania metod bardziej wyrafinowanych.

Słowa kluczowe

Bibliometria; Dziedziny i dyscypliny naukowe; Komunikacja naukowa; Naukometria; Prognozowanie; Rozwój nauki; Statystyka w informatologii

Aczel, A. D. (2007). Statystyka w zarządzaniu: pełny wykład. Warszawa: PWN.

Agarwal, B. L. (2009). Basic Statistics. New Delhi: New Age International.

Allen, M. P. (1997). Understanding Regression Analysis. New York: Plenum Press, https://doi.org/10.1007/b102242

Andersen, E. B., Jensen, N. E., Kousgaard, N. (1987). Statistics for Economics, Business Administration, and the Social Sciences. Berlin: Springer, https://doi.org/10.1007/978–3-642–95528-0

Benoit, K. (2011). Linear Regression Models with Logarithmic Transformations [online]. London School of Economics, [19.11.2019], https://kenbenoit.net/assets/courses/ME104/logmodels2.pdf

Bensman, S. J. (2000). Probability Distributions in Library and Information Science: A Historical and Practicioner Viewpoint. Journal of the American Society for Information Science, 51(9), 816–833, https://doi.org/10.1002/(SICI)1097-4571(2000)51:9<816::AID-ASI50>3.0.CO;2-6

Berk, K. N., Carey, P. (2010). Data Analysis with Microsoft Excel. Updated for Office 2007 . Boston: Brooks/Cole: Cengage Learning.

Bingham, N., Fry, J. (2010). Regression: Linear Models in Statistics. New York, London: Springer, https://doi.org/10.1007/978-1-84882-969-5

Borgman, Ch. L., Furner, J. (2002). Scholarly Communication and Bibliometrics. Annual Review of Information Science & Technology, 36(1), 3–72, https://doi.org/10.1002/aris.1440360102

Bucevska, V. (2011). Heteroscedasticity. In: M. Lovric (ed.). International Encyclopedia of Statistical Science (630–633). Berlin: Heidelberg: Springer, https://doi.org/10.1007/978-3-642-04898-2_628

Burton, R. E., Kebler, R. W. (1960). The ‘Half-Life’ of Some Scientific and Technical Literatures. American Documentation, 11(1), 18–22, https://doi.org/10.1002/asi.5090110105

Carlberg, C. (2012). Analiza statystyczna. Microsoft Excel 2010 PL. Gliwice: Helion.

Christensen, R. (2011). Plane Answers to Complex Questions: The Theory of Linear Models . New York: Springer, https://doi.org/10.1007/978-1-4419-9816-3

Crown, W. H. (1998). Statistical Models for the Social and Behavioral Sciences: Multiple Regression and Limited-dependent Variable Models. Westport, Conn.: Praeger.

Dowdy, S., Wearden, S., Chilko, D. (2004). Statistics for Research. Hoboken, New Jersey: John Wiley & Sons, Inc.

Dunn, O. J., Clark, V. (1987). Applied Statistics: Analysis of Variance and Regression. New York: Chichester [etc.]: John Wiley and Sons.Finkelstein, M. O., Levin, B. (2001). Statistics for Lawyers. New York: Springer, https://doi.org/10.1007/b97319

Freud, R. J., Littell, R. C. (2000). SAS System for Regression. Cary (North Carolina): SAS Institute.

Haefner, J. W. (2012). Modeling Biological Systems: Principles and Applications. Dordrecht: Springer Science & Business Media, https://doi.org/10.1007/b106568

Haynes, R. M. (1982). Environmental Science Methods. London: New York: Chapman and Hall.

Huitema, B. E. (2011). The Analysis of Covariance and Alternatives: Statistical Methods for Experiments, Quasi-experiments, and Single-case Studies. Hoboken, NJ: Wiley & Sons, https://doi.org/10.1002/9781118067475

Jarić, I., Knežević-Jarić, J., Lenhardt, M. (2014). Relative Age of References as a Tool to Identify Emerging Research Fields With an Application to the Field of Ecology and Environmental Sciences. Scientometrics, 100(2), 519–529, https://doi.org/10.1007/s11192-014-1268-9

Krzysztofiak, M., Luszniewicz, A. (1976). Statystyka. Warszawa: Polskie Wydaw. Ekonomiczne.

Larocque, D., Randles, R. (2008). Confidence Intervals for a Discrete Population Median. American Statistician, 62(1), 32–39, https://doi.org/10.1198/000313008X269738

McClave, J. T., Benson, G. (1988). Statistics for Business and Economics. San Francisco: Dellen Pub. Co., London: Collier Macmillan.

McPherson, G. (2001). Applying and Interpreting Statistics: A Comprehensive Guide. New York: Springer, https://doi.org/10.1007/978-1-4757-3435-5

Montgomery, D. C., Jennings, Ch., Kulahci, M. (2008). Forecasting and Time Series Analysis. New York: Wiley.

Oktaba, W. (1980). Metody statystyki matematycznej w doświadczalnictwie. Warszawa: PWN.

Opaliński, Ł. (2013). Wybrane aspekty metodologii badań cyklu życiowego publikacji naukowych. Przegląd Biblioteczny, 81(2), 152–171.

Opaliński, Ł. (2017a). Bibliometryczna metodologia prognozowania i oceny rozwoju dyscyplin naukowych. Analiza piśmiennictwa. Część I. Publikacje pionierskie, metoda powiązań bibliograficznych, metoda współcytowań i metoda współwystępowania specjalistycznej terminologii naukowej. Zagadnienia Informacji Naukowej – Studia Informacyjne, 55(1), 34–65.

Opaliński, Ł. (2017b). Bibliometryczna metodologia prognozowania i oceny rozwoju dyscyplin naukowych. Analiza piśmiennictwa. Część 2. Badania porównawcze, hybrydowe, statystyczne, analizy dokumentów patentowych, ścieżek rozwoju dyscyplin oraz pozostałe oryginalne podejścia metodologiczne. Zagadnienia Informacji Naukowej – Studia Informacyjne, 55(2), 73–105.

Opaliński, Ł., Jaromin, M. (2017). Zastosowanie statystycznej analizy szeregów czasowych do krótkoterminowego prognozowania rozwoju dyscyplin naukowych. Zagadnienia Informacji Naukowej – Studia Informacyjne, 55(2), 106–125.

Opaliński, Ł., Jaromin, M., Wikiera, J. (2015). Problem stabilności zachowań naukowców w zakresie cytowań w kontekście metodologii badań starzenia się publikacji naukowych i możliwość jego ujęcia ilościowego. Zagadnienia Informacji Naukowej – Studia Informacyjne, 53(2), 65–83.

Ott, L., Longnecker, M. (2010). An Introduction to Statistical Methods and Data Analysis. Belmont, CA: Brooks/Cole: Cengage Learning.

Rawlings, J. O., Pantula, S. G., Dickey, D. A. (1998) Applied Regression Analysis: A Research Tool. Berlin: Springer, https://doi.org/10.1007/b98890

Ross, S. M. (2009). Introduction to Probability and Statistics for Engineers and Scientists. Amsterdam: Elsevier Academic Press, https://doi.org/10.1016/B978-0-12-370483-2.X0001-X

Rousseau, R. (2006). Timelines in Citation Research. Journal of the American Society for Information Science and Technology, 57(10), 1404–1405, https://doi.org/10.1002/asi.20397

Sachs, L. (1984). Applied Statistics: A Handbook of Techniques. Berlin: Springer, https://doi.org/10.1007/978-1-4612-5246-7

Sen, B. K. (1999). Symbols and Formulas for a Few Bibliometric Concepts. Journal of Documentation, 55(3), 325–334, https://doi.org/10.1108/EUM0000000007149

Sen, A., Srivastava, M. (1990). Regression Analysis: Theory, Methods, and Applications. Berlin: Heidelberg: Springer, https://doi.org/10.1007/978-1-4612-4470-7

Shapiro, F. R. (1992). Origins of Bibliometrics, Citation Indexing, and Citation Analysis: The Neglected Legal Literature. Journal of the American Society for Information Science, 43(5), 337–339, https://doi.org/10.1002/(SICI)1097-4571(199206)43:5<337::AID-ASI2>3.0.CO;2-T

Sheskin, D. J. (2007). Handbook of Parametric and Nonparametric Statistical Procedures. Fourth Edition. Boca Raton: London: New York: Chapman & Hall/CRC, Taylor & Francis Group.

Snarska, A. (2011). Statystyka, ekonometria, prognozowanie: ćwiczenia z Excelem 2007. Warszawa: Wydaw. Placet.

Sobczyk, M. (2008). Prognozowanie. Teoria, przykłady, zadania. Warszawa: Wydaw. Placet.

Sobczyk, M. (2015). Statystyka. Warszawa: PWN.

Sosińska-Kalata, B., Roszkowski, M. (2016). Organizacja informacji i wiedzy. W: W. Babik (red.). Nauka o informacji (305–357). Warszawa: Wydaw. SBP.

Stefaniak, B., Skalska-Zlat, M., Cisek, S. (2016). Metody badań w nauce o informacji. W: W. Babik (red.). Nauka o informacji (89–122). Warszawa: Wydaw. SBP.

Stoodley, K. D. C., Lewis, T., Stainton, C. L. S. (1980). Applied Statistical Techniques. Chichester: Ellis Horwood.

Taylor, J. R. (2011). Wstęp do analizy błędu pomiarowego. Warszawa: PWN.

Thode, H. C. (2002). Testing for Normality. New York: Marcel Dekker.

Thode, H. C. (2011). Normality Tests. In: M. Lovric (ed .). International Encyclopedia of Statistical Science (1000–1002). Berlin: Heidelberg: Springer, https://doi.org/10.1007/978-3-642-04898-2_423

Vaughan, L. (2003). Statistical Methods for the Information Professional: A Practical, Painless Approach to Understanding, Using, and Interpreting Statistics. Medford, New Yersey: Information Today, Inc.

Vinkler, P. (1996). Relationships Between the Rate of Scientific Development and Citations. The Chance for Citedness Model. Scientometrics, 35(3), 375–386, https://doi.org/10.1007/BF02016908

Wetherill, G. B. (1981). Intermediate Statistical Methods. London: New York: Springer Netherlands, https://doi.org/10.1007/978-94-009-5836-4

Winston, W. L. (2014). Microsoft Excel 2013: analiza i modelowanie danych biznesowych. Warszawa: APN Promise.

Pobierz

Opublikowane: 2020-06-25



Łukasz Opaliński 
http://orcid.org/0000-0003-2797-2777

Afiliacja: Oddział Informacji Naukowej, Biblioteka Politechniki Rzeszowskiej,  Polska

Biogram:

Dr ŁUKASZ OPALIŃSKI uzyskał tytuł doktora w zakresie nauk humanistycznych w dyscyplinie bibliologia i informatologia, nadany w grudniu 2018 r. przez Radę Wydziału Zarządzania i Komunikacji Społecznej Uniwersytetu Jagiellońskiego, na podstawie rozprawy pt.: „Starzenie się publikacji naukowych w języku polskim i angielskim w perspektywie zachowań warunkujących proces cytowania w naukach o Ziemi”. Pracuje w Oddziale Informacji Naukowej Biblioteki Politechniki Rzeszowskiej na stanowisku kustosza.  Najważniejsze publikacje: (1) Opaliński, Ł. (2019). Cytowanie narzędziem zarządzania informacją: teoria zachowań informacyjnych. W: W. Babik (red.) Zarządzanie informacją (210–248). Warszawa: Wydaw. SBP.  (2) Opaliński, Ł., Jaromin, M. (2017). Zastosowanie statystycznej analizy szeregów czasowych do krótkoterminowego prognozowania rozwoju dyscyplin naukowych. Zagadnienia Informacji Naukowej – Studia Informacyjne, 55(2), 106–125.

Marcin Jaromin 
http://orcid.org/0000-0002-7256-7271

Afiliacja: Zakład Biotechnologii i Bioinformatyki, Wydział Chemiczny, Politechnika Rzeszowska,  Polska

Biogram:

MARCIN JAROMIN pracuje na stanowisku asystenta w grupie pracowników badawczo-dydaktycznych w Zakładzie Biotechnologii i Bioinformatyki Politechniki Rzeszowskiej. Tytuł magistra inżyniera uzyskał w 2004 r. na Wydziale Chemicznym Politechniki Rzeszowskiej oraz, równolegle, w 2005 r. na Wydziale Elektrotechniki i Informatyki Politechniki Rzeszowskiej. Specjalizuje się w dziedzinie bioinformatyki i statystyki matematycznej. Najważniejsze publikacje: Bocian A., Buczkowicz, J., Jaromin, M., Hus, K. K., Legáth, J. (2019).  An Effective Method of Isolating Honey Proteins. Molecules, 24(13), 2399; Ciura, J., Bocian, A., Kononiuk, A., 
Szeliga, M., Jaromin, M., Tyrka, M. (2017). Proteomic Signature of Fenugreek Treated by Methyl Jasmonate
and Cholesterol. Acta Physiologiae Plantarum, 39, 112. 





CC BY-NC-ND 4.0 Uznanie autorstwa - Użycie niekomercyjne - Bez utworów zależnych 4.0 Międzynarodowe