Język naturalny w wyszukiwaniu informacji i problemy jego przetwarzania
Wiesław Babik
Afiliacja: Uniwersytet Jagielloński, Instytut Informacji Naukowej i Bibliotekoznawstwa, ul. prof. Stanisława Łojasiewicza 4, 30 – 348 Kraków, Polska
Abstrakt
Człowiek w przestrzeni informacyjnej posługuje się przede wszystkim językiem naturalnym, ale nie tylko. Istnieją również języki wyszukiwania informacji (języki indeksowania) o dość niepewnej przyszłości, głównie ze względu na obecne, coraz powszechniejsze tendencje do wyszukiwania informacji w systemach indeksowania za pomocą języków naturalnych. Przedmiotem mojego artykułu jest język naturalny w wyszukiwaniu informacji. Wyszukiwanie informacji jest jedną z podstawowych funkcji przetwarzania języka naturalnego. Celem artykułu jest odpowiedź na pytanie o stan zaawansowania i perspektywy dalszych prac nad wykorzystaniem języków naturalnych w procesie wyszukiwania informacji w systemach indeksowania i wyszukiwania, w tym w Internecie, na podstawie istniejącej literatury. Moja odpowiedź na to pytanie może stać się punktem wyjścia do dalszych rozważań nad szerszym włączeniem polskich informatyków w nurt badań ogólnych i aplikacyjnych.
Słowa kluczowe
NATURAL LANGUAGE; INFORMATION SEARCHING
Deskryptory Biblioteki Narodowej
1901-2000; 1945-1989; 1989-2000; 2001-; Języki informacyjne; Języki naturalne; Przetwarzanie języka naturalnego (NLP); System informacyjno-wyszukiwawczy; Wyszukiwanie informacji;Bibliografia
Babik W.: Generowanie języków informacyjno-wyszukiwawczych ze słowników terminologicznych. Kraków 1996.
Babik W.: Słowa kluczowe. Kraków 2010.
Belkin N.J.: Some(what) Grand Challenges for Information Retrieval. [online]. [dostęp: 1.05.2013]. Dostępny w World Wide Web <http://www.sigir.org/forum/2008 J/2008j-sigirforum-belkin.pdf>.
Bojar B.: Językoznawstwo dla studentów informacji naukowej. Warszawa 2005.
Chowdhury G.: Natural language processing. „Annual Review of Information Science and Technology”. 2003 vol. 37, pp. 51- 89.
Dobrowolski Z., Nicholas D.: Informacyjny gracz: nowa koncepcja użytkownika informacji. „Praktyka i Teoria Informacji Naukowej i Technicznej” 2001 nr ½, s. 4-9.
Dura E.: Natural Language in Information Retrieval. In: Computational Linguistics and Inteligent Text Processing. Lectures Notes in Komputer Science. 2003 vol. 2588, pp. 537-540.
Gontar B., Papińska-Kacperek J.: Semantyczne wyszukiwarki internetowe. „Acta Universitatis Lodziensis. Folia Oeconomica” 2011 vol. 261, s. 165 -179.
Jurafsky D., Martin J. H.: Speech and language processing. An introduction to Natural Language Processing Computational Linguistics and Speech Recognition. New Jersey 2000.
Kłopotek M. A.: Inteligentne wyszukiwarki internetowe. Warszawa 2001.
Malak P.: Indeksowanie treści. Porównanie skuteczności metod tradycyjnych i automatycznych. Warszawa 2012.
Malak P.: Rozwój badań nad przetwarzaniem języka naturalnego. „Zagadnienia Informacji Naukowej” 2010 nr 2(96), s. 21- 30.
Manning Ch. D., Raghavan P., Schutze H.: An introduction to information retrieval. Cambridge University Press 2009. [online]. [dostęp: 1.05.2013]. Dostępny w World Wide Web. <Http://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf>.
Murthy Kavi Narayana: Natural language processing. An information access perspective. Bangalore 2005.
Nowak P., Nowakowski P.: Infolingwistyka jako forma integracji językoznawstwa z nauką o informacji. W: Studia nad językiem, informacją i komunikacją. Pod red. W. Krzemińskiej i P. Nowaka. Poznań 2003, s. 193-203.
Piasecki M.: Cele i zadania lingwistyki informatycznej. W: Metodologie językoznawstwa. Współczesne tendencje i kontrowersje. Pod red. P. Stelmaszczyka. Kraków 2008, s. 258-290.
Słownik encyklopedyczny informacji, języków i systemów informacyjno-wyszukiwawczych. Oprac. B. Bojar. Warszawa 2002.
Słowniki komputerowe i automatyczna ekstrakcja informacji z tekstu. Pod red. W. Lubaszewskiego. Kraków 2009.
Świdziński M.: Lingwistyka korpusowa w Polsce – źródła, stan, perspektywy. „LingVaria” 2006 nr 1 s. 23-24. [online] [dostęp: 1.05.2013]. Dostępny w World Wide Web.<http://www2.polonistyka.uj.edu.pl/LingVaria/arcyhiwa/LV_1_2006_pdf/02_Swidzinski.pdf>.
Vetulani Z.: Human Language Technologies: Tradition and New Challenges. „Proceedings of Artificial Intelligence”. 2005, vol. 2(25), pp. 5-31.
Vetulani Z.: Komunikacja człowieka z maszyną. Komputerowe modelowanie kompetencji językowej. Warszawa 2004.
Afiliacja: Uniwersytet Jagielloński, Instytut Informacji Naukowej i Bibliotekoznawstwa, ul. prof. Stanisława Łojasiewicza 4, 30 – 348 Kraków, Polska
Biogram:
Utwór dostępny jest na licencji Creative Commons Uznanie autorstwa – Użycie niekomercyjne – Bez utworów zależnych 4.0 Międzynarodowe.
CC BY-NC-ND 4.0 Uznanie autorstwa - Użycie niekomercyjne - Bez utworów zależnych 4.0 Międzynarodowe