Crowdsourcingowy model wielojęzycznego korpusu tekstów literackich i bazy wiedzy: studium przypadku transnarodowej twórczości Marka Twaina – projekt The Global Huck


Amel Fraisse 

Afiliacja: GERiiCO, University of Lille, France,  Francja

Ronald Jenn 

Afiliacja: CECILLE, University of Lille, France,  Francja

Quoc-Tan Tran 

Afiliacja: GERiiCO, University of Lille, France,  Francja

Abstrakt

CEL/TEZA: Przedstawiono nowe podejście do tworzenia wielojęzycznych korpusów tekstów literackich, które w sposób symbiotyczny łączy zbiorową inteligencję ludzką (crowdsourcing) i zautomatyzowane metody tworzenia baz wiedzy i ekstrakcji informacji oraz kluczowe problemy wynikające z takiego ujęcia.
KONCEPCJA/METODY BADAŃ: Zastosowano model crowdsourcingu do zbierania i komentowania różnych przekładów tego samego tekstu literackiego i adnotacji w nich występujących.
WYNIKI I WNIOSKI: Przedstawiony model reprezentuje dynamiczne podejście do archiwów cyfrowych i pozwala na udoskonalenie tradycyjnych badań (literaturoznawczych) poprzez możliwość prezentacji tekstu literackiego z nowej perspektywy – jako dzieła dostępnego globalnie.
ZASTOSOWANIE PRAKTYCZNE: Model systemu dla projektu The Global Huck oferuje nowy paradygmat badań nad cyfrową kolekcją tekstów literackich wraz z ich adnotacjami w ujęciu crowdsourcingowym.
ORYGINALNOŚĆ/WARTOŚĆ POZNAWCZA: Badania nad przekładami dzieł literackich mają charakter transnarodowych i kolektywnych procesów badawczych, które pozwalają poszerzyć nasze możliwości pozyskiwania i organizacji tego typu informacji na skalę globalną.

Słowa kluczowe

Deep maping; Crowdsourcing w humanistyce; Języki o ograniczonych zasobach; Korpusy wielojęyczne; Przetwarzanie równoległe tekstów


Ayers, E. L. (2004). The Academic Culture & The IT Culture: Their Effect on Teaching and Scholarship. EDUCAUSE Review, 39(6), 48–62.

Cardon, D., Casilli, A. (2015). Qu’est-ce que le digital labor? Bry-sur-Marne: Ina éditions.

Christodouloupoulos, C., Steedman, M. (2015). A Massively Parallel Corpus: The Bible in 100 Languages. Language Resources and Evaluation, 49(2), 375–395.

Coutts, M. (2016). Stepping Away from the Silos: Strategic Collaboration in Digitisation. Cambridge, MA: Chandos Publishing.

Fraisse, A., Paroubek, P. (2015). Vers des pratiques collaboratives pour les systèmes d’organisation de connaissances. In : E. Chevry-Pébayle (ed.). Actes du 10ème colloque international du Chapitre français de l’ISKO – Systèmes d’organisation des connaissances et humanités numériques (289–301). London: ISTE Editions, 289–301.

Favier, L. (2016). Humanities Crowdsourcing. Zagadnienia Informacji Naukowej. Studia informacyjne, 54(2), 7–21.

Fishkin, S. F. (2010). The Mark Twain Anthology: Great Writers on His Life and Works. New York: Library of America.

Fishkin, S. F. (2011). “Deep Maps”: A Brief for Digital Palimpsest Mapping Projects (DPMPs, or “Deep Maps”). Journal of Transnational American Studies, 3(2), 1–31.

Fishkin, S. F. (2015). Transnational Mark Twain. In: S. Yuan & D. E. Pease (eds.), American Studies as Transnational Practice: Turning toward the Transpacific (109–137). Hanover, New Hampshire: Dartmouth College Press.

Flinn, A. (2010). An Attack on Professionalism and Scholarship? Democratising Archives and the Production of Knowledge. Ariadne [online], 62, [29.06.2018], http://www.ariadne.ac.uk/issue62/flinn/

Gold, M. K. (2012). Debates in the Digital Humanities. Minneapolis, MN: University of Minnesota Press.

Harrington, P., Jenn, R. (2017). Mark Twain & France: The Making of a New American Identity. University of Missouri Press.

Howe, J. (2008). Crowdsourcing: How the Power of the Crowd is Driving the Future of Business. London: Random House Business.

Ishihara, T. (2005). Mark Twain in Japan: The Cultural Reception of an American Icon. Columbia: University of Missouri Press.

Lai-Henderson, S. (2015). Mark Twain in China. Stanford: California Stanford University Press.

Law, E., Gajos, K. Z., Wiggins, A., Gray, M. L., Williams, A. (2017). Crowdsourcing as a Tool for Research: Implications of Uncertainty. Proceedings of the ACM Conference on Computer Supported Cooperative Work, CSCW ‘17, 1544–1561.

Levine, G. L., Brooks, P., Culler, J., Garber, M., Kaplan, E. A., Stimpson, C. R. (1989). Speaking for the Humanities[online]. American Council of Learned Societies, Occasional Paper No. 7, [29.06.2018], http://archives.acls.org/op/7_Speaking_for_Humanities.htm

Marchionni, P. (2009). Why Are Users So Useful? User Engagement and the Experience of the JISC Digitisation Programme. Ariadne [online], 61, [29.06.2018], http://www.ariadne.ac.uk/issue61/marchionni

Porto de Albuquerque, J., Herfort, B., Eckle, M. (2016). The Tasks of the Crowd: A Typology of Tasks in Geographic Information Crowdsourcing and a Case Study in Humanitarian Mapping. Remote Sensing [online], 8(10), 859, [29.06.2018], http://www.mdpi.com/2072–4292/8/10/859

Prpić, J., Shukla, P. P., Kietzmann, J. H., McCarthy, I. P. (2015). How to Work a Crowd: Developing Crowd Capital through Crowdsourcing. Business Horizons, 58(1), 77–85.

Rodney, R. M. (1982). Mark Twain International: A Bibliography and Interpretation of His Worldwide Popularity. Westport, Conn.: Greenwood Press.

Sabou, M., Bontcheva, K., Scharl, A. (2012). Crowdsourcing Research Opportunities: Lessons from Natural Language Processing. In: Proceedings of the 12th International Conference on Knowledge Management and Knowledge Technologies, i-KNOW 2012 (October 19,2012). ACM International Conference Proceeding Series.

Sabou, M., Scharl, A., Michael, F. (2013). Crowdsourced Knowledge Acquisition: Towards Hybrid-Genre Workflows. International Journal on Semantic Web and Information Systems, 9(3), 14–41.

Shuttleworth, S. A. (2016). Old Weather: Citizen Scientists in the 19th and 21st Centuries. Science Museum Group Journal [online], 3(3), [29.06.2018], http://journal.sciencemuseum.ac.uk/browse/issue-03/old-weather/

Surowiecki, J. (2005). The Wisdom of Crowds. New York: Anchor Books. Wohlgenannt, G., Sabou, M., Hanika, F. (2016). Crowd-Based Ontology Engineering with the Ucomp Protege Plugin. Semantic Web, 7(4), 379–398.

Zhang, H., Horvitz, E., Miller, R. C. R., Parkes, D. D. C. (2011). Crowdsourcing General Computation. In: Proceedings of the 2011 ACM Conference on Human Factors in Computing Systems: May 7–12, 2011, Vancouver, British Columbia. New York, NY: Association for Computing Machinery.


Opublikowane: 2018-09-01



Amel Fraisse  amel.fraisse@univ-lille3.fr

Afiliacja: GERiiCO, University of Lille, France,  Francja

Biogram:

Amel Fraisse, PhD, is Associate Professor at the University of Lille working on Digital Humanities and Natural Language Processing. Her research interests include information extraction and knowledge representation. Her research addresses both methods and applications of text analysis, ranging from collection and exploration of representation models and their cross-language adaptability to the integration of representation frameworks to extract and visualize new knowledge from text. 

Contact to the Author:
amel.fraisse@univ-lille3.fr
GERiiCO
Domaine Universitaire du Pont de Bois
59650 Villeneuve-d’Ascq, France

Ronald Jenn 

Afiliacja: CECILLE, University of Lille, France,  Francja

Biogram:

Ronald Jenn is Full Professor of Translation and Translation Studies at the University of Lille. He is also a Mark Twain specialist with a focus on the translation and reception of the author in French and in France.

Contact to the Author:
ronald.jenn@univ-lille3.fr
CECILLE
Domaine Universitaire du Pont de Bois
59650 Villeneuve-d’Ascq, France

Quoc-Tan Tran 

Afiliacja: GERiiCO, University of Lille, France,  Francja

Biogram:

QUOC-TAN TRAN holds a Master of Research in Library and Information Science from the University of Lille in 2016. His areas of investigation include ethics and cultural interoperability in knowledge organization, participatory methods and Internet ecologies of open knowledge. 

Contact to the Author:
quoc-tan.tran@etu.univ-lille3.fr
GERiiCO
Domaine Universitaire du Pont de Bois
59650 Villeneuve-d’Ascq, France





CC BY-NC-ND 4.0 Uznanie autorstwa - Użycie niekomercyjne - Bez utworów zależnych 4.0 Międzynarodowe