کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
1118880 | 1488464 | 2013 | 9 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
A Large SMS Corpus in French: From Design and Collation to Anonymisation, Transcoding and Analysis
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
موضوعات مرتبط
علوم انسانی و اجتماعی
علوم انسانی و هنر
هنر و علوم انسانی (عمومی)
پیش نمایش صفحه اول مقاله
چکیده انگلیسی
In 2011, 90,000 authentic text messages in French were collected from the general public by academics in the south of France in the context of the sud4science LR project (http://www.sud4science.org and www.sms4science.org). This paper retraces the design of the corpus collation, including linking text-message data with usage, before proceeding with a three-step semi- automatic anonymisation process, transcoding of the SMS data into “standardised” French, and an optional linguistic annotation phase. The researchers have started linguistic analyses of language practices and sociolinguistic data contained in the questionnaire. The corpus will be made available for researchers, students and the general public in 2014.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Procedia - Social and Behavioral Sciences - Volume 95, 25 October 2013, Pages 96-104
Journal: Procedia - Social and Behavioral Sciences - Volume 95, 25 October 2013, Pages 96-104