کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6900929 1446491 2018 7 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Automatic gender identification of author of Russian text by machine learning and neural net algorithms in case of gender deception
ترجمه فارسی عنوان
شناسایی جنسیت خودکار نویسنده متن روسی با استفاده از یادگیری ماشین و الگوریتم های شبکه عصبی در مورد فریب جنسیتی
کلمات کلیدی
پردازش زبان طبیعی، وظیفه شناسایی جنسیت، فراگیری ماشین، شبکه های عصبی عمیق،
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)
چکیده انگلیسی
We present the analysis of approaches to solve an author gender identification task for Russian-language texts with gender deception, using different Data-Driven models based on conventional machine learning (Support Vector Classifier, Decision Tree, Gradient Boosting) and neuronet algorithms (convolutional layers, long short-term memory layers, etc.) The source of training and testing data are collections of texts from the Gender Imitation corpus, expanded by crowd-sourcing and supplemented with files of RusProfiling and RusPersonality corpora. The reached accuracy of this task milestone is presented and discussed.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Procedia Computer Science - Volume 123, 2018, Pages 417-423
نویسندگان
, , , , , ,