کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
10356085 | 867603 | 2012 | 11 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
A method for determining the number of documents needed for a gold standard corpus
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
نرم افزارهای علوم کامپیوتر
پیش نمایش صفحه اول مقاله

چکیده انگلیسی
⺠Annotated documents are necessary for NLP machine learning, modeling and testing. ⺠We create a method to determine a required sample size for the annotation set. ⺠The probability of word capture from a corpus provides the basis for the method. ⺠Dictation letters from a pain management medical practice are used as an example. ⺠We also demonstrate steps for creating a representative sample of dictations.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Journal of Biomedical Informatics - Volume 45, Issue 3, June 2012, Pages 460-470
Journal: Journal of Biomedical Informatics - Volume 45, Issue 3, June 2012, Pages 460-470
نویسندگان
David Juckett,