کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
10356085 867603 2012 11 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A method for determining the number of documents needed for a gold standard corpus
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نرم افزارهای علوم کامپیوتر
پیش نمایش صفحه اول مقاله
A method for determining the number of documents needed for a gold standard corpus
چکیده انگلیسی
► Annotated documents are necessary for NLP machine learning, modeling and testing. ► We create a method to determine a required sample size for the annotation set. ► The probability of word capture from a corpus provides the basis for the method. ► Dictation letters from a pain management medical practice are used as an example. ► We also demonstrate steps for creating a representative sample of dictations.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Journal of Biomedical Informatics - Volume 45, Issue 3, June 2012, Pages 460-470
نویسندگان
,