آشنایی با موضوع

متن‌کاوی، به داده‌کاوی‌ای که بر روی متن انجام شود اشاره دارد. همچنین به عنوان آنالیز متن نیز شناخته می‌شود که منظور از آن فرایند استخراج اطلاعات با کیفیت از متن است. اطلاعات پر کیفیت، بطور معمول از فهم الگوها و گرایشها از طریق معانی و بوسیله یادگیری الگوهای آماری حاصل می‌شود. متن کاوی معمولاً درگیر در فرایند ساختاردهی به ورودی‌های متنی (معمولاً تجزیه، همراه با افزودن برخی ویژگی‌ها تفاسیر زبانی و حذف موارد اضافی و درج موارد بعدی در پایگاه داده انجام می‌گیرد)، استخراج الگوهای درون داده‌های ساختار یافته، و در نهایت ارزیابی و تفسیر خروجی‌ها است. «پر کیفیت» در متن کاوی معمولاً به ترکیبی از مرتبط بودن، نو ظهور بودن و جالب بودن اشاره دارد. وظایف متن کاوی معمول شامل دسته‌بندی متون، خوشه بندی متون، استخراج معنی و مفهوم، تولید رده‌بندی دانه‌ای، تجزیه و تحلیل احساسات، خلاصه کردن اسناد و مدلسازی ارتباط موجودیت‌ها است. (بطور مثال یادگیری ارتباط بین موجودیتها) آنالیز متن درگیر در بازیابی اطلاعات، آنالیز لغوی برای مطالعه توزیع فرکانس لغات، شناخت الگو، برچسب گذاری/حاشیه نویسی، استخراج اطلاعات، تکنیکهای داده کاوی شامل آنالیز اتصال و ارتباط، بصری سازی، و آنالیز پیشگویانه است. هدف نهایی، اساساً تبدیل متن به داده برای آنالیز از طریق کاربرد پردازش زبان‌های طبیعی و متدهای تحلیلی است. یک کاربرد معمول، جهت اسکن مجموعه‌ای از اسناد نوشته شده در یک زبان طبیعی و مدل کردن مجموعه اسناد برای اهداف کلاس‌بندی پیشگویانه یا پرکردن یک پایگاه داده یا ایندکس جستجو با اطلاعات استخراج شده است. با گسترش شگرف اینترنت و استفاده روزافزون از آن در جهت ارایه و یا کسب اطلاعات، شاهد حجم انبوهی از اسناد و مقالات بر- خط هستیم که بعنوان یکی از مشخصات بارز زندگی مدرن امروزی، تحت عنوان افزونگی اطلاعاتی مطرح می‌گردد. در این میان دسترسی سریع و صحیح به منابع مهم و مورد علاقه، یکی از دغدغه های استفاده کنندگان از این منبع اطلاعاتی بسیار بزرگ است. آنچه امروزه از اهمیت بسیار زیادی برخوردار گردیده، کمبود یا نبود اطلاعات نیست بلکه کمبود روشهایی در جهت یافت و بهره برداری از اطلاعات در دسترس به نحوی بهینه است. بعنوان مسئله ای آرمانی تر به دنبال روشهایی هستیم تا از اطلاعات موجود به کسب دانش پرداخته، احتمالاً به ارایه مسایل جدیدی بپردازد که قبل از آن مشخص نبوده است. متن کاوی، بعنوان روشی در استخراج دانش از متون، یکی از موضوعات مهم در گستره ای از اعمال مدیریت اطلاعات است. در این میان آنچه از اهمیت فوق العاده ای برخوردار است ارایه راه‌کارهایی برای مواجه با این حجم عظیم اطلاعاتی و استفاده بهینه از اطلاعات در جهت خلق دانش، تولید سینرجی و در نهایت افزایش خرد جمعی است. در سالهای اخیر اهمیت متون به عنوان منابع با پتانسیل اطلاعاتی بسیار بالا به نحو گسترده‌ای مورد توجه قرار گرفته به طوری که کشف دانش از متون به عنوان یکی از مهمترین فعالیتهای محققین حوزه هوش مصنوعی و فناوری اطلاعات قرار گرفته است. تحقیقات بسیاری صورت گرفته اما محدوده فعالیت بقدری گسترده است که نیازمند توجه بیشتری می‌باشد. امروزه محققان به این مسئله معترفند که با وجود انجام تحقیقات بی وقفه در زمینه کاری خود، نمی‌توانند همزمان با پیشرفت دانش، معلومات خود را به روز نگاه دارند. بعنوان مثال بانک اطلاعاتی Medline در حال حاضر حاوی 10 میلیون چکیده مقاله است و هر هفته بین هفت تا هشت هزار چکیده مقاله به این بانک اطلاعاتی افزوده می‌شود. در این بین شاید همه مقالات مربوط به یک دانش خاص نباشند، اما تعداد مقالات تخصصی که در حوزه تحقیق یک دانش خاص قرار می‌گیرد به اندازه ای است که یک نفر نمی‌تواند ادعا کند همه آنها را مطالعه کرده است بعلاوه نقش مطالعات عمیق و گسترده و استخراج ایده ها و دانش جدید از مطالب مطالعه شده بر کسی پوشیده نیست.
در این صفحه تعداد 648 مقاله تخصصی درباره متن‌کاوی که در نشریه های معتبر علمی و پایگاه ساینس دایرکت (Science Direct) منتشر شده، نمایش داده شده است. برخی از این مقالات، پیش تر به زبان فارسی ترجمه شده اند که با مراجعه به هر یک از آنها، می توانید متن کامل مقاله انگلیسی همراه با ترجمه فارسی آن را دریافت فرمایید.
در صورتی که مقاله مورد نظر شما هنوز به فارسی ترجمه نشده باشد، مترجمان با تجربه ما آمادگی دارند آن را در اسرع وقت برای شما ترجمه نمایند.
مقالات ISI متن‌کاوی (ترجمه نشده)
مقالات زیر هنوز به فارسی ترجمه نشده اند.
در صورتی که به ترجمه آماده هر یک از مقالات زیر نیاز داشته باشید، می توانید سفارش دهید تا مترجمان با تجربه این مجموعه در اسرع وقت آن را برای شما ترجمه نمایند.
Elsevier - ScienceDirect - الزویر - ساینس دایرکت
Keywords: متن‌کاوی; COSMIC; Catalog of Somatic Mutations in Cancer; GHR; Genetics Home Reference; GWAS; Genome Wide Association Study; HGNC; HUGO Gene Nomenclature Committee; HUGO; Human Genome Organization; ICD; International Classification of Diseases; LD; linkage disequil
Elsevier - ScienceDirect - الزویر - ساینس دایرکت
Keywords: متن‌کاوی; Biomedical text mining; Machine learning; Text classification; Protein subcellular location; Protein function prediction; Protein annotation; Text mining; Protein representation; Protein location prediction;