متنکاوی، به دادهکاویای که بر روی متن انجام شود اشاره دارد. همچنین به عنوان آنالیز متن نیز شناخته میشود که منظور از آن فرایند استخراج اطلاعات با کیفیت از متن است. اطلاعات پر کیفیت، بطور معمول از فهم الگوها و گرایشها از طریق معانی و بوسیله یادگیری الگوهای آماری حاصل میشود. متن کاوی معمولاً درگیر در فرایند ساختاردهی به ورودیهای متنی (معمولاً تجزیه، همراه با افزودن برخی ویژگیها تفاسیر زبانی و حذف موارد اضافی و درج موارد بعدی در پایگاه داده انجام میگیرد)، استخراج الگوهای درون دادههای ساختار یافته، و در نهایت ارزیابی و تفسیر خروجیها است. «پر کیفیت» در متن کاوی معمولاً به ترکیبی از مرتبط بودن، نو ظهور بودن و جالب بودن اشاره دارد. وظایف متن کاوی معمول شامل دستهبندی متون، خوشه بندی متون، استخراج معنی و مفهوم، تولید ردهبندی دانهای، تجزیه و تحلیل احساسات، خلاصه کردن اسناد و مدلسازی ارتباط موجودیتها است. (بطور مثال یادگیری ارتباط بین موجودیتها)
آنالیز متن درگیر در بازیابی اطلاعات، آنالیز لغوی برای مطالعه توزیع فرکانس لغات، شناخت الگو، برچسب گذاری/حاشیه نویسی، استخراج اطلاعات، تکنیکهای داده کاوی شامل آنالیز اتصال و ارتباط، بصری سازی، و آنالیز پیشگویانه است. هدف نهایی، اساساً تبدیل متن به داده برای آنالیز از طریق کاربرد پردازش زبانهای طبیعی و متدهای تحلیلی است.
یک کاربرد معمول، جهت اسکن مجموعهای از اسناد نوشته شده در یک زبان طبیعی و مدل کردن مجموعه اسناد برای اهداف کلاسبندی پیشگویانه یا پرکردن یک پایگاه داده یا ایندکس جستجو با اطلاعات استخراج شده است.
با گسترش شگرف اینترنت و استفاده روزافزون از آن در جهت ارایه و یا کسب اطلاعات، شاهد حجم انبوهی از اسناد و مقالات بر- خط هستیم که بعنوان یکی از مشخصات بارز زندگی مدرن امروزی، تحت عنوان افزونگی اطلاعاتی مطرح میگردد. در این میان دسترسی سریع و صحیح به منابع مهم و مورد علاقه، یکی از دغدغه های استفاده کنندگان از این منبع اطلاعاتی بسیار بزرگ است. آنچه امروزه از اهمیت بسیار زیادی برخوردار گردیده، کمبود یا نبود اطلاعات نیست بلکه کمبود روشهایی در جهت یافت و بهره برداری از اطلاعات در دسترس به نحوی بهینه است. بعنوان مسئله ای آرمانی تر به دنبال روشهایی هستیم تا از اطلاعات موجود به کسب دانش پرداخته، احتمالاً به ارایه مسایل جدیدی بپردازد که قبل از آن مشخص نبوده است.
متن کاوی، بعنوان روشی در استخراج دانش از متون، یکی از موضوعات مهم در گستره ای از اعمال مدیریت اطلاعات است. در این میان آنچه از اهمیت فوق العاده ای برخوردار است ارایه راهکارهایی برای مواجه با این حجم عظیم اطلاعاتی و استفاده بهینه از اطلاعات در جهت خلق دانش، تولید سینرجی و در نهایت افزایش خرد جمعی است.
در سالهای اخیر اهمیت متون به عنوان منابع با پتانسیل اطلاعاتی بسیار بالا به نحو گستردهای مورد توجه قرار گرفته به طوری که کشف دانش از متون به عنوان یکی از مهمترین فعالیتهای محققین حوزه هوش مصنوعی و فناوری اطلاعات قرار گرفته است. تحقیقات بسیاری صورت گرفته اما محدوده فعالیت بقدری گسترده است که نیازمند توجه بیشتری میباشد.
امروزه محققان به این مسئله معترفند که با وجود انجام تحقیقات بی وقفه در زمینه کاری خود، نمیتوانند همزمان با پیشرفت دانش، معلومات خود را به روز نگاه دارند. بعنوان مثال بانک اطلاعاتی Medline در حال حاضر حاوی 10 میلیون چکیده مقاله است و هر هفته بین هفت تا هشت هزار چکیده مقاله به این بانک اطلاعاتی افزوده میشود. در این بین شاید همه مقالات مربوط به یک دانش خاص نباشند، اما تعداد مقالات تخصصی که در حوزه تحقیق یک دانش خاص قرار میگیرد به اندازه ای است که یک نفر نمیتواند ادعا کند همه آنها را مطالعه کرده است بعلاوه نقش مطالعات عمیق و گسترده و استخراج ایده ها و دانش جدید از مطالب مطالعه شده بر کسی پوشیده نیست.
در این صفحه تعداد 648 مقاله تخصصی درباره متنکاوی که در نشریه های معتبر علمی و پایگاه ساینس دایرکت (Science Direct) منتشر شده، نمایش داده شده است. برخی از این مقالات، پیش تر به زبان فارسی ترجمه شده اند که با مراجعه به هر یک از آنها، می توانید متن کامل مقاله انگلیسی همراه با ترجمه فارسی آن را دریافت فرمایید. در صورتی که مقاله مورد نظر شما هنوز به فارسی ترجمه نشده باشد، مترجمان با تجربه ما آمادگی دارند آن را در اسرع وقت برای شما ترجمه نمایند.
Keywords: متنکاوی; Social media analytics; Competitive analytics; Sentiment benchmarks; Text mining; Sentiment analysis; User-generated data; Social media; Marketing intelligence; Big data; Social media monitoring
Keywords: متنکاوی; E-commerce; Online reviews; Data mining; Text mining; Association rule mining; Rough set theory; Business intelligence; Online reputation
مقالات زیر هنوز به فارسی ترجمه نشده اند. در صورتی که به ترجمه آماده هر یک از مقالات زیر نیاز داشته باشید، می توانید سفارش دهید تا مترجمان با تجربه این مجموعه در اسرع وقت آن را برای شما ترجمه نمایند.
Keywords: متنکاوی; News censorship; Identities censorship; Text mining; Data correlation; Privacy in social networks; Social media mining; Facebook; Named entity recognition; Candidateentity recognition; Transparency;