دانلود مقالات ISI درباره یاگیری نیمهنظارتی + ترجمه فارسی
Semi-Supervised Learning
آشنایی با موضوع
یاگیری نیمهنظارتی (به انگلیسی: Semi-supervised learning)دستهای از روشهای یادگیری ماشین است که در آن از دادههای بدون برچسب و دادههای برچسبدار به صورت همزمان برای بهبود دقت یادگیری استفاده میشود.
کاربردها
تشخیص گفتار
پردازش زبان طبیعی
نظارت ویدئویی
پیشگویی ساختار سه بعدی پروتئین
فیلتر کردن هرزنامه ها
انواع روش ها
روش های Inductive
پیشگویی برچسب نمونه هایی که تاکنون مشاهده نشده اند؛
امتحان کلاسی
روش های Transductive
پیشگویی بر چسب نمونه هایی که در مجموعه آموزش بکار رفته اند؛
امتحان take-home
مزایا
سادگی
عدم وابستگی به مدل دسته بندی
اشکال
تقویت اشتباه در مراحل یادگیری
حساس به Outlier
روشهای یادگیری نیمهنظارتی را در یک دستهبندی کلی به دستههای زیر میتوان تقسیم کرد.
روشهای مولد
در روشهای مولد ابتدا یک مدل پارامتری برای تابع توزیع نقاط (مثلا توزیع گاوسی) انتخاب میشود که آن را با نشان میدهیم که در آن مدل است. سپس از روی دادههای برچسبدار تخمین زده میشود. احتمال وقوع نقاط با توجه به تابع توزیع هر دسته، بر حسب پارامترهای مدل، به صورت تحلیلی محاسبه میشود. سپس با اعمال قانون بیز میتوان تابع توزیع برچسب در هر نقطه را محاسبه کرد. در روشهای مولد معمولاً هدف بیشینه کردن این احتمال وقوع یا به طور معادل بیشینه کردن راستنمایی آنها نسبت به پارامترهای مدل است. از روشهای مختلفی میتوان برای بهینهکردن پارامترهای مدل نسبت به میزان راستنمایی استفاده کرد.
در مقابل روشهای مولد، روشهایی که به طور مستقیم به یادگیری میپردازند یا روشهای تمایزی هستند. توجیهات نظری وجود دارد که نشان میدهد که روشهای مولد نیاز به دادههای بیشتری نسبت به روشهای تمایزی جهت یادگیری دارند. همچنین در عمل روشهای تمایزی موفقتر نشان دادهاند. بنابراین تحقیقات روی روشهای مولد کمرنگ بوده است.
روشهای مبتنی بر فرض جداسازی کمچگالی
همانطور که گفته شد، فرض خوشه با فرض جداسازی کم چگالی معادل است. با توجه به این نکته میتوان عبارتهای منظمسازی تعریف کرد که وجود مرز طبقهبندی در نقاط پرچگالی را جریمه میکنند. به این ترتیب الگوریتمهای زیادی برای یادگیری نیمهنظارتی مطرح میشوند. معروفترین الگوریتم در این دسته از روشها، الگوریتم TSVM است، که در سال ۱۹۹۸ توسط وپنیک ارائه شد. وپنیک از مفهوم ابعاد VC و قاعدهی SRM، برای طراحی یک مسئله بهینهسازی مشابه مسئلهی بهینهسازی SVM بهره گرفته است. مسئلهی بهینهسازی TSVM، مسئلهای پیچیده است و تاکنون الگوریتمی کارا برای یافتن جواب بهینهی عمومی آن ارائه نشده است. روشهای دیگری هم در حوزهی استفاده صرف از فرض خوشه استفاده شدهاند که شامل میشوند. همهی این روشها در دو خاصیت مشترکند، یکی اینکه برای طبقهبندی طراحی شدهاند و اینکه طراحی آنها حول مفهوم مرز جداساز و اندازه مرز بوده است.
روشهای مبتنی بر گراف
این روشها در صورتی مؤثر هستند که فرض همواری نیمهنظارتی و فرض خمینه در حالت ضعیف، همزمان برقرار باشد. برای استفاده از فرض خمینه به طور صریح، باید ساختار خمینه به نحوی بیان شود. یکی از راههای بیان کردن ساختار خمینه در فضای با بعد بالا، استفاده از گرافهای همسایگی است. در گراف همسایگی، رئوس همان نقاط هستند و میان نقاط نزدیک به هم روی خمینه یال با وزن متناسب قرار داده میشود.
در روشهای نیمهنظارتی مبتنی بر گراف[۶]، ابتدا گراف همسایگی روی نقاط ساخته میشود، سپس از روشی برای تعیین برچسب نقاط بدون برچسب استفاده میشود. به عبارت دیگر، هر الگوریتم نیمهنظارتی مبتنی بر گراف شامل گامهای کلی زیر است:
1. پیشپردازش دادهها، که شامل استخراج ویژگیها، کاهش بعد، حذف نویز و موارد دیگر میباشد.
2. ایجاد گراف همسایگی مناسب روی نقاط که معمولاً لازمهی آن محاسبهی فاصلهی بین نقاط است.
3. استنتاج برچسب نقاط بدون برچسب با یکی از روشهای استنتاج برچسب.
در این صفحه تعداد 421 مقاله تخصصی درباره یاگیری نیمهنظارتی که در نشریه های معتبر علمی و پایگاه ساینس دایرکت (Science Direct) منتشر شده، نمایش داده شده است. برخی از این مقالات، پیش تر به زبان فارسی ترجمه شده اند که با مراجعه به هر یک از آنها، می توانید متن کامل مقاله انگلیسی همراه با ترجمه فارسی آن را دریافت فرمایید. در صورتی که مقاله مورد نظر شما هنوز به فارسی ترجمه نشده باشد، مترجمان با تجربه ما آمادگی دارند آن را در اسرع وقت برای شما ترجمه نمایند.
مقالات ISI یاگیری نیمهنظارتی (ترجمه نشده)
مقالات زیر هنوز به فارسی ترجمه نشده اند. در صورتی که به ترجمه آماده هر یک از مقالات زیر نیاز داشته باشید، می توانید سفارش دهید تا مترجمان با تجربه این مجموعه در اسرع وقت آن را برای شما ترجمه نمایند.