درخت تصمیم(به انگلیسی: Decision tree)یک ابزار برای پشتیبانی از تصمیم است که از درختها برای مدل کردن استفاده میکند. درخت تصمیم به طور معمول در تحقیقها و عملیات مختلف استفاده میشود. به طور خاص در آنالیز تصمیم، برای مشخص کردن استراتژی که با بیشترین احتمال به هدف برسد بکار میرود. استفاده دیگر درختان تصمیم، توصیف محاسبات احتمال شرطی است. درخت تصمیم یک الگوریتم با نظارت است و همانند ماشین بردار پشتیبان برای کلاس بندی استفاده می شود.
درخت تصمیم از یک درخت برای ساخت یک مدل پیش بینی (تخمین) استفاده می کند که مشاهدات درباره یک آیتم را به نتیجه گیری هایی درباره مقدار هدف آن آیتم نگاشت می دهد. decision tree یکی از رویکردهای پیش بینانه است که در آمار و داده کاوی و یادگیری ماشین استفاده می شود. به مدل های درخت که در آنها متغیرهای هدف می توانند مجموعه متناهی از مقادیر داشته باشند درخت های طبقه بندی یا classification trees می گویند.
اگر y (که پاسخ پیش بینی شده یا خروجی هدف است) یک متغیر categoricalیا آرایه ای از کاراکترها یا آرایه ای از رشته ها باشد classregtree یا درخت تصمیم عمل classification یا دسته بندی را انجام خواهد داد. در این ساختار درختها، برگها نشان دهنده لیبل های کلاس و شاخه ها نشان دهنده ارتباط ویژگی هایی هستند که به این کلاس لیبل ها منتج می شود.
درخت تصمیم گیری، یک نمودار ترسیمی است که روند تصمیمگیری یا سلسلهای از تصمیمات را نمایش میدهد؛ یک ابزار کمکی برای تصمیمگیری است و از یک گراف یا مدل درختمانند که تصمیمات و عواقب محتمل آنها را نمایش میدهد، تشکیل شده است. در تجارت از آن بهمنظور تعیین سیاستهای شرکت یا ابزاری برای کمک به کارمندان استفاده میکنند. درخت تصمیم گیری، تصمیمات دشوار را به تصمیمات کوچکتر، سادهتر و منطقیتر تقسیم میکند؛ به این صورت میتواند همهی افراد را در تصمیمات سخت یاری بدهد.
درخت تصمیم در دهه های قبل بسیار پرکاربرد بود ولی در حال حاضر کاربرد کمتری پیدا کرده و دلیل آن هم این است که خیلی خوب generalized نمی کند. درخت تصمیم ساختاری است که data point ها را انشعاب بندی می کند یا آنها را طبقه بندی می نماید. یکی دیگر از کاربردهای DT در بازی کینکت است که از random forest برای شناسایی دست و پا و شانه و … استفاده می نماید. حسن این درخت های این است که تفسیر آنها راحت است و به راحتی می توان فهمید که چه سوالی پرسیده شده و داده بر چه اساسی تقسیم شده است.
مفاهیم اصلی در درختهای تصمیم
- گره: به منظور مستقل که آزمون روی آن انجام می شود.
- گره ریشه: گره ای که در بالاترین نقطه درخت وجود دارد.
- برگ: به متغیر وابسته یا برچسب دسته، برگ می گویند.
- شاخه: به مقیاسی که خروجی از آن تعیین می شود.
- برای متغیرهای عددی
- برای متغیرهای طبقه ای
در حالت کلی درخت تصمیم رسم شده برای یک مجموعه داده آموزشی، واحد و یکتا نیست. بر اساس در شکل زیر نمونهای از درخت تصمیم برای یک نمونه داده مشخص، نمایش داده شده است. یک مجموعه داده، درختهای تصمیم مختلفی میتوان بهدست آورد. در مجموعه دادههایی که در این شکلها استفاده شده است، سه ویژگی به نامهای Income(درآمد)، Marital Status (وضعیت تأهل) و Age (سن) وجود دارد. همچنین ویژگی بدحساب بودن به عنوان ویژگی دسته تعریف شده است. به این ترتیب در اینجا یک مجموعه رکورد داریم و هدف ما ساختن یک درخت تصمیم بر اساس آنهاست. برای این منظور باید بر اساس مجموعه دادههای آموزشی از بین سه ویژگی موجود یکی را انتخاب کرده و سپس باید مجموعه رکوردها را بر اساس مقادیر این ویژگی بشکنیم و این فرایند را ادامه دهیم تا درخت کلی ساخته شود. در میان ویژگیهای موجود، ابتدا آنهایی که خاصیت جداکنندگی بیشتری دارند را انتخاب میکنیم تا اطلاعات بیشتری از دادهها برای ما فراهم کنند.
مزایای درخت تصمیم را بصورت کلی می توان به این صورت نام برد:
توانایی انتخاب ویژگی که بیشترین قابلیت جداسازی را دارد.
قابلیت درک و تفسیر بالا بنابراین می توان از آن در مسائل تولید Rule (Rule Generation) استفاده کرد.
دسته بندی داده ها بدون محاسبات پیچیده و زیاد (محاسبات مربوط به کرنل ها در حالات غیرجدایی پذیر خطی در svm پیچیده است).
توانایی دسته بندی داده های نویزی و ناقص (این مورد را در دسته بندی داده هایی که با زنجیره ای از نویز به هم متصل هستند می توان مشاهده نمود. )
کار با داده های پیوسته و گسسته (البته باید گفت درخت تصمیم در حالت کلی در مواردی که هدف از یادگیری، تخمین تابعی با مقادیر پیوسته است مناسب نیست).
معایب درخت تصمیم:
زمانی که تعداد داده های آموزشی در مقابل تعداد کلاس ها کم باشد نرخ خطای دسته بندی بسیار بالاست. به عبارتی در مواردی که تعداد دسته ها زیاد و نمونه آموزشی کم است احتمال خطا بالا می رود.
در این صفحه تعداد 670 مقاله تخصصی درباره درخت تصمیم که در نشریه های معتبر علمی و پایگاه ساینس دایرکت (Science Direct) منتشر شده، نمایش داده شده است. برخی از این مقالات، پیش تر به زبان فارسی ترجمه شده اند که با مراجعه به هر یک از آنها، می توانید متن کامل مقاله انگلیسی همراه با ترجمه فارسی آن را دریافت فرمایید. در صورتی که مقاله مورد نظر شما هنوز به فارسی ترجمه نشده باشد، مترجمان با تجربه ما آمادگی دارند آن را در اسرع وقت برای شما ترجمه نمایند.
مقالات ISI درخت تصمیم (ترجمه نشده)
مقالات زیر هنوز به فارسی ترجمه نشده اند. در صورتی که به ترجمه آماده هر یک از مقالات زیر نیاز داشته باشید، می توانید سفارش دهید تا مترجمان با تجربه این مجموعه در اسرع وقت آن را برای شما ترجمه نمایند.
Keywords: درخت تصمیم; Cumulative nitrous oxide flux; Simulation model; Sampling; Fixed interval; Rule-based; Decision tree; RF; Random Forest; DOY; day of year; Tavg; average air temperature; R; cumulative rainfall (and irrigation); I; net water inflow; SIN; total soil inorgan