ویژگیهای یادگیری ماشینی به عنوان متغیرهای مستقلی تعریف میشوند که مانند ستونهایی در یک مجموعه داده ساختاریافته هستند و به عنوان ورودی مدل یادگیری عمل میکنند. این ویژگی برای اندازهگیری اشیایی است که نیاز به تجزیه و تحلیل دارند. بنابراین، هرچه ویژگیها و جزئیات بیشتری داشته باشیم، بهتر میتوانیم الگو را پیدا کنیم، اما در بیشتر ویژگیها، ممکن است با مشکلاتی مانند Overfitting مواجه شویم.
انواع استراتژی های یادگیری ماشینی
در این بخش مقدمهای بر انواع مختلفی از یادگیری که میتوانید در این زمینه پیدا کنید را بررسی خواهید کرد که به صورت زیر طبقه بندی میشوند:
1. یادگیری ماشینی تحت نظارت
الگوریتمهای یادگیری ماشینی تحت نظارت، آنچه را که در گذشته آموختهاند را، در نمونههای برچسبگذاری شده با علم جدید برای پیشبینی رویدادهای بلندمدت، به کار میگیرند. همچنین خروجی را با خروجی ثبت شده مقایسه میکند و در نتیجه، خطای تغییر مدل را پیدا میکند. سپس آن را تجزیه و تحلیل و یک عملیات استنباط شده تولید میکند که ممکن است برای نقشه برداری نمونههای جدید استفاده شود.
در یادگیری تحت نظارت، مراحل زیر انجام میشود:
• نوع نمونه های مربیگری (coaching) را تعیین کنید.• یک گروه مربی (coach) جمعآوری کنید.
• ویژگی ورودی عملیات ثبتشده را تعیین کنید.
• ساختار عملیات ثبتشده و متناظر با برنامه الگوریتمی آموزشی را تعیین کنید.
• برنامه ریزی را کامل کنید.
• دقت عملیات آموزشی را ارزیابی کنید.
مشکلات عمده ای که باید در مورد یادگیری تحت نظارت در نظر گرفت، در موارد زیر ذکر شدهاست:
• سوگیری – مبادله واریانس.
• کیفیت عملکرد و کیفیت دانش مربیگری.
• ابعاد خانه ورودی.
• مزاحمت صوتی در مقادیر خروجی
2. یادگیری ماشینی بدون نظارت
برنامه الگوریتم یادگیری ماشین بدون نظارت زمانی استفاده میشود که لیست دادههای ثبتشده، نه طبقهبندی و نه برچسبگذاری شود. این تکنیک، خروجی مناسب را درک و تحلیل نمیکند، با این حال، داده را کاوش میکند و ممکن است استنتاجهایی از مجموعههای داده را برای توضیح ساختار پنهان، استخراج کند. اطلاعات استخراج شده به طور مشترک، در نهایت یک سازمان نامیده میشود و امکان مدل سازی ورودیهای داده شده را میدهد. یک کاربرد آن در حوزه ی تخمین چگالی در آمار است.
الگوریتمهای مورد استفاده در یادگیری ماشینی بدون نظارت در موارد زیر ذکر شده است:
• خوشه بندی
• تشخیص ناهنجاری
• شبکه های عصبی
خوشه بندی بار دیگر به انواع مختلفی طبقهبندی میشود:
• خوشه بندی مبتنی بر اتصال
• خوشه بندی مبتنی بر مرکز
• خوشه بندی مبتنی بر توزیع
• خوشه بندی مبتنی بر چگالی
3. یادگیری ماشینی نیمه نظارتی
برنامه الگوریتم یادگیری ماشین نیمه نظارتی جایی در بین یادگیری نظارت شده و بدون نظارت قرار میگیرد زیرا آنها از هر دو دانش برچسبدار و بدون برچسب برای coaching و تحلیل استفاده میکنند. به طور کلی، مقدار کمی دانش برچسبگذاریشده و حتی مقدار بیش از حد این دانش باعث افزایش قابل توجهی در دقت یادگیری میشود. کسب دانش، برای یک برنامه یادگیری معمولاً به یک عامل انسانی با یک آزمایش فیزیکی نیاز دارد.
از تعدادی فرضیه برای اجرای برنامه الگوریتمی استفاده میشود که در آن فقط از یکی ازموارد در یک زمان استفاده میشود. در زیر به این فرضیهها اشاره میشود:
• فرض تداوم
• فرض خوشه ای
• فرض چندگانه
انواع مختلفی از استراتژیها برای یادگیری نیمه نظارتی وجود دارد که در زیر به آنها اشاره میشود:
• مدل مولد
• جداسازی با چگالی کم
• استراتژیهای مبتنی بر نمودار
• رویکردهای اکتشافی
4. تقویت یادگیری ماشینی
الگوریتمهای یادگیری ماشینی یک تکنیک یادگیری است که با بررسی و کشف خطاها یا مزایا، با عملکرد خود در تعامل است. بازخورد پاداش مستقیم برای فهم عامل برنامه، از کیفیت عملکرد مورد نیاز است و اغلب سیگنال تقویتی نامیده میشود. فضای این الگوریتم معمولاً در نوعی روش فراخوانی آندره مارکوف بیان میشود. در نتیجه در چندین الگوریتم یادگیری تقویتی برای این زمینه استفاده میشود.
تفاوت اصلی بین استراتژیهای برنامهنویسی پویا و همچنین الگوریتمهای یادگیری تقویتی این است که الگوریتمهای مورد دوم، دادههای یک مدل ریاضی خاص از روش فراخوانی آندره مارکوف را هر جا که استراتژیهای دقیق، غیرقابل اجرا میشوند، استفاده نمیکنند.
رویکردهای محدودی وجود دارد که توسط یادگیری ماشینی تقویتی استفاده می شود که در زیر ذکر شده است:
• معیار بهینه بودن
• Brute force
• ارزش انجام دادن
• راههای مونت کارلو
• راههای تمایز زمانی
• جستجوی مستقیم policy
روش آندره مارکوف مورد استفاده در مورد ترکیب معادلات دیفرانسیل، با کسرهای ادامهدار با کاربرد، مرتبط در معادله است.
5. خودآموزی
این یادگیری بدون پاداش خارجی و بدون توصیه معلم و رهبر خارجی است. قاعده الگوریتمی خودآموز CAA، به شیوه ای بسیار متقاطع، هر کدام انتخابهای مربوط به اقدامات و پیامدهای آن را انتخاب میکنند. این روش، یک سیستم با یک ورودی و یک خروجی است. حتی یک ورودی تقویتی جداگانه از این تنظیمات وجود ندارد.
6. آموزش ویژگی
یادگیری ویژگی ممکن است مجموعهای از تکنیکها باشد که به یک سیستم اجازه میدهد تا به صورت مکانیکی بازنماییهای مورد نیاز برای تشخیص یا طبقهبندی ویژگی را از اطلاعات کشف کند. یادگیری ویژگی با این واقعیت هدایت میشود. وظایف یادگیری ماشین، مانند طبقهبندی معمولاً به ورودی نیاز دارند که از نظر ریاضی و محاسباتی برای یک روش مناسب باشد. یادگیری ویژگی علاوه بر این، به عنوان یادگیری بازنمایی نامیده میشود و همچنین ممکن است تحت نظارت یا بدون نظارت باشد.
یادگیری ویژگیهای نظارت شده شامل روشهای زیر است، مانند:
• یادگیری تحت نظارت فرهنگ لغت
• شبکه های عصبی
یادگیری ویژگیهای بدون نظارت شامل راههای متعاقب مانند موارد زیر است:
• K-means خوشهبندی
• تجزیه و تحلیل مؤلفه های اصلی
• تعبیه خطی محلی
• تجزیه و تحلیل اجزای مستقل
• یادگیری فرهنگ لغت بدون نظارت
7. یادگیری لغتنامه پراکنده
یک روش یادگیری تصویری است که هدف آن یافتن یک تصویر توزیع شده از فایل کامپیوتری در سبک ترکیبی خطی از قطعات اصلی است. به این قسمتها اتمهایی گفته میشود که یک فرهنگلغت را تشکیل می دهند. اتمهای درون فرهنگلغت نیازی به متعامد بودن ندارند، آنها در همراهی در یک مجموعه پویا کاملا مرتبط خواهند بود. از مهم ترین کاربردهای یادگیری فرهنگ لغت پراکنده، در حوزه سنجش فشرده یا بازیابی سیگنال است.
الگوریتمهای مورد استفاده برای فرهنگلغت پراکنده در زیر ذکر شده است:
• روش جهت گیری بهینه
• K-SVD
• نزول گرادیان تصادفی
• روش دوگانه لاگرانژ
• روشهای تمرین پارامتریک
• آموزش آنلاین فرهنگ لغت
مزایای یادگیری ماشینی
چندین مزیت یادگیری ماشینی وجود دارد که برخی از آنها در زیر ذکر شده است:
• به راحتی روندها و الگوها را شناسایی میکند
• هیچ مداخله انسانی برای برنامه مورد نیاز نیست زیرا خودکار است
• آنها به خودی خود عدم دقت را بهبود میبخشند
• آنها میتوانند دادههای چند بعدی و چندگانه را مدیریت کنند
• این قابلیت کمک و ارائه یک تجربه خوب را دارد.
مترجم: حنانه بریمانی
همچنین مطالب علمی بیشتری را بخوانید:
تست لسیتیناز (Lecithinase)