در مورد QSAR بیشتر بدانیم
کشف و توسعه دارو فرآیندی است که هدف آن طراحی داروهای ایمن و موثر برای بهبود کیفیت زندگی است.
با این حال، روند بسیار پیچیده و زمان بر است و نیاز به نوآوری و تخصص در چند رشته دارد. برآوردهای اخیر نشان می دهد که ۱۳.۵ سال طول می کشد تا با صرف هزینه ی ۱.۸ میلیارد دلاری، بتوان یک داروی جدید به بازار ارائه داد. فناوری های پزشکی و مراقبت های بهداشتی در طی دهه های گذشته به سرعت تغییر کرده است.
مهندسی پزشکی قوانین اساسی در حل مشکلات پزشکی دارد. در طول ده تا بیست سال گذشته، تلاش های فراوانی برای اعمال توانایی های محاسباتی در ترکیب فضاهای شیمیایی و بیولوژیکی برای تسهیل فرآیندهای کشف و طراحی دارو انجام گردیده است.
روش های منطقی طراحی دارو زمان و هزینه ی مورد نیاز در فرآیند طراحی دارو را در مقایسه با روش های سنتی کشف دارو تقلیل داده است. مطالعات QSAR/QSPR می توانند برای طراحی و شناسایی بازدارنده های جدید de novo و یا بهینه سازی جذب، توزیع، متابولیسم، مشخصات دفع و سمیت مولکول های شناسایی شده از منابع مختلف مورد استفاده قرار گیرند.
پیشرفت در تکنیک های محاسباتی و سخت افزارهای کاربردی، کاربرد روش های in silico را در پروسه ی طراحی دارو تسهیل نموده است.
طراحی دارو را می توان به دو دسته تقسیم بندی نمود:
۱- طراحی دارو بر مبنای ساختار (SBDD)
۲- طراحی دارو بر مبنای لیگاند (LBDD)
SBDD رویکردی است که از اطلاعات ساختاری داروی مورد هدف به منظور ایجاد مهارکننده های آن، استفاده می کند. در حالی که روش LBDD در غیاب اطلاعات سه بعدی گیرنده و با تکیه بر مولکول های متصل به هدف بیولوژیکی انجام می شود.
QSAR مخفف Quantitative structure-activity relationships می باشد که به روابط کمی ساختار-فعالیت اشاره دارد. روابط کمی ساختار-فعالیت (QSAR) این روزها نقش اساسی در فرآیند طراحی دارو دارند، چرا که جایگزین ارزانتری نسبت به آزمایشات in vitro و in vivo می باشند. همچنین، در کشف دارو و سم شناسی محیطی، مدل های QSAR اکنون به عنوان یک ابزار علمی معتبر برای پیش بینی و طبقه بندی فعالیت های بیولوژیکی ترکیبات آزمایش نشده، مقاومت دارویی، پیش بینی سمیت و پیش بینی خواص فیزیکوشیمیایی در نظر گرفته می شوند.
روش QSAR بر این مفهوم استوار است که تفاوت های مشاهده شده در فعالیت بیولوژیکی یک سری از ترکیبات را می توان از نظر کمی با تفاوت در ساختار مولکولی آنها مرتبط کرد. در نتیجه، همه فعالیتها و عملکردهای بیولوژیکی مولکولها به توصیفکنندههای مولکولی خاص مربوط میشوند و از تکنیکهای رگرسیون خاص میتوان برای تخمین نقشهای نسبی آن توصیفگرهایی که در اثر بیولوژیکی نقش دارند استفاده کرد.
همانطور که اشاره شد اصل اساسی این است که تغییرات در خواص ساختاری باعث فعالیت های بیولوژیکی متفاوتی می شود. خواص ساختاری به خواص فیزیکی و شیمیایی اشاره دارد و فعالیت های بیولوژیکی با خواص فارماکوکینتیکی مانند جذب، توزیع، متابولیسم، دفع و سمیت مطابقت دارد.
مدلسازی QSAR به اولویتبندی تعداد زیادی از مواد شیمیایی از نظر فعالیتهای بیولوژیکی مورد نظرشان به عنوان یک روش insilico کمک میکند و در نتیجه تعداد مواد شیمیایی کاندید را به میزان قابلتوجهی کاهش میدهد تا با آزمایشات in vivo آزمایش شوند. مدلسازی QSAR بهعنوان یک فرآیند اجتنابناپذیر در صنعت داروسازی عمل کرده است، اما محدودیتهای زیادی دارد.
داده های QSAR ممکن است شامل تعداد بسیار زیادی از مواد شیمیایی باشد. هر ماده شیمیایی را می توان با انواع توصیفگرها نشان داد. اثر انگشت های رایج بسیار پراکنده هستند (بیشتر مقادیر صفر هستند) و برخی از ویژگی ها همبستگی بالایی دارند. فرض بر این است که مجموعه داده حاوی برخی خطاها است زیرا روابط از طریق آزمایشهای in situ ارزیابی میشوند.
QSAR که رابطه فعالیت کمی و ساختار را نشان می دهد یکی از رویکردهای پرکاربرد در فرآیندهای طراحی دارویی مبتنی بر لیگاند است. در مطالعات QSAR/QSPR روابط بین روند تغییرات ساختار شیمیایی و تغییرات مربوطه در نقطه پایانی بیولوژیکی برای درک اینکه کدام ویژگیهای شیمیایی احتمالا برای فعالیتهای بیولوژیکی یا خواص فیزیکوشیمیایی آنها تعیینکننده هستند، به طور کمی مرتبط و خلاصه می شوند.
روابط فعالیت کمی ساختار (QSARs) به معنای روش آماری کامپیوتری است که به توضیح واریانس مشاهده شده در تغییرات ساختار ناشی از جایگزینی کمک می کند. در این مفهوم فرض بر این است که فعالیت بیولوژیکی نشاندادهشده توسط یک سری از ترکیبات که تابعی از آنالیزهای فیزیکوشیمیایی مختلف است که نشان میدهد خواص فیزیکی و شیمیایی خاصی برای فعالیت مطلوب است، میتوان دومی را با انتخاب بهینه کرد.
هدف اصلی مطالعات QSAR/QSPR یافتن یک رابطه ریاضی بین فعالیت یا ویژگی مورد بررسی و یک یا چند پارامتر توصیفی یا توصیفگر مربوط به ساختار مولکول است. در QSAR، ساختار یک مولکول باید دارای ویژگی ها و خواصی باشد که مسئول فعالیت های فیزیکی، شیمیایی و بیولوژیکی آن است.
نرم افزارهای متعددی برای توسعه QSAR در دسترس هستند که یا به صورت تجاری ویا به صورت رایگان قابل استفاده می باشند. اینها شامل نرم افزارهای تخصصی برای ترسیم ساختارهای شیمیایی، تبدیل فرمت فایل های شیمیایی، تولید ساختارهای سه بعدی، محاسبه توصیفگرهای شیمیایی، توسعه مدل های QSAR و نرم افزارهای همه منظوره است که تمام اجزای لازم برای توسعه QSAR را دارند.
برای طراحی ساختار یا تبدیل فایل رایج ترین برنامه ها عبارتند از ChemDraw، ACD/ChemSketch و Open Babel. محصولات نرم افزاری ساختار سه بعدی CORINA، Concord، Frog، smi23d هستند. محاسبه Descriptor را می توان با استفاده از نرم افزار Dragon، Molconn-Z، PaDEL-Descriptor انجام داد. اولین گام مهم در مطالعه QSPR/QSAR، ورود ساختارهای مولکولی و تولید مدلهای سه بعدی است. مدل های مولکولی سه بعدی برای محاسبات توصیفگر هندسی مورد نیاز است.
دومین مرحله مهم در مطالعه QSPR/QSAR، تولید توصیفگرهای ساختار مولکولی است. انتخاب مهمترین توصیفگرها مرحله سوم است و با استفاده از روش های انتخاب ویژگی می توان به آن دست یافت. چهارمین مرحله اصلی در مطالعه QSPR/QSAR، تولید مدلهای QSPR/QSAR با استفاده از مجموعههای توصیفگر است. پنجمین و آخرین مرحله، اعتبارسنجی مدل با پیشبینی فعالیت ترکیبات در مجموعه پیشبینی خارجی است. نتایج بهدستآمده توسط پیشبینیها باید با نتایج بهدستآمده برای مجموعه آموزشی و مجموعه اعتبارسنجی متقابل مقایسه شود تا به راحتی سطح fitness مدل را درک کنید.
با توجه به این محدودیتها، دستیابی به یک امتیاز پیشبینی قابل اعتماد برای پیشبینی مدل مبتنی بر QSAR دشوار شده است. در نتیجه، رویکردهای یادگیری ماشین برای پیشبینی QSAR اعمال شدهاند. مدلهای رگرسیون خطی و شبکههای عصبی Bayesian برای پیشبینی QSAR استفاده شدهاند.
Random forest متداولترین الگوریتم مورد استفاده با سطح بالایی از پیشبینی، سادگی و استحکام است.
RF نوعی روش مجموعه ای مبتنی بر درخت های تصمیم گیری چندگانه است که می تواند از تطبیق بیش از حد یک درخت تصمیم منفرد جلوگیری کند. RF به عنوان golden standard در این زمینه در نظر گرفته می شود بنابراین، روشهای جدید پیشبینی QSAR اغلب عملکرد خود را در مقایسه با RF دارند.
رقابت Merck Kaggle در سال 2012 توجه مردم را به شبکه های عصبی معطوف کرد. تیم برنده از شبکه های عصبی چند وظیفه ای (MTNN) استفاده کرد. ساختار اساسی یادگیری مبتنی بر شبکه های عصبی feed-forward است. تیم نتایجی به دست آورد که به طور مداوم از RF بهتر بود. علیرغم دستیابی به عملکرد بالا با استفاده از یک شبکه عصبی چند وظیفه ای، تیم در نهایت از مجموعه ای استفاده کرد که روش های مختلف را ترکیب می کرد.
هم RF و هم تکنیک فوقالذکر از Kaggle از یادگیری گروهی استفاده کردند، تکنیکی که مجموعهای از مدلهای یادگیری را ایجاد میکند و چندین مدل را برای تولید پیشبینیهای نهایی ترکیب میکند. از نظر تئوری و تجربی، نشان داده شده است که اگر الگوریتم های فردی دقیق و متنوع باشند، قدرت پیش بینی یادگیری گروهی از یک یادگیرنده فراتر می رود. یادگیری گروهی، نقاط قوت و ضعف تک تک یادگیرندگان را مدیریت میکند، مشابه اینکه افراد در مواجهه با مسائل مهم، نظرات گوناگون را در نظر میگیرند.
با شرکت در کارآموزی طراحی دارو ژنیران دانش خود را در مورد مبانی QSAR و مدلینگ داده افزایش دهید: