مبانی QSAR و مدلینگ داده و کاربرد آن در علم طراحی دارو

مبانی QSAR و مدلینگ داده

در مورد QSAR بیشتر بدانیم

کشف و توسعه دارو فرآیندی است که هدف آن طراحی داروهای ایمن و موثر برای بهبود کیفیت زندگی است.

با این حال، روند بسیار پیچیده و زمان بر است و نیاز به نوآوری و تخصص در چند رشته دارد. برآوردهای اخیر نشان می دهد که ۱۳.۵ سال طول می کشد تا با صرف هزینه ی ۱.۸ میلیارد دلاری، بتوان یک داروی جدید به بازار ارائه داد. فناوری های پزشکی و مراقبت های بهداشتی در طی دهه های گذشته به سرعت تغییر کرده است.

مهندسی پزشکی قوانین اساسی در حل مشکلات پزشکی دارد. در طول ده تا بیست سال گذشته، تلاش های فراوانی برای اعمال توانایی های محاسباتی در ترکیب فضاهای شیمیایی و بیولوژیکی برای تسهیل فرآیندهای کشف و طراحی دارو انجام گردیده است.

روش های منطقی طراحی دارو زمان و هزینه ی مورد نیاز در فرآیند طراحی دارو را در مقایسه با روش های سنتی کشف دارو تقلیل داده است. مطالعات QSAR/QSPR می توانند برای طراحی و شناسایی بازدارنده های جدید de novo و یا بهینه سازی جذب، توزیع، متابولیسم، مشخصات دفع و سمیت مولکول های شناسایی شده از منابع مختلف مورد استفاده قرار گیرند.

پیشرفت در تکنیک های محاسباتی و سخت افزارهای کاربردی، کاربرد روش های in silico را در پروسه ی طراحی دارو تسهیل نموده است.

مبانی QSAR و مدلینگ داده

طراحی دارو را می توان به دو دسته تقسیم بندی نمود:

۱- طراحی دارو بر مبنای ساختار (SBDD)

۲- طراحی دارو بر مبنای لیگاند (LBDD)

SBDD رویکردی است که از اطلاعات ساختاری داروی مورد هدف به منظور ایجاد مهارکننده های آن، استفاده می کند. در حالی که روش LBDD در غیاب اطلاعات سه بعدی گیرنده و با تکیه بر مولکول های متصل به هدف بیولوژیکی انجام می شود.

QSAR مخفف Quantitative structure-activity relationships می باشد که به روابط کمی ساختار-فعالیت اشاره دارد. روابط کمی ساختار-فعالیت (QSAR) این روزها نقش اساسی در فرآیند طراحی دارو دارند، چرا که جایگزین ارزانتری نسبت به آزمایشات in vitro و in vivo می باشند. همچنین، در کشف دارو و سم شناسی محیطی، مدل های QSAR اکنون به عنوان یک ابزار علمی معتبر برای پیش بینی و طبقه بندی فعالیت های بیولوژیکی ترکیبات آزمایش نشده، مقاومت دارویی، پیش بینی سمیت و پیش بینی خواص فیزیکوشیمیایی در نظر گرفته می شوند.

روش QSAR بر این مفهوم استوار است که تفاوت های مشاهده شده در فعالیت بیولوژیکی یک سری از ترکیبات را می توان از نظر کمی با تفاوت در ساختار مولکولی آنها مرتبط کرد. در نتیجه، همه فعالیت‌ها و عملکردهای بیولوژیکی مولکول‌ها به توصیف‌کننده‌های مولکولی خاص مربوط می‌شوند و از تکنیک‌های رگرسیون خاص می‌توان برای تخمین نقش‌های نسبی آن توصیف‌گرهایی که در اثر بیولوژیکی نقش دارند استفاده کرد.

همانطور که اشاره شد اصل اساسی این است که تغییرات در خواص ساختاری باعث فعالیت های بیولوژیکی متفاوتی می شود. خواص ساختاری به خواص فیزیکی و شیمیایی اشاره دارد و فعالیت های بیولوژیکی با خواص فارماکوکینتیکی مانند جذب، توزیع، متابولیسم، دفع و سمیت مطابقت دارد.

مدل‌سازی QSAR به اولویت‌بندی تعداد زیادی از مواد شیمیایی از نظر فعالیت‌های بیولوژیکی مورد نظرشان به عنوان یک روش insilico کمک می‌کند و در نتیجه تعداد مواد شیمیایی کاندید را به میزان قابل‌توجهی کاهش می‌دهد تا با آزمایشات in vivo آزمایش شوند. مدل‌سازی QSAR به‌عنوان یک فرآیند اجتناب‌ناپذیر در صنعت داروسازی عمل کرده است، اما محدودیت‌های زیادی دارد.

داده های QSAR ممکن است شامل تعداد بسیار زیادی از مواد شیمیایی باشد. هر ماده شیمیایی را می توان با انواع توصیفگرها نشان داد. اثر انگشت های رایج بسیار پراکنده هستند (بیشتر مقادیر صفر هستند) و برخی از ویژگی ها همبستگی بالایی دارند. فرض بر این است که مجموعه داده حاوی برخی خطاها است زیرا روابط از طریق آزمایش‌های in situ ارزیابی می‌شوند.

مبانی QSAR و مدلینگ داده

QSAR که رابطه فعالیت کمی و ساختار را نشان می دهد یکی از رویکردهای پرکاربرد در فرآیندهای طراحی دارویی مبتنی بر لیگاند است. در مطالعات QSAR/QSPR روابط بین روند تغییرات ساختار شیمیایی و تغییرات مربوطه در نقطه پایانی بیولوژیکی برای درک اینکه کدام ویژگی‌های شیمیایی احتمالا برای فعالیت‌های بیولوژیکی یا خواص فیزیکوشیمیایی آن‌ها تعیین‌کننده هستند، به طور کمی مرتبط و خلاصه می شوند.

روابط فعالیت کمی ساختار (QSARs) به معنای روش آماری کامپیوتری است که به توضیح واریانس مشاهده شده در تغییرات ساختار ناشی از جایگزینی کمک می کند. در این مفهوم فرض بر این است که فعالیت بیولوژیکی نشان‌داده‌شده توسط یک سری از ترکیبات که تابعی از آنالیزهای فیزیکوشیمیایی مختلف است که نشان می‌دهد خواص فیزیکی و شیمیایی خاصی برای فعالیت مطلوب است، می‌توان دومی را با انتخاب بهینه کرد.

هدف اصلی مطالعات QSAR/QSPR یافتن یک رابطه ریاضی بین فعالیت یا ویژگی مورد بررسی و یک یا چند پارامتر توصیفی یا توصیفگر مربوط به ساختار مولکول است. در QSAR، ساختار یک مولکول باید دارای ویژگی ها و خواصی باشد که مسئول فعالیت های فیزیکی، شیمیایی و بیولوژیکی آن است.

نرم افزارهای متعددی برای توسعه QSAR در دسترس هستند که یا به صورت تجاری ویا به صورت رایگان قابل استفاده می باشند. اینها شامل نرم افزارهای تخصصی برای ترسیم ساختارهای شیمیایی، تبدیل فرمت فایل های شیمیایی، تولید ساختارهای سه بعدی، محاسبه توصیفگرهای شیمیایی، توسعه مدل های QSAR و نرم افزارهای همه منظوره است که تمام اجزای لازم برای توسعه QSAR را دارند.

برای طراحی ساختار یا تبدیل فایل رایج ترین برنامه ها عبارتند از ChemDraw، ACD/ChemSketch و Open Babel. محصولات نرم افزاری ساختار سه بعدی CORINA، Concord، Frog، smi23d هستند. محاسبه Descriptor را می توان با استفاده از نرم افزار Dragon، Molconn-Z، PaDEL-Descriptor انجام داد. اولین گام مهم در مطالعه QSPR/QSAR، ورود ساختارهای مولکولی و تولید مدل‌های سه بعدی است. مدل های مولکولی سه بعدی برای محاسبات توصیفگر هندسی مورد نیاز است.

دومین مرحله مهم در مطالعه QSPR/QSAR، تولید توصیفگرهای ساختار مولکولی است. انتخاب مهمترین توصیفگرها مرحله سوم است و با استفاده از روش های انتخاب ویژگی می توان به آن دست یافت. چهارمین مرحله اصلی در مطالعه QSPR/QSAR، تولید مدل‌های QSPR/QSAR با استفاده از مجموعه‌های توصیفگر است. پنجمین و آخرین مرحله، اعتبارسنجی مدل با پیش‌بینی فعالیت ترکیبات در مجموعه پیش‌بینی خارجی است. نتایج به‌دست‌آمده توسط پیش‌بینی‌ها باید با نتایج به‌دست‌آمده برای مجموعه آموزشی و مجموعه اعتبارسنجی متقابل مقایسه شود تا به راحتی سطح fitness مدل را درک کنید.

مبانی QSAR و مدلینگ داده

با توجه به این محدودیت‌ها، دستیابی به یک امتیاز پیش‌بینی قابل اعتماد برای پیش‌بینی مدل مبتنی بر QSAR  دشوار شده است. در نتیجه، رویکردهای یادگیری ماشین برای پیش‌بینی QSAR اعمال شده‌اند. مدل‌های رگرسیون خطی و شبکه‌های عصبی Bayesian برای پیش‌بینی QSAR استفاده شده‌اند.

Random forest متداول‌ترین الگوریتم مورد استفاده با سطح بالایی از پیش‌بینی، سادگی و استحکام است.

RF نوعی روش مجموعه ای مبتنی بر درخت های تصمیم گیری چندگانه است که می تواند از تطبیق بیش از حد یک درخت تصمیم منفرد جلوگیری کند. RF به عنوان golden standard در این زمینه در نظر گرفته می شود بنابراین، روش‌های جدید پیش‌بینی QSAR اغلب عملکرد خود را در مقایسه با RF دارند.

رقابت Merck Kaggle در سال 2012 توجه مردم را به شبکه های عصبی معطوف کرد. تیم برنده از شبکه های عصبی چند وظیفه ای (MTNN) استفاده کرد. ساختار اساسی یادگیری مبتنی بر شبکه های عصبی feed-forward  است. تیم نتایجی به دست آورد که به طور مداوم از RF بهتر بود. علیرغم دستیابی به عملکرد بالا با استفاده از یک شبکه عصبی چند وظیفه ای، تیم در نهایت از مجموعه ای استفاده کرد که روش های مختلف را ترکیب می کرد.

هم RF و هم تکنیک فوق‌الذکر از Kaggle از یادگیری گروهی استفاده کردند، تکنیکی که مجموعه‌ای از مدل‌های یادگیری را ایجاد می‌کند و چندین مدل را برای تولید پیش‌بینی‌های نهایی ترکیب می‌کند. از نظر تئوری و تجربی، نشان داده شده است که اگر الگوریتم های فردی دقیق و متنوع باشند، قدرت پیش بینی یادگیری گروهی از یک یادگیرنده فراتر می رود. یادگیری گروهی، نقاط قوت و ضعف تک تک یادگیرندگان را مدیریت می‌کند، مشابه اینکه افراد در مواجهه با مسائل مهم، نظرات گوناگون را در نظر می‌گیرند.

با شرکت در کارآموزی طراحی دارو ژنیران دانش خود را در مورد مبانی QSAR و مدلینگ داده افزایش دهید:

دوره مهارت آموزی طراحی دارو

 

 

 

منبع

از این مطلب چقدر راضی بودید؟

روی ستاره کلیک کنید تا نظرتون ثبت بشه

4 / 5. تعداد رای دهندگان: 8

تا حالا امتیازی برای این مطلب ثبت نشده؛ با ثبت نظرتون مارو خوشحال می‌کنید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *