مقدمهای بر ابزار BLAST در بیوانفورماتیک
ابزار پایهای جستجوی همترازی محلی (BLAST) یکی از پرکاربردترین برنامههای بیوانفورماتیکی برای مقایسه توالیهای زیستی از جمله DNA، RNA و پروتئین است. این الگوریتم قدرتمند که توسط مرکز ملی اطلاعات زیستفناوری (NCBI) توسعه یافته، به پژوهشگران کمک میکند تا شباهتهای بین توالی مورد بررسی و توالیهای شناختهشده در پایگاههای داده زیستی را شناسایی کنند.
BLAST در حوزههایی مانند gene annotation، فیلوژنتیک، پیشبینی عملکرد پروتئین، نقشهبرداری ژنومی و مطالعات تکاملی کاربرد دارد. این ابزار با یافتن همترازیهای محلی، امکان مقایسه کارآمد توالیها را فراهم کرده و بهویژه برای تجزیهوتحلیل مجموعههای داده بزرگ بسیار مؤثر است.
مبنای عملکرد BLAST
BLAST بر اساس مراحل زیر عمل میکند:
- تجزیه توالی مورد جستجو به واحدهای کوچک یا «کلمات» ( بهطور پیشفرض: 11 نوکلئوتید برای DNA/RNA یا 3 اسید آمینه برای پروتئین)؛
- جستجوی کلمات دقیق یا مشابه در پایگاه داده؛
- گسترش و توسعه تطابقها با استفاده از ماتریسهای امتیازدهی همترازی؛
- محاسبه امتیازات همترازی برای رتبهبندی مهمترین تطابقها؛
- نمایش نتایج همراه با شاخصهای معناداری آماری (مقدارE-value و Bit score)
انواع الگوریتم های BLAST
BLAST در قالبهای مختلفی ارائه میشود که بسته به نوع توالی مورد جستجو و نوع مقایسه موردنظر انتخاب میشوند:
الگوریتم BLAST |
نوع توالی جستجو |
پایگاه داده جستجو |
کاربرد |
|
BLASTn |
DNA |
DNA |
|
|
BLASTp |
Protein |
Protein |
|
|
BLASTx |
DNA |
Protein |
|
|
tBLASTn |
Protein |
DNA ترجمه شده |
|
|
tBLASTx |
Translated DNA |
DNA ترجمه شده |
شناسایی نواحی حفاظتشده کدکننده پروتئین در گونههای مختلف |
نحوه استفاده از BLAST در وبسایت NCBI
NCBI یک رابط کاربری ساده برای اجرای جستجوهای BLAST ارائه میدهد. در ادامه، مراحل انجام این فرایند بهصورت گامبهگام شرح داده شده است:
گام 1: دسترسی به BLAST
- مرورگر وب را باز کرده و به صفحه اصلی BLAST در NCBI مراجعه کنید.
- بر اساس نوع توالی و هدف پژوهشی خود، الگوریتم BLAST مناسب را انتخاب کنید.
گام 2: وارد کردن توالی مورد جستجو
- توالی موردنظر (DNA،RNA یا پروتئین) را در کادر متنی جایگذاری کنید یا فایل FASTA را بارگذاری نمایید.
- پایگاه داده موردنظر را برای جستجو انتخاب کنید (مانند nr، RefSeq، SwissProt، PDB یا پایگاههای اختصاصی سفارشی.
- در صورت نیاز، از گزینه فیلتر کردن بر اساس موجودات زنده استفاده کنید تا نتایج به گونههای خاص محدود شوند.
گام 3: تنظیم پارامترها
گزینههای الگوریتمی:
- Max Target Sequences(حداکثر توالیهای هدف): تعیین تعداد نتایج موردنظر برای بازیابی.
- Word Size (اندازه کلمه): حداقل طول تطابق اولیه برای آغاز همردیفی را مشخص میکند.
- Expect Threshold (آستانه) (E-value): مقدار کمتر نشاندهنده نتایج معنادارتر و دقیقتر است.
- Scoring Matrix (ماتریس امتیازدهی) (مانند BLOSUM62 برای پروتئینها یا Match/Mismatch برای DNA ): نحوه امتیازدهی به شباهتها و عدم تطابقها را تعیین میکند.
- Gap Costs ( هزینه های گپگذار): تعیین جریمه برای حذف یا اضافه شدن بازها در همردیفی.
گزینههای پالایش:
- Masking Low Complexity Regions (ماسک کردن نواحی با پیچیدگی پایین): از ایجاد تطابقهای کاذب در توالیهای تکراری جلوگیری میکند.
- Exclude Uncultured or Predicted Sequences (حذف توالیهای پیشبینیشده یا فاقد کشت آزمایشگاهی): دادههای فاقد اعتبار تجربی را فیلتر میکند.
گام 4: اجرای جستجوی BLAST
- روی دکمه “BLAST” کلیک کنید تا آنالیز آغاز شود.
- سیستم جستجو را در صف پردازش قرار داده و زمان تقریبی انتظار را نمایش میدهد.
- پس از تکمیل جستجو، نتایج بهصورت همردیفی (alignment) نمایش داده میشوند.
نکته: بسته به اندازه پایگاه داده و نوع BLAST انتخابی، پردازش ممکن است چند ثانیه تا چند دقیقه طول بکشد.
تفسیر خروجی BLAST
پس از تکمیل جستجو، BLAST چندین قالب خروجی ارائه میدهد که هر کدام اطلاعات مختلفی درباره نتایج همردیفی فراهم میکنند:
1️⃣ نمایش گرافیکی (Graphical Summary):
- نمایش تصویری تطابقهای بهدستآمده، کدگذاریشده با رنگ بر اساس امتیاز همردیفی (قرمز= شباهت بالا، آبی= شباهت ضعیف).
2️⃣ جدول توصیفی (Descriptive Table):
- فهرستی از توالیهای یافتشده همراه با شماره دسترسی (Accession Number)، امتیاز همردیفی، مقدار E-value (که نشاندهنده سطح معناداری نتیجه است) و درصد شباهت (Percentage Identity).
3️⃣ همردیفی زوجی (Pairwise Alignment):
- نمایش دقیق همردیفی شامل بازهای تطابقیافته، عدم تطابقها، و گپهای توالی.
4️⃣ گزارش تاکسونومی (Taxonomy Report):
- توزیع تاکسونومیکی توالیهای مشابه را ارائه داده و نشان میدهد که بیشترین شباهتها مربوط به چه گونههایی هستند.
5️⃣ فرمتهای قابل دانلود (Downloadable Formats):
- نتایج را میتوان در قالبهای FASTA، XML، JSON و TSV برای تحلیلهای بعدی ذخیره و پردازش کرد.
ویژگیهای پیشرفته BLAST
BLAST امکان سفارشی سازی و انجام تحلیلهای پیشرفته را فراهم میکند:
1️⃣ پایگاههای داده سفارشی (Custom Databases):
- کاربران میتوانند توالیهای دلخواه خود را بارگذاری کرده و جستجوهای BLAST را بهصورت محلی بر روی دادههای اختصاصی انجام دهند.
2️⃣ BLAST+ (نسخه مستقل):
- نسخه مستقل BLAST قابل نصب بر روی سیستمعاملهای Linux، Windows و macOS است و امکان اجرای جستجوهای محلی را فراهم میکند.
3️⃣ رابط خط فرمان BLAST (BLAST Command-Line Interface – CLI):
- این قابلیت اجازه میدهد که پردازشهای دستهای انجام شده و BLAST با خطوط لوله بیوانفورماتیکی ادغام شود.
4️⃣ PSI-BLAST (Position-Specific Iterated BLAST):
- این نسخه بهصورت تکراری اجرا شده و نتایج را برای یافتن همولوگهای دوردست بهینهسازی میکند.
5️⃣ Delta-BLAST:
- از اطلاعات دامنههای حفاظتی (Conserved Domains) برای شناسایی دقیقتر همولوگهای دور استفاده میکند
کاربردهای BLAST
BLAST بهطور گسترده در زمینههای مختلف علوم زیستی مورد استفاده قرار میگیرد:
📌 ژنومیکس و مطالعات تکاملی
- شناسایی ژنهای همولوگ در گونههای مختلف.
- بازسازی درختهای فیلوژنتیکی بر اساس شباهت توالیها.
📌 میکروبیولوژی پزشکی و بالینی
- تشخیص ژنهای مقاومت آنتیبیوتیکی در پاتوژنها.
- شناسایی جهشهای مرتبط با بیماری در DNA انسانی.
📌 زیستشناسی مولکولی و بیوتکنولوژی
- یافتن پروتئینهای مشابه برای طراحی داروهای نوین.
- شناسایی آنزیمهای کاربردی برای فرآیندهای صنعتی.
📌 علوم جنایی و محیطزیست
- ردیابی سویههای باکتریایی در اکوسیستمها.
- شناسایی گونههای زیستی از نمونههای DNA ناشناخته.
محدودیتهای BLAST
با وجود کارایی بالا، BLAST دارای برخی محدودیتها است:
- محاسبات سنگین: پردازش توالیهای حجیم زمانبر است.
- حساسیت محدود: فقط ترازهای محلی را شناسایی کرده و همولوژیهای ضعیف را از دست میدهد.
- وابستگی به پایگاههای داده: عملکرد آن به دادههای موجود بستگی دارد و ممکن است توالیهای جدید را پوشش ندهد.
- نتایج مثبت کاذب: مناطق با پیچیدگی کم و توالیهای تکراری ممکن است منجر به نتایج گمراهکننده شوند.
نتیجهگیری
BLAST همچنان یکی از قویترین و پرکاربردترین ابزارهای بیوانفورماتیکی برای همترازی توالیها و جستجوی شباهتهای ژنتیکی محسوب میشود. این ابزار در حوزههای مختلفی از جمله حاشیهنویسی ژنها، مطالعات تکاملی و تشخیصهای بالینی نقش حیاتی دارد و اطلاعات ارزشمندی درباره روابط ژنتیکی و عملکرد پروتئینها ارائه میدهد. با پیشرفتهای مداوم، از جمله ادغام الگوریتمهای مبتنی بر یادگیری ماشین، BLAST همچنان در حال تکامل است و به عنوان ابزاری ضروری در زیستشناسی محاسباتی باقی خواهد ماند.
همچنین بخوانید:
مترجم: یاسمین شعبانی
ویراستاری: فریماه حاجی حبیب یزدی