ابزار BLAST در بیوانفورماتیک: کاربرد، نحوه استفاده و تفسیر خروجی

ابزار BLAST در بیوانفورماتیک

مقدمه‌ای بر ابزار BLAST در بیوانفورماتیک

ابزار پایه‌ای جستجوی هم‌ترازی محلی (BLAST) یکی از پرکاربردترین برنامه‌های بیوانفورماتیکی برای مقایسه توالی‌های زیستی از جمله DNA، RNA  و پروتئین است. این الگوریتم قدرتمند که توسط مرکز ملی اطلاعات زیست‌فناوری (NCBI) توسعه یافته، به پژوهشگران کمک می‌کند تا شباهت‌های بین توالی مورد بررسی و توالی‌های شناخته‌شده در پایگاه‌های داده زیستی را شناسایی کنند.

 BLAST  در حوزه‌هایی مانند gene annotation، فیلوژنتیک، پیش‌بینی عملکرد پروتئین، نقشه‌برداری ژنومی و مطالعات تکاملی کاربرد دارد. این ابزار با یافتن هم‌ترازی‌های محلی، امکان مقایسه کارآمد توالی‌ها را فراهم کرده و به‌ویژه برای تجزیه‌‌و‌تحلیل مجموعه‌های داده بزرگ بسیار مؤثر است.

مبنای عملکرد BLAST

BLAST بر اساس مراحل زیر عمل می‌کند:

  1. تجزیه توالی مورد جستجو به واحدهای کوچک یا «کلمات» ( به‌طور پیش‌فرض: 11 نوکلئوتید برای DNA/RNA یا 3 اسید آمینه برای پروتئین)؛مبنای عملکرد BLAST
  2. جستجوی کلمات دقیق یا مشابه در پایگاه داده؛
  3. گسترش و توسعه تطابق‌ها با استفاده از ماتریس‌های امتیازدهی هم‌ترازی؛
  4. محاسبه امتیازات هم‌ترازی برای رتبه‌بندی مهم‌ترین تطابق‌ها؛
  5. نمایش نتایج همراه با شاخص‌های معناداری آماری (مقدارE-value  و Bit score)

انواع الگوریتم های BLAST

BLAST در قالب‌های مختلفی ارائه می‌شود که بسته به نوع توالی مورد جستجو و نوع مقایسه موردنظر انتخاب می‌شوند:

الگوریتم BLAST

نوع توالی جستجو

پایگاه داده جستجو

کاربرد

BLASTn

DNA

DNA

شناسایی ژن‌های همولوگ، تعیین گونه‌ها

BLASTp

Protein

Protein

یافتن شباهت‌های پروتئینی، پیش‌بینی عملکرد پروتئین

BLASTx

DNA

Protein

شناسایی پروتئین‌های بالقوه کدشده توسط یک توالی نوکلئوتیدی

tBLASTn

Protein

DNA

ترجمه شده

تشخیص همولوگ‌های پروتئینی در ژنوم‌ها

tBLASTx

Translated DNA

DNA

ترجمه شده

شناسایی نواحی حفاظت‌شده کدکننده پروتئین در گونه‌های مختلف

نحوه استفاده از BLAST در وب‌سایت NCBI

NCBI یک رابط کاربری ساده برای اجرای جستجوهای BLAST ارائه می‌دهد. در ادامه، مراحل انجام این فرایند به‌صورت گام‌به‌گام شرح داده شده است:

گام 1: دسترسی به BLAST

  1. مرورگر وب را باز کرده و به صفحه اصلی BLAST در NCBI مراجعه کنید.
  2. بر اساس نوع توالی و هدف پژوهشی خود، الگوریتم BLAST مناسب را انتخاب کنید.

گام 2: وارد کردن توالی مورد جستجو

  1. توالی موردنظر (DNA،RNA  یا پروتئین) را در کادر متنی جای‌گذاری کنید یا فایل FASTA را بارگذاری نمایید.
  2. پایگاه داده موردنظر را برای جستجو انتخاب کنید (مانند nr، RefSeq، SwissProt، PDB یا پایگاه‌های اختصاصی سفارشی.
  3. در صورت نیاز، از گزینه فیلتر کردن بر اساس موجودات زنده استفاده کنید تا نتایج به گونه‌های خاص محدود شوند.

گام 3: تنظیم پارامترها

گزینه‌های الگوریتمی:

  •  Max Target Sequences(حداکثر توالی‌های هدف): تعیین تعداد نتایج موردنظر برای بازیابی.
  • Word Size (اندازه کلمه): حداقل طول تطابق اولیه برای آغاز هم‌ردیفی را مشخص می‌کند.
  • Expect Threshold  (آستانه) (E-value): مقدار کمتر نشان‌دهنده نتایج معنادارتر و دقیق‌تر است.
  • Scoring Matrix  (ماتریس امتیازدهی) (مانند BLOSUM62 برای پروتئین‌ها یا Match/Mismatch برای DNA ): نحوه امتیازدهی به شباهت‌ها و عدم تطابق‌ها را تعیین می‌کند.
  • Gap Costs ( هزینه ‌های گپ‌گذار): تعیین جریمه برای حذف یا اضافه شدن بازها در هم‌ردیفی.

گزینه‌های پالایش:

  • Masking Low Complexity Regions  (ماسک کردن نواحی با پیچیدگی پایین):  از ایجاد تطابق‌های کاذب در توالی‌های تکراری جلوگیری می‌کند.
  • Exclude Uncultured or Predicted Sequences  (حذف توالی‌های پیش‌بینی‌شده یا فاقد کشت آزمایشگاهی): داده‌های فاقد اعتبار تجربی را فیلتر می‌کند.

گام 4: اجرای جستجوی BLAST

  1. روی دکمه “BLAST” کلیک کنید تا آنالیز آغاز شود.
  2. سیستم جستجو را در صف پردازش قرار داده و زمان تقریبی انتظار را نمایش می‌دهد.
  3. پس از تکمیل جستجو، نتایج به‌صورت هم‌ردیفی (alignment) نمایش داده می‌شوند.

نکته: بسته به اندازه پایگاه داده و نوع BLAST انتخابی، پردازش ممکن است چند ثانیه تا چند دقیقه طول بکشد.

تفسیر خروجی BLAST

پس از تکمیل جستجو، BLAST چندین قالب خروجی ارائه می‌دهد که هر کدام اطلاعات مختلفی درباره نتایج هم‌ردیفی فراهم می‌کنند:

1️⃣ نمایش گرافیکی (Graphical Summary):

  • نمایش تصویری تطابق‌های به‌دست‌آمده، کدگذاری‌شده با رنگ بر اساس امتیاز هم‌ردیفی (قرمز= شباهت بالا، آبی= شباهت ضعیف).

2️⃣ جدول توصیفی (Descriptive Table):

  • فهرستی از توالی‌های یافت‌شده همراه با شماره دسترسی (Accession Number)، امتیاز هم‌ردیفی، مقدار E-value (که نشان‌دهنده سطح معناداری نتیجه است) و درصد شباهت (Percentage Identity).

3️⃣ هم‌ردیفی زوجی (Pairwise Alignment):

  • نمایش دقیق هم‌ردیفی شامل بازهای تطابق‌یافته، عدم تطابق‌ها، و گپ‌های توالی.

4️⃣ گزارش تاکسونومی (Taxonomy Report):

  • توزیع تاکسونومیکی توالی‌های مشابه را ارائه داده و نشان می‌دهد که بیشترین شباهت‌ها مربوط به چه گونه‌هایی هستند.

5️⃣ فرمت‌های قابل دانلود  (Downloadable Formats):

  • نتایج را می‌توان در قالب‌های FASTA، XML، JSON و TSV برای تحلیل‌های بعدی ذخیره و پردازش کرد.

ویژگی‌های پیشرفته BLAST

BLAST  امکان سفارشی سازی و انجام تحلیل‌های پیشرفته را فراهم می‌کند:

1️⃣ پایگاه‌های داده سفارشی (Custom Databases):

  • کاربران می‌توانند توالی‌های دلخواه خود را بارگذاری کرده و جستجوهای BLAST را به‌صورت محلی بر روی داده‌های اختصاصی انجام دهند.

2️⃣ BLAST+ (نسخه مستقل):

  • نسخه مستقل BLAST قابل نصب بر روی سیستم‌عامل‌های Linux، Windows  و macOS است و امکان اجرای جستجوهای محلی را فراهم می‌کند.

3️⃣ رابط خط فرمان BLAST (BLAST Command-Line Interface – CLI):

  • این قابلیت اجازه می‌دهد که پردازش‌های دسته‌ای انجام شده و BLAST با خطوط لوله بیوانفورماتیکی ادغام شود.

4️⃣ PSI-BLAST (Position-Specific Iterated BLAST):

  • این نسخه به‌صورت تکراری اجرا شده و نتایج را برای یافتن همولوگ‌های دوردست بهینه‌سازی می‌کند.

5️⃣  Delta-BLAST:

  • از اطلاعات دامنه‌های حفاظتی (Conserved Domains) برای شناسایی دقیق‌تر همولوگ‌های دور استفاده می‌کند

کاربردهای BLAST

BLAST به‌طور گسترده در زمینه‌های مختلف علوم زیستی مورد استفاده قرار می‌گیرد:

📌 ژنومیکس و مطالعات تکاملی

  • شناسایی ژن‌های همولوگ در گونه‌های مختلف.
  • بازسازی درخت‌های فیلوژنتیکی بر اساس شباهت توالی‌ها.

📌 میکروبیولوژی پزشکی و بالینی

  • تشخیص ژن‌های مقاومت آنتی‌بیوتیکی در پاتوژن‌ها.
  • شناسایی جهش‌های مرتبط با بیماری در DNA انسانی.

📌 زیست‌شناسی مولکولی و بیوتکنولوژی

  • یافتن پروتئین‌های مشابه برای طراحی داروهای نوین.
  • شناسایی آنزیم‌های کاربردی برای فرآیندهای صنعتی.

📌 علوم جنایی و محیط‌زیست

  • ردیابی سویه‌های باکتریایی در اکوسیستم‌ها.
  • شناسایی گونه‌های زیستی از نمونه‌های DNA ناشناخته.

محدودیت‌های BLAST

با وجود کارایی بالا، BLAST دارای برخی محدودیت‌ها است:

  • محاسبات سنگین: پردازش توالی‌های حجیم زمان‌بر است.
  • حساسیت محدود:  فقط ترازهای محلی را شناسایی کرده و همولوژی‌های ضعیف را از دست می‌دهد.
  • وابستگی به پایگاه‌های داده: عملکرد آن به داده‌های موجود بستگی دارد و ممکن است توالی‌های جدید را پوشش ندهد.
  • نتایج مثبت کاذب: مناطق با پیچیدگی کم و توالی‌های تکراری ممکن است منجر به نتایج گمراه‌کننده شوند.

نتیجه‌گیری

BLAST  همچنان یکی از قوی‌ترین و پرکاربردترین ابزارهای بیوانفورماتیکی برای هم‌ترازی توالی‌ها و جستجوی شباهت‌های ژنتیکی محسوب می‌شود. این ابزار در حوزه‌های مختلفی از جمله حاشیه‌نویسی ژن‌ها، مطالعات تکاملی و تشخیص‌های بالینی نقش حیاتی دارد و اطلاعات ارزشمندی درباره روابط ژنتیکی و عملکرد پروتئین‌ها ارائه می‌دهد. با پیشرفت‌های مداوم، از جمله ادغام الگوریتم‌های مبتنی بر یادگیری ماشین، BLAST  همچنان در حال تکامل است و به عنوان ابزاری ضروری در زیست‌شناسی محاسباتی باقی خواهد ماند.

همچنین بخوانید:

مترجم: یاسمین شعبانی
ویراستاری: فریماه حاجی حبیب یزدی

از این مطلب چقدر راضی بودید؟

روی ستاره کلیک کنید تا نظرتون ثبت بشه

3.7 / 5. تعداد رای دهندگان: 3

تا حالا امتیازی برای این مطلب ثبت نشده؛ با ثبت نظرتون مارو خوشحال می‌کنید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *