آشنایی با NCBI: ابزارها، کاربردها و یافتن توالی های ژن

NCBI and Gene database
فهرست مطالب نمایش

 

مرکز ملی اطلاعات زیست‌فناوری (NCBI)

مرکز ملی اطلاعات زیست‌فناوری (NCBI) بخشی از کتابخانه ملی پزشکی ایالات متحده است که خود یک شاخه از مؤسسات ملی بهداشت (NIH) است. این مرکز دسترسی به منابع گسترده‌ای در زمینه‌های زیست‌فناوری و پزشکی زیستی را فراهم می‌کند. برخی از منابع کلیدی ارائه شده توسط NCBI عبارتند از:

  1. PubMed: پایگاهی از مقالات پزشکی زیستی، عمدتاً مقالات مجلات.
  2. GenBank: پایگاهی از توالی‌های DNA.
  3. BLAST: ابزاری برای مقایسه توالی بیولوژیکی یک فرد با پایگاه داده‌ای از توالی‌ها.
  4. Bookshelf: مجموعه‌ای از کتاب‌ها و اسناد رایگان آنلاین در علوم زندگی و مراقبت‌های بهداشتی.
  5. ClinVar: منبعی برای واریانت‌های بالینی و ارتباط آنها با شرایط بهداشتی.

منابع NCBI به طور گسترده توسط پژوهشگران، پزشکان و دانشجویان در زمینه‌های زیست‌شناسی و پزشکی مورد استفاده قرار می‌گیرد.

تاریخچه و تأسیس NCBI

مرکز ملی اطلاعات زیست‌فناوری (NCBI) در سال 1988 به عنوان بخشی از مؤسسات ملی بهداشت (NIH) در ایالات متحده تأسیس شد. ایجاد آن به دلیل نیاز به پیشتیبانی از تحقیقات در زیست‌شناسی مولکولی و ژنتیک صورت گرفت.

NCBI

نکات کلیدی در تاریخچه آن:

  1. تأسیس (1988): NCBI تحت قانون مصالحه بودجه جامع تأسیس شد، با هدف ایجاد یک مخزن مرکزی برای اطلاعات بیولوژیکی.
  2. توسعه‌های اولیه (دهه 1990): NCBI چندین پایگاه داده و ابزار مهم را توسعه داد، از جمله GenBank، یک پایگاه داده عمومی قابل دسترسی برای توالی‌های DNA. همچنین در توسعه BLAST (ابزار جستجوی هم‌ترازی محلی باز) مشارکت کرد، یک ابزار پرکاربرد برای مقایسه توالی‌های بیولوژیکی.
  3. گسترش و نوآوری (دهه 2000): NCBI به گسترش منابع خود ادامه داد، با ادغام طیف گسترده‌ای از داده‌ها و ابزارهای بیولوژیکی. این مرکز نقش مهمی در پروژه ژنوم انسانی ایفا کرد که کل ژنوم انسان را ترسیم کرد.
  4. پیشرفت‌های اخیر (دهه 2010-2020): NCBI همچنان به تکامل خود ادامه داده است، با ادغام فناوری‌های جدید و گسترش پایگاه داده‌ها و ابزارهای خود برای پیشتیبانی از طیف گسترده‌ای از تحقیقات پزشکی زیستی.

امروزه NCBI یک منبع حیاتی برای پژوهشگران در سراسر جهان است و دسترسی به طیف وسیعی از پایگاه داده‌ها، ابزارها و نرم‌افزارهایی را ارائه می‌دهد که از تحقیقات ژنومی، توسعه دارو و بسیاری از زمینه‌های دیگر علوم پزشکی زیستی پیشتیبانی می‌کنند.

مأموریت و اهداف NCBI

مأموریت مرکز ملی اطلاعات زیست‌فناوری (NCBI) پیشبرد علم و سلامت با ارائه دسترسی به اطلاعات پزشکی زیستی و ژنومی است. اهداف آن حول محور پیشتیبانی از جامعه تحقیقاتی و تسهیل کشف علمی متمرکز شده است. اهداف کلیدی عبارتند از:

داده‌ها:

  • مخزن و دسترسی: جمع‌آوری، نگهداری و ارائه دسترسی به طیف گسترده‌ای از داده‌های بیولوژیکی و پزشکی زیستی، از جمله اطلاعات ژنومی، رونویسی و پروتئومی.

تحقیق:

  • پشتیبانی: توسعه و ارائه ابزارها و منابعی که محققان را در تجزیه و تحلیل و تفسیر داده‌های بیولوژیکی، مانند ابزارهای هم‌ترازی توالی (مثلاً BLAST)، ابزارهای تجزیه و تحلیل بیان ژن و موارد دیگر، یاری می‌کنند.

تسهیل کشف:

  • حمایت از کشف علمی با در دسترس قرار دادن داده‌ها و ابزارها برای محققان در سطح جهانی، و در نتیجه تقویت نوآوری و یافته‌های جدید در زمینه‌های ژنومیکس، زیست‌شناسی مولکولی و حوزه‌های مرتبط.

همکاری و ادغام:

  • همکاری با سازمان‌ها و مؤسسات تحقیقاتی دیگر برای ادغام و هماهنگ‌سازی داده‌های بیولوژیکی از منابع مختلف، بهبود کارایی و دسترسی به داده‌ها.

منابع آموزشی:

  • ارائه مواد و منابع آموزشی برای کمک به محققان، مربیان و دانشجویان در درک و استفاده مؤثر از ابزارها و پایگاه‌های داده NCBI.

تأثیر بر سلامت عمومی:

  • پیشتیبانی از سلامت عمومی با امکان‌پذیر کردن تحقیقاتی که می‌تواند منجر به درک، تشخیص و درمان بهتر بیماری‌ها شود و در نهایت سلامت انسان را بهبود بخشد.

NCBI

منابع و پایگاه‌های داده کلیدی NCBI

NCBI طیف گسترده‌ای از منابع و پایگاه‌های داده را ارائه می‌دهد که برای جنبه‌های مختلف تحقیقات پزشکی زیستی و ژنومی ضروری هستند. در اینجا برخی از منابع کلیدی آورده شده است: این منابع به محققان اجازه می‌دهند تا به سرعت اطلاعات مورد نیاز خود را بیابند و به تجزیه و تحلیل داده‌های پیچیده بپردازند و در نتیجه سرعت پیشرفت تحقیقات در حوزه زیست‌شناسی را افزایش دهند. با استفاده از این پایگاه‌ها، دانشمندان می‌توانند به کشف روابط بین ژن‌ها، بیماری‌ها و داروها پرداخته و در نهایت به توسعه درمان‌های جدید کمک کنند.

GenBank:

  • یک پایگاه داده عمومی جامع از توالی‌های نوکلئوتیدی از انواع مختلف ارگانیسم‌ها. شامل توالی‌هایی از مطالعات آزمایشی و مقالات است.

PubMed:

PubMed

  • پایگاهی از مقالات پزشکی زیستی، از جمله مقالات مجلات در زمینه‌های پزشکی، علوم زندگی و رشته‌های مرتبط. PubMed یک منبع کلیدی برای یافتن مقالات تحقیقاتی و بررسی‌ها است.

BLAST (Basic Local Alignment Search Tool):

BLAST

  • ابزاری پرکاربرد برای مقایسه یک توالی ورودی با یک پایگاه داده برای یافتن نواحی شباهت محلی. برای هم‌ترازی و انوتیت کردن (annotation) توالی ضروری است.

Entrez:

  • یک سیستم جستجو و بازیابی که دسترسی به انواع مختلف پایگاه داده‌ها، از جمله توالی‌های نوکلئوتیدی و پروتئینی، طبقه‌بندی، مقالات و موارد دیگر را فراهم می‌کند.

dbSNP:

  • پایگاهی از چندشکلی‌های تک نوکلئوتیدی (SNP) و سایر تغییرات ژنتیکی. برای مطالعه تغییرات ژنتیکی و تأثیر آن بر سلامت و بیماری مفید است.

RefSeq:

  • مجموعه‌ای انتخاب شده از توالی‌های مرجع برای ژنوم‌ها، رونوشت‌ها و پروتئین‌ها. RefSeq یک نمایش جامع و دقیق از توالی‌های ژن‌ها و محصولات آن‌ها را ارائه می‌دهد.

Gene:

  • پایگاهی که اطلاعات مفصلی درباره ژن‌ها، از جمله عملکرد، ساختار و بیماری‌های مرتبط با آن‌ها ارائه می‌دهد.

GEO (Gene Expression Omnibus):

  • پایگاهی از داده‌های بیان ژن پر بازده و سایر مجموعه داده‌های ژنومیکس عملکردی. دسترسی به داده‌های بیان ژن از آزمایش‌های مختلف را فراهم می‌کند.

OMIM (Online Mendelian Inheritance in Man):

  • پایگاه داده جامعی از ژن‌های انسانی و اختلالات ژنتیکی. اطلاعاتی در مورد مبانی ژنتیکی بیماری‌ها و ویژگی‌ها ارائه می‌دهد.

BLAST:

  • یک ابزار هم‌ترازی توالی برای شناسایی نواحی شباهت بین توالی‌های بیولوژیکی استفاده می‌شود. اغلب برای مقایسه توالی‌های ژن یا پروتئین استفاده می‌شود.

PubChem:

  • پایگاهی از مولکول‌های شیمیایی و فعالیت‌های آن‌ها. شامل اطلاعات در مورد مواد شیمیایی، ترکیبات و فعالیت‌های بیولوژیکی آن‌ها است.

ابزارها و خدمات NCBI

NCBI طیف وسیعی از ابزارها و خدمات را ارائه می‌دهد که برای پشتیبانی از جنبه‌های مختلف تحقیقات پزشکی زیستی و ژنومی طراحی شده‌اند. NCBI با ارائه طیف گسترده‌ای از ابزارها و خدمات، نیازهای متنوع محققان در حوزه‌های مختلف زیست‌شناسی را برآورده می‌کند و یک پلتفرم جامع برای انجام تحقیقات ژنومی فراهم می‌آورد. در اینجا برخی از ابزارها و خدمات کلیدی آورده شده است.

BLAST (Basic Local Alignment Search Tool):

  • ابزاری برای مقایسه یک توالی ورودی (نوکلئوتیدی یا پروتئینی) با یک پایگاه داده برای یافتن نواحی شباهت محلی. در هم‌ترازی توالی و انوتیت کردن (annotation) عملکردی کمک می‌کند.

Entrez:

  • یک سیستم جستجو و بازیابی که به کاربران امکان دسترسی و جستجوی چندین پایگاه داده NCBI، از جمله PubMed، GenBank و موارد دیگر، از یک رابط واحد را می‌دهد.

Genome Data Viewer (GDV):

  • ابزاری برای تجسم و کاوش داده‌های ژنومی. دیدگاه‌های تعاملی از ژنوم‌ها، انوتیت کردن (annotation)‌ و ویژگی‌های دیگر ژنومی را ارائه می‌دهد.

Gene Expression Omnibus (GEO):

  • مخزنی برای داده‌های بیان ژن پر بازده و سایر مجموعه داده‌های ژنومیکس عملکردی. GEO ابزارهایی برای تجزیه و تحلیل و تجسم داده‌های بیان ژن ارائه می‌دهد.

dbSNP:

انواع پایگاه داده های کلینیکال: dbsnp

  • پایگاهی که اطلاعاتی درباره چندشکلی‌های تک نوکلئوتیدی (SNP) و سایر تغییرات ژنتیکی را ارائه می‌دهد. شامل ابزارهایی برای پرس‌وجو و تجزیه و تحلیل داده‌های تغییرات ژنتیکی است.

RefSeq:

  • مجموعه‌ای انتخاب شده از توالی‌های مرجع برای ژنوم‌ها، رونوشت‌ها و پروتئین‌ها را ارائه می‌دهد. RefSeq ابزارهایی برای مشاهده و تجزیه و تحلیل این توالی‌ها را ارائه می‌دهد.

PubChem:

  • پایگاهی از مولکول‌های شیمیایی و فعالیت‌های بیولوژیکی آن‌ها. شامل ابزارهایی برای جستجو و تجزیه و تحلیل داده‌های شیمیایی است.

NCBI Variation Viewer:

  • ابزاری برای تجسم و کاوش واریانت‌های ژنتیکی در زمینه ژنوم. به محققان کمک می‌کند تا تأثیر واریانت‌ها بر عملکرد ژن و فنوتیپ را درک کنند.

Protein Data Bank (PDB) Tools:

  • ابزارهایی برای مشاهده و تجزیه و تحلیل ساختارهای 3 بعدی پروتئین‌ها و سایر ماکرومولکول‌ها. PDB دسترسی به داده‌های ساختاری و ابزارهای تجسم را فراهم می‌کند.

BLAST+ Command Line Tools:

  • مجموعه‌ای از ابزارهای خط فرمان برای انجام جستجوهای BLAST. این ابزارها برای کاربرانی که ترجیح می‌دهند از اسکریپت‌نویسی و پردازش دسته‌ای استفاده کنند، مفید هستند.

Taxonomy Browser:

  • ابزاری برای کاوش طبقه‌بندی ارگانیسم‌ها. دسترسی به طبقه‌بندی‌های سلسله‌مراتبی و اطلاعات مربوط به گونه‌های مختلف را فراهم می‌کند.

Sequence Read Archive (SRA):

  • پایگاهی از داده‌های خام توالی‌خوانی از فناوری‌های مختلف توالی‌خوانی پر بازده. SRA ابزارهایی برای دسترسی و تجزیه و تحلیل این داده‌ها را ارائه می‌دهد.

کاربردها و تأثیر NCBI

مرکز ملی اطلاعات زیست‌فناوری (NCBI) طیف گسترده‌ای از کاربردها و تأثیر قابل توجهی بر زمینه‌های مختلف علم و پزشکی دارد. در اینجا برخی از حوزه‌های کلیدی که منابع و ابزارهای NCBI در آن‌ها تأثیرگذار هستند، آورده شده است:

کاربردها:

  • تحقیقات ژنومی:
    • تجزیه و تحلیل توالی: ابزارهایی مانند BLAST و پایگاه‌های داده مانند GenBank و RefSeq به محققان امکان می‌دهند تا توالی‌های DNA، RNA و پروتئین را تجزیه و تحلیل و مقایسه کنند، که تسهیل‌کننده شناسایی ژن‌ها، تغییرات ژنتیکی و عناصر عملکردی است.
    • نقشه‌برداری ژنتیکی: منابع NCBI در نقشه‌برداری ژن‌ها به مکان‌های خاص روی کروموزوم‌ها کمک می‌کنند، که در درک عملکرد ژن و مبانی ژنتیکی بیماری‌ها کمک می‌کند.
  • کشف و توسعه دارو:
    • اطلاعات شیمیایی: PubChem اطلاعات مفصلی درباره ترکیبات شیمیایی و فعالیت‌های بیولوژیکی آن‌ها ارائه می‌دهد، که از کشف و توسعه دارو پشتیبانی می‌کند.
    • تجزیه و تحلیل تغییرات ژنتیکی: پایگاه‌های داده مانند dbSNP در شناسایی تغییرات ژنتیکی که ممکن است بر پاسخ و اثربخشی دارو تأثیر بگذارند، کمک می‌کنند.
  • تحقیقات بیماری:
    • اختلالات ژنتیکی: OMIM اطلاعات جامعی درباره اختلالات ژنتیکی و مکانیسم‌های مولکولی آن‌ها ارائه می‌دهد، که به محققان در درک مبانی ژنتیکی بیماری‌ها و شناسایی اهداف درمانی بالقوه کمک می‌کند.
    • مطالعات بیان ژن: GEO دسترسی به داده‌های بیان ژن پر بازده را فراهم می‌کند، که به محققان اجازه می‌دهد تا تغییرات بیان ژن را در شرایط یا بیماری‌های مختلف مطالعه کنند.
  • پزشکی شخصی:
    • تفسیر واریانت: ابزارها و پایگاه‌های داده در تفسیر واریانت‌های ژنتیکی در زمینه سلامت و بیماری کمک می‌کنند، که برای توسعه رویکردهای پزشکی شخصی بسیار مهم است.
  • بیوانفورماتیک و زیست‌شناسی محاسباتی:
    • ادغام داده‌ها: ابزارها و پایگاه‌های داده NCBI ادغام و تجزیه و تحلیل داده‌های بیولوژیکی مقیاس بزرگ را تسهیل می‌کنند، که از تحقیقات زیست‌شناسی محاسباتی و توسعه الگوریتم‌ها و روش‌های جدید پشتیبانی می‌کنند.
  • منابع آموزشی:
    • آموزش و آموزش‌ها: NCBI مواد آموزشی و منابع آموزشی را برای کمک به محققان، مربیان و دانشجویان در استفاده مؤثر از ابزارها و پایگاه‌های داده خود ارائه می‌دهد.

تأثیر NCBI

پیشبرد کشف علمی:

منابع NCBI در پیشرفت‌های علمی متعددی، از جمله شناسایی ژن‌های مرتبط با بیماری، توسعه درمان‌های جدید و پیشرفت‌های در ژنومیکس و بیوانفورماتیک، نقش اساسی داشته‌اند.

تسهیل همکاری:

با ارائه دسترسی آزاد به منابع گسترده‌ای از داده‌های بیولوژیکی، NCBI همکاری بین محققان در سراسر جهان را تقویت می‌کند، و به آن‌ها امکان می‌دهد داده‌ها را به اشتراک بگذارند، یافته‌ها را تأیید کنند و بر کار یکدیگر بسازند.

پیشتیبانی از سلامت عمومی:

منابع NCBI به درک مبانی ژنتیکی بیماری‌ها کمک می‌کنند، که می‌تواند منجر به ابزارهای تشخیصی، درمان‌ها و استراتژی‌های سلامت عمومی بهتر شود.

تقویت دسترسی به داده‌ها:

تعهد NCBI به دسترسی آزاد تضمین می‌کند که محققان، پزشکان و عموم مردم می‌توانند بدون هیچ مانعی به اطلاعات ارزشمند بیولوژیکی دسترسی داشته باشند، که ترویج شفافیت و انتشار دانش را تقویت می‌کند.

رانندگی نوآوری:

توسعه ابزارها و پایگاه‌های داده جدید توسط NCBI، نوآوری در بیوانفورماتیک، ژنومیکس و زمینه‌های مرتبط را تقویت می‌کند، و از پیشرفت علم و فناوری پشتیبانی می‌کند.

ابزار بازیابی پایگاه داده در NCBI

ابزار بازیابی پایگاه داده در NCBI، که اغلب به عنوان Entrez شناخته می‌شود، یک سیستم جستجو و بازیابی قدرتمند برای دسترسی و بازیابی اطلاعات از پایگاه‌های داده مختلف NCBI است. Entrez یک رابط یکپارچه برای جستجوی چندین پایگاه داده، از جمله PubMed، GenBank و سایر موارد را فراهم می‌کند.

ویژگی‌های کلیدی Entrez:

  • رابط جستجوی یکپارچه: به کاربران امکان می‌دهد تا همزمان در چندین پایگاه داده جستجو کنند یا بر پایگاه‌های داده‌های خاص تمرکز کنند.
  • قابلیت‌های جستجو: ویژگی‌های جستجوی پیشرفته‌ای از جمله عملگرهای بولین (Boolean operators)، فیلترها و جستجوهای خاص فیلد را ارائه می‌دهد.
  • پیوندها بین رکوردها: پیوندهایی بین رکوردهای مرتبط در پایگاه‌های داده مختلف، مانند پیوند دادن یک مقاله PubMed به توالی GenBank مرتبط آن، را فراهم می‌کند.
  • نمایش خلاصه و جزئیات: اطلاعات خلاصه در نتایج جستجو و نمایش‌های جزئی برای رکوردهای فردی را نمایش می‌دهد.
  • جستجوهای قابل تنظیم: کاربران می‌توانند جستجوها را سفارشی کنند و آن‌ها را برای استفاده آینده ذخیره کنند.

پایگاه‌های داده‌های معمولاً دسترسی‌پذیر از طریق Entrez:

  • PubMed: مقالات پزشکی زیستی
  • GenBank: توالی‌های نوکلئوتیدی
  • Protein: توالی‌های پروتئینی.
  • Structure: ساختارهای 3 بعدی پروتئین‌ها، اسیدهای نوکلئیک و مجموعه‌های پیچیده
  • Gene: اطلاعات خاص ژن
  • SNP: چندشکلی‌های تک نوکلئوتیدی
  • Taxonomy: اطلاعات مربوط به طبقه‌بندی بیولوژیکی
  • ClinVar: اهمیت بالینی واریانت‌های ژنتیکی

دسترسی به Entrez:

می‌توانید مستقیماً از طریق وب‌سایت NCBI به Entrez دسترسی داشته باشید. در اینجا نقطه ورودی اصلی قرار دارد:

از آنجا، می‌توانید پایگاه داده مورد نظر خود را انتخاب کرده و پرس‌وجوی خود را وارد کنید. سیستم نتایج مرتبط را همراه با گزینه‌های برای اصلاح و کاوش بیشتر ارائه خواهد کرد.

مراحل ارسال توالی به NCBI

ارسال توالی‌ها به NCBI یک فرآیند کلیدی برای به اشتراک گذاری داده‌های ژنومی، رونویسی و سایر توالی‌ها با جامعه علمی است. در اینجا یک راهنمای گام به گام در مورد نحوه ارسال توالی‌ها به NCBI ارائه شده است:

مراحل ارسال توالی:

  • آماده‌سازی داده‌های خود: اطمینان حاصل کنید که داده‌های توالی شما در قالب صحیح، معمولاً FASTA برای توالی‌ها، هستند. برای انوتیت کردن (annotation)‌های دقیق‌تر، ممکن است به فایل‌های اضافی در GFF یا قالب‌های دیگر نیاز داشته باشید.
  • آماده‌سازی هرگونه متاداده مورد نیاز، مانند اطلاعات ارگانیسم، انوتیت کردن (annotation)‌های ژن و جزئیات آزمایشی.
  • انتخاب پایگاه داده مناسب:
    • GenBank: برای توالی‌های نوکلئوتیدی، از جمله ژنومی، رونویسی و سایر توالی‌های DNA.
    • RefSeq: برای توالی‌های مرجع انتخاب شده.
    • SRA (Sequence Read Archive): برای داده‌های خام توالی‌خوانی از توالی‌خوانی پر بازده.
  • ایجاد یک حساب NCBI: برای ارسال توالی‌ها به یک حساب NCBI نیاز خواهید داشت. می‌توانید یکی را در اینجا ایجاد کنید: ساخت اکانت NCBI
  • استفاده از ابزارهای ارسال:
    • BankIt: یک ابزار مبتنی بر وب برای ارسال توالی‌های نوکلئوتیدی به GenBank. برای ارسال‌های مقیاس کوچکتر ایده‌آل است.
    • Sequin: یک برنامه دسکتاپ برای ارسال دقیق توالی‌های نوکلئوتیدی به GenBank.
    • پورتال ارسال SRA: برای ارسال داده‌های خام توالی‌خوانی.
  • ارسال توالی خود: دستورالعمل‌های ابزار انتخابی خود را دنبال کنید. معمولاً باید فایل‌های توالی خود را آپلود کنید، متاداده را ارائه دهید و ارسال خود را بررسی کنید.
    • برای BankIt، داده‌های توالی و متاداده خود را مستقیماً در یک فرم وب وارد خواهید کرد.
    • برای Sequin، فایل‌های خود را در برنامه بارگذاری خواهید کرد، داده‌ها را بررسی خواهید کرد و آن را ارسال خواهید کرد.
  • بررسی و تأیید: پس از ارسال، یک ایمیل تأییدیه با یک شناسه ارسال دریافت خواهید کرد. ارسال خود را از نظر دقت بررسی کنید و وضعیت آن را از طریق پورتال ارسال NCBI پیگیری کنید.
  • انتشار: پس از پردازش و بررسی، داده‌های توالی شما از طریق پایگاه‌های داده NCBI مانند GenBank یا SRA در دسترس عموم قرار خواهند گرفت.

ابزار BLAST

ابزار BLAST یک الگوریتم پرکاربرد برای مقایسه یک توالی بیولوژیکی فردی (مانند DNA، RNA یا پروتئین) با پایگاه داده‌ای از توالی‌ها برای یافتن نواحی شباهت محلی است. این ابزار به شناسایی توالی‌های همولوگ کمک می‌کند، که می‌تواند بینش‌هایی در مورد عملکرد ژن، روابط تکاملی و موارد دیگر را ارائه دهد.

ویژگی‌های کلیدی BLAST:

  1. هم‌ترازسازی توالی‌ها:
    • BLAST  نواحی مشابه لوکال بین توالی‌ها را پیدا می‌کند. این کار می‌تواند به شناسایی روابط عملکردی و تکاملی بین ژن‌ها کمک کند.
  2. برنامه‌های مختلف BLAST:
    • BLASTN: مقایسه توالی‌های نوکلئوتیدی با پایگاه داده‌های نوکلئوتیدی.
    • BLASTP: مقایسه توالی‌های پروتئینی با پایگاه داده‌های پروتئینی.
    • BLASTX: مقایسه توالی نوکلئوتیدی ترجمه‌شده به پروتئین با یک پایگاه داده پروتئینی.
    • TBLASTN: مقایسه یک توالی پروتئینی با پایگاه داده نوکلئوتیدی ترجمه‌شده به پروتئین.
    • TBLASTX: مقایسه توالی نوکلئوتیدی ترجمه‌شده با پایگاه داده نوکلئوتیدی ترجمه‌شده.
  3. پارامترها و تنظیمات:
    • کاربران می‌توانند پارامترهایی مانند ماتریس امتیازدهی، جریمه‌های شکاف و فضای جستجو را برای تنظیم دقیق جستجوی خود تنظیم کنند.
  4. خروجی:
    • نتایج هم‌ترازسازی را ارائه می‌دهد که شامل تطابق‌ها بین توالی پرس‌وجو و پایگاه داده است، از جمله امتیازات، مقادیر E (که نشان‌دهنده معنی‌داری آماری است) و نمایش‌های گرافیکی از هم‌ترازسازی‌ها.
  5. بصری‌سازی:
    • ابزارهای تصویری ارائه می‌دهد که به تفسیر نتایج کمک می‌کنند، مانند نماهای گرافیکی از هم‌ترازسازی‌ها و انوتیت کردن (annotation)‌های تطابق‌های مهم.

نحوه استفاده از BLAST:

  1. دسترسی به BLAST:
  2. انتخاب یک برنامه BLAST:
    • ابزار BLAST مناسب را بر اساس نوع توالی پرس‌وجو (نوکلئوتید یا پروتئین) و اهداف جستجوی خود انتخاب کنید.
  3. وارد کردن توالی خود:
    • توالی پرس‌وجوی خود را در کادر متنی وارد کنید یا یک فایل حاوی توالی خود را آپلود کنید.
  4. انتخاب یک پایگاه داده:
    • پایگاه داده‌ای را که می‌خواهید توالی خود را با آن مقایسه کنید، انتخاب کنید. NCBI پایگاه‌های داده مختلفی برای انواع مختلف توالی‌ها ارائه می‌دهد (مانند RefSeq، GenBank، nr)
  5. تنظیم پارامترها:
    • در صورت نیاز پارامترهای جستجو را تنظیم کنید. برای بیشتر جستجوهای باز، تنظیمات پیش‌فرض کافی هستند.
  6. اجرای جستجو:
    • پرس‌وجوی خود را ارسال کنید و منتظر بمانید تا جستجو کامل شود. زمان مورد نیاز بسته به اندازه پایگاه داده و پیچیدگی جستجو متفاوت است.
  7. بررسی نتایج:
    • نتایج را بررسی کنید، از جمله جزئیات هم‌ترازسازی، امتیازات، مقادیر E و نمایش‌های گرافیکی.

پایگاه داده نوکلئوتیدی

 پایگاه داده نوکلئوتیدی NCBI، به ویژه GenBank، یک مخزن جامع و به ‌روز از توالی‌های نوکلئوتیدی است که به طور گسترده برای تحقیقات در زمینه ژنومیک، ژنتیک و زیست‌شناسی مولکولی استفاده می‌شود. این پایگاه داده شامل انواع مختلفی از داده‌ها مانند DNA ژنومی، mRNA، EST (تگ‌های توالی بیان‌شده)، توالی‌های کوتاه خوانده شده از روش‌های نسل جدید توالی‌یابی (NGS) و غیره می‌باشد.  

GenBank به طور گسترده برای کشف ژن‌های جدید، مطالعه تنوع ژنتیکی، طراحی پرایمر برای PCR، و ساخت فیلوژنی استفاده می‌شود. این پایگاه داده با پایگاه داده‌های دیگر NCBI مانند RefSeq (توالی‌های مرجع) و PubMed (مقالات علمی) مرتبط است و امکان انجام جستجوهای یکپارچه را فراهم می‌کند.  مهم‌تر از همه، GenBank به صورت آزاد و رایگان در دسترس عموم قرار دارد و محققان می‌توانند به راحتی به داده‌های آن دسترسی پیدا کنند

ویژگی‌های کلیدی پایگاه داده نوکلئوتیدی:

  1. داده‌های توالی:
    • شامل توالی‌های خام نوکلئوتیدی از موجودات مختلف از جمله باکتری‌ها، آرکی‌ها، یوکاریوت‌ها و ویروس‌ها است.
  2. انوتیت کردن (annotation):
    • اطلاعات انوتیت کردن (annotation) مرتبط مانند ویژگی‌های ژنی، اطلاعات عملکردی و زمینه زیستی را برای بسیاری از توالی‌ها فراهم می‌کند.
  3. ارتباط متقابل:
    • لینک‌هایی به داده‌های مرتبط در دیگر پایگاه‌های داده NCBI مانند توالی‌های پروتئینی در پایگاه داده پروتئین یا انوتییشن‌های(annotation) عملکردی در پایگاه داده ژن ارائه می‌دهد.
  4. قابلیت‌های جستجو:
    • به کاربران اجازه می‌دهد تا بر اساس توالی‌های خاص، کلمات کلیدی یا سایر معیارها جستجو کنند. شما می‌توانید جستجوهای ساده و پیشرفته را انجام دهید.
  5. گزینه‌های دانلود:
    • کاربران می‌توانند توالی‌ها را در فرمت‌های مختلفی مانند FASTA یا فرمت GenBank برای تحلیل بیشتر دانلود کنند.
  6. ادغام با  BLAST:
    • توالی‌های پایگاه داده نوکلئوتیدی می‌توانند به عنوان مرجع در جستجوهای BLAST استفاده شوند تا توالی‌های مشابه را پیدا کنند.

دسترسی به پایگاه داده نوکلئوتیدی:

  1. بازدید از پایگاه داده:
    • شما می‌توانید به طور مستقیم از طریق وب‌سایت NCBI به پایگاه داده نوکلئوتیدی دسترسی پیدا کنید.
  2. جستجو و بازیابی توالی‌ها:
    • جستجوی باز: کلمات کلیدی، شماره‌های دسترسی یا توالی‌های خاص را در جعبه جستجو وارد کنید.
    • جستجوی پیشرفته: از گزینه‌های جستجوی پیشرفته برای تنظیم دقیق پرس‌وجوی خود بر اساس معیارهای خاصی مانند موجود زنده، طول توالی و غیره استفاده کنید.
  3. مشاهده رکوردها:
    • نتایج جستجو لینک‌هایی به رکوردهای دقیق ارائه می‌دهند که شامل داده‌های توالی، انوتیت کردن (annotation)‌ و لینک‌هایی به اطلاعات مرتبط هستند.
  4. دانلود توالی‌ها:
    • از رکوردهای توالی منفرد یا دانلود گروهی، می‌توانید توالی‌ها را در فرمت‌های مختلف برای تحلیل بیشتر صادر کنید.

موارد استفاده مثال:

  • کشف ژن: شناسایی و تحلیل ژن‌ها در یک ژنوم.
  • مقایسه توالی: مقایسه توالی‌های جدید با یک پایگاه داده جامع برای شناسایی توالی‌های همولوگ یا پیش‌بینی عملکرد.
  • انوتیت کردن (annotation) عملکردی: ارتباط دادن توالی‌های تازه کشف‌شده با عملکردهای شناخته‌شده بر اساس شباهت به توالی‌های انوتیت کردن (annotation)‌شده.

پایگاه داده پروتئین

پایگاه داده پروتئین NCBI یک مخزن جامع از توالی‌های پروتئینی از طیف گسترده‌ای از موجودات است. این پایگاه به توالی‌های پروتئینی و انوتیت کردن (annotation)‌ عملکردی آن‌ها دسترسی می‌دهد و از تحقیقات در زیست‌شناسی مولکولی، بیوشیمی و زمینه‌های مرتبط پشتیبانی می‌کند.

ویژگی‌های کلیدی پایگاه داده پروتئین:

  1. توالی‌های پروتئینی:
    • شامل مجموعه‌ای گسترده از توالی‌های پروتئینی از موجودات متنوعی از جمله باکتری‌ها، آرکی‌ها، یوکاریوت‌ها و ویروس‌ها است.
  2. انوتیت کردن (annotation)‌ها:
    • برای هر توالی پروتئینی، انوتیت کردن (annotation)‌های دقیقی ارائه می‌دهد که شامل اطلاعاتی درباره عملکرد پروتئین، ساختار، دومین‌ها و موارد دیگر است.
  3. ارتباط متقابل:
    • لینک‌هایی به داده‌های مرتبط در سایر پایگاه‌های داده NCBI مانند توالی‌های نوکلئوتیدی در پایگاه داده نوکلئوتیدی و اطلاعات ژنی در پایگاه داده ژن دارد.
  4. قابلیت‌های جستجو:
    • به کاربران امکان می‌دهد تا بر اساس کلمات کلیدی، شماره‌های دسترسی، یا داده‌های توالی به دنبال پروتئین‌های خاص بگردند. گزینه‌های جستجوی پیشرفته برای پرس‌وجوهای دقیق‌تر نیز در دسترس هستند.
  5. ادغام با BLAST:
    • توالی‌های پروتئینی از پایگاه داده پروتئین را می‌توان در جستجوهای BLAST استفاده کرد تا توالی‌های مشابه پیدا شده و روابط عملکردی استنباط شوند.
  6. گزینه‌های دانلود:
    • کاربران می‌توانند توالی‌های پروتئینی را در فرمت‌های مختلف مانند FASTA برای تحلیل بیشتر دانلود کنند.

دسترسی به پایگاه داده پروتئین:

  1. بازدید از پایگاه داده:
    • از طریق وب‌سایت NCBI به پایگاه داده پروتئین دسترسی پیدا کنید.
  2. جستجو و بازیابی توالی‌ها:
    • جستجوی باز: کلمات کلیدی، شماره‌های دسترسی یا توالی‌های پروتئینی را در کادر جستجو وارد کنید.
    • جستجوی پیشرفته: از گزینه‌های جستجوی پیشرفته برای تنظیم دقیق پرس‌وجوی خود بر اساس معیارهایی مانند موجود زنده، خانواده پروتئین و غیره استفاده کنید.
  3. مشاهده رکوردها:
    • نتایج جستجو لینک‌هایی به رکوردهای دقیق ارائه می‌دهند که شامل داده‌های توالی پروتئینی، انوتیت کردن (annotation)‌ها و لینک‌های مرتبط هستند.
  4. دانلود توالی‌ها:
    • شما می‌توانید توالی‌ها را از رکوردهای منفرد یا با استفاده از دانلود گروهی برای تحلیل بیشتر صادر کنید.

موارد استفاده مثال:

  • پیش‌بینی عملکرد پروتئین: استنباط عملکرد پروتئین‌های ناشناخته با مقایسه آن‌ها با پروتئین‌های شناخته‌شده.
  • تحلیل ساختاری: بررسی ساختار و دومین‌های پروتئین‌ها برای درک نقش آن‌ها در فرآیندهای زیستی.
  • مطالعات همولوژی: شناسایی پروتئین‌های همولوگ در گونه‌های مختلف برای مطالعه روابط تکاملی.

پایگاه داده بیان ژن

پایگاه داده بیان ژن NCBI که به عنوان Gene Expression Omnibus (GEO) شناخته می‌شود، منبعی جامع برای ذخیره و به اشتراک‌گذاری داده‌های بیان ژن و سایر مجموعه داده‌های ژنومیکس عملکردی با توان بالا است.

ویژگی‌های کلیدی GEO:

  1. داده‌های بیان ژن:
    • شامل داده‌هایی از آزمایش‌های میکروآرایه، RNA-Seq  و سایر فناوری‌های با توان بالا که سطوح بیان ژن را اندازه‌گیری می‌کنند.
  2. فرا‌داده‌ها و انوتیت کردن (annotation)
    • فرا‌داده‌های دقیقی درباره آزمایش‌ها، از جمله طراحی آزمایش، شرایط نمونه و جزئیات فنی ارائه می‌دهد.
  3. ارسال داده:
    • به پژوهشگران امکان می‌دهد تا داده‌های بیان ژن خود را برای دسترسی عمومی ارسال کنند.
  4. جستجو و بازیابی:
    • کاربران می‌توانند به دنبال مجموعه داده‌ها، آزمایش‌ها یا ژن‌های خاص بگردند. گزینه‌های جستجوی پیشرفته به تنظیم دقیق پرس‌وجوها بر اساس معیارهایی مانند موجود زنده، شرایط آزمایش یا نوع مجموعه داده کمک می‌کنند.
  5. ابزارهای تحلیل:
    • ابزارهایی برای تحلیل و بصری‌سازی داده‌های بیان ژن ارائه می‌دهد، از جمله ویژگی‌های تعاملی برای کاوش روندها و الگوهای داده.
  6. ادغام با سایر پایگاه‌های داده:
    • لینک‌هایی به داده‌های مرتبط در سایر پایگاه‌های داده NCBI مانند توالی‌های نوکلئوتیدی در GenBank یا توالی‌های پروتئینی در پایگاه داده پروتئین دارد.

دسترسی به GEO:

  1. بازدید از GEO:
    • از طریق وب‌سایت NCBI به Gene Expression Omnibus دسترسی پیدا کنید.
  2. جستجو و کاوش داده‌ها:
    • مجموعه داده‌های GEO: به دنبال مجموعه داده‌های خاص با استفاده از کلمات کلیدی یا شناسه آزمایش‌ها بگردید.
    • سری‌های GEO: مجموعه‌ای از داده‌های مرتبط از جمله فرا‌داده‌ها و جزئیات آزمایش‌ها را کاوش کنید.
    • پروفایل‌های GEO: به دنبال پروفایل‌های خاص بیان ژن در آزمایش‌های مختلف بگردید.
  3. مشاهده و دانلود داده‌ها:
    • رکوردهای دقیق شامل دسترسی به فایل‌های داده خام، داده‌های پردازش‌شده و انوتیت کردن (annotation)‌ آزمایش را فراهم می‌کنند.
    • کاربران می‌توانند مجموعه داده‌ها را در فرمت‌های مختلف مانند فایل‌های متنی یا صفحه‌گسترده‌ها برای تحلیل بیشتر دانلود کنند.
  4. ارسال داده:
    • پژوهشگران می‌توانند داده‌های بیان ژن خود را از طریق پرتال ارسال GEO به این پایگاه ارسال کنند.

موارد استفاده مثال:

  • تحلیل بیان ژن: مقایسه سطوح بیان ژن در شرایط مختلف، درمان‌ها یا بافت‌ها.
  • ژنومیکس عملکردی: بررسی تأثیر عملکردی تغییرات ژنتیکی یا جهش‌ها بر بیان ژن.
  • تحلیل مسیر: شناسایی مسیرها و شبکه‌هایی که در شرایط بیماری یا آزمایش‌های مختلف به‌صورت متفاوتی بیان می‌شوند.

چگونه از NCBI به توالی ژن دسترسی پیدا کنیم؟ – راهنمای گام به گام

چه دانشجو، پژوهشگر یا فقط علاقه مند به ژنتیک باشید، NCBI یک منبع فوق العاده برای همه چیزهای ژنتیکی است. در ابتدا ممکن است کمی گیج کننده باشد، اما نگران نباشید – ما اینجا هستیم تا شما را در کل فرآیند راهنمایی کنیم. در این راهنمای گام به گام و آسان برای دنبال کردن، نحوه یافتن و دانلود توالی ژن از NCBI را به شما آموزش می دهیم. در پایان، شما با اطمینان در این سایت پیمایش خواهید کرد و داده های مورد نیاز خود را دریافت خواهید کرد.

فرآیند گام به گام برای بازیابی توالی ژن از NCBI

مرحله 1 – با استفاده از لینک زیر به صفحه اصلی NCBI دسترسی پیدا کنید: https://www.ncbi.nlm.nih.gov/

سایت ncbi

مرحله 2 – روی دکمه اسکرول (منوی کشویی) کلیک کنید و “ژن” را انتخاب کنید.

سایت NCBI 2

مرحله 3 – متن مرتبط را در کادر جستجو تایپ کنید یا کلمه کلیدی (مثال: نام ژن، نام گونه و غیره) را وارد کنید.

سایت NCBI 3

مرحله 4 – با فشار دادن دکمه جستجو، صفحه نتایج (صفحه خلاصه) نمایش داده می شود.

سایت NCBI 4

مرحله 5 – توالی ژن مورد نظر را با دوبار کلیک بر روی نام یا شناسه انتخاب کنید یا برای علامت گذاری توالی مناسب، روی دکمه نمایش کلیک کنید، GenBank یا قالب Fasta را برای بازیابی توالی انتخاب کنید.

سایت NCBI 5

مرحله 6 – به پایین اسکرول کنید و روی فرمت فایل مورد نیاز (قالب FASTA یا GenBank) کلیک کنید.

سایت NCBI 6

مرحله 7 – توالی ژن مورد نیاز را برای تجزیه و تحلیل بیشتر کپی و ذخیره کنید.

سایت NCBI 7

همچنین بخوانید:

مترجم: محمد صادق محمودی لرد

از این مطلب چقدر راضی بودید؟

روی ستاره کلیک کنید تا نظرتون ثبت بشه

4.5 / 5. تعداد رای دهندگان: 12

تا حالا امتیازی برای این مطلب ثبت نشده؛ با ثبت نظرتون مارو خوشحال می‌کنید

1 دیدگاه در “آشنایی با NCBI: ابزارها، کاربردها و یافتن توالی های ژن

  1. کاربر ژنیران میگوید:

    سلام
    من می‌توانم فایل آموزش ddbj را در کوتاه‌ترین زمان داشته باشم

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *