مرکز ملی اطلاعات زیستفناوری (NCBI)
مرکز ملی اطلاعات زیستفناوری (NCBI) بخشی از کتابخانه ملی پزشکی ایالات متحده است که خود یک شاخه از مؤسسات ملی بهداشت (NIH) است. این مرکز دسترسی به منابع گستردهای در زمینههای زیستفناوری و پزشکی زیستی را فراهم میکند. برخی از منابع کلیدی ارائه شده توسط NCBI عبارتند از:
- PubMed: پایگاهی از مقالات پزشکی زیستی، عمدتاً مقالات مجلات.
- GenBank: پایگاهی از توالیهای DNA.
- BLAST: ابزاری برای مقایسه توالی بیولوژیکی یک فرد با پایگاه دادهای از توالیها.
- Bookshelf: مجموعهای از کتابها و اسناد رایگان آنلاین در علوم زندگی و مراقبتهای بهداشتی.
- ClinVar: منبعی برای واریانتهای بالینی و ارتباط آنها با شرایط بهداشتی.
منابع NCBI به طور گسترده توسط پژوهشگران، پزشکان و دانشجویان در زمینههای زیستشناسی و پزشکی مورد استفاده قرار میگیرد.
تاریخچه و تأسیس NCBI
مرکز ملی اطلاعات زیستفناوری (NCBI) در سال 1988 به عنوان بخشی از مؤسسات ملی بهداشت (NIH) در ایالات متحده تأسیس شد. ایجاد آن به دلیل نیاز به پیشتیبانی از تحقیقات در زیستشناسی مولکولی و ژنتیک صورت گرفت.
نکات کلیدی در تاریخچه آن:
- تأسیس (1988): NCBI تحت قانون مصالحه بودجه جامع تأسیس شد، با هدف ایجاد یک مخزن مرکزی برای اطلاعات بیولوژیکی.
- توسعههای اولیه (دهه 1990): NCBI چندین پایگاه داده و ابزار مهم را توسعه داد، از جمله GenBank، یک پایگاه داده عمومی قابل دسترسی برای توالیهای DNA. همچنین در توسعه BLAST (ابزار جستجوی همترازی محلی باز) مشارکت کرد، یک ابزار پرکاربرد برای مقایسه توالیهای بیولوژیکی.
- گسترش و نوآوری (دهه 2000): NCBI به گسترش منابع خود ادامه داد، با ادغام طیف گستردهای از دادهها و ابزارهای بیولوژیکی. این مرکز نقش مهمی در پروژه ژنوم انسانی ایفا کرد که کل ژنوم انسان را ترسیم کرد.
- پیشرفتهای اخیر (دهه 2010-2020): NCBI همچنان به تکامل خود ادامه داده است، با ادغام فناوریهای جدید و گسترش پایگاه دادهها و ابزارهای خود برای پیشتیبانی از طیف گستردهای از تحقیقات پزشکی زیستی.
امروزه NCBI یک منبع حیاتی برای پژوهشگران در سراسر جهان است و دسترسی به طیف وسیعی از پایگاه دادهها، ابزارها و نرمافزارهایی را ارائه میدهد که از تحقیقات ژنومی، توسعه دارو و بسیاری از زمینههای دیگر علوم پزشکی زیستی پیشتیبانی میکنند.
مأموریت و اهداف NCBI
مأموریت مرکز ملی اطلاعات زیستفناوری (NCBI) پیشبرد علم و سلامت با ارائه دسترسی به اطلاعات پزشکی زیستی و ژنومی است. اهداف آن حول محور پیشتیبانی از جامعه تحقیقاتی و تسهیل کشف علمی متمرکز شده است. اهداف کلیدی عبارتند از:
دادهها:
- مخزن و دسترسی: جمعآوری، نگهداری و ارائه دسترسی به طیف گستردهای از دادههای بیولوژیکی و پزشکی زیستی، از جمله اطلاعات ژنومی، رونویسی و پروتئومی.
تحقیق:
- پشتیبانی: توسعه و ارائه ابزارها و منابعی که محققان را در تجزیه و تحلیل و تفسیر دادههای بیولوژیکی، مانند ابزارهای همترازی توالی (مثلاً BLAST)، ابزارهای تجزیه و تحلیل بیان ژن و موارد دیگر، یاری میکنند.
تسهیل کشف:
- حمایت از کشف علمی با در دسترس قرار دادن دادهها و ابزارها برای محققان در سطح جهانی، و در نتیجه تقویت نوآوری و یافتههای جدید در زمینههای ژنومیکس، زیستشناسی مولکولی و حوزههای مرتبط.
همکاری و ادغام:
- همکاری با سازمانها و مؤسسات تحقیقاتی دیگر برای ادغام و هماهنگسازی دادههای بیولوژیکی از منابع مختلف، بهبود کارایی و دسترسی به دادهها.
منابع آموزشی:
- ارائه مواد و منابع آموزشی برای کمک به محققان، مربیان و دانشجویان در درک و استفاده مؤثر از ابزارها و پایگاههای داده NCBI.
تأثیر بر سلامت عمومی:
- پیشتیبانی از سلامت عمومی با امکانپذیر کردن تحقیقاتی که میتواند منجر به درک، تشخیص و درمان بهتر بیماریها شود و در نهایت سلامت انسان را بهبود بخشد.
منابع و پایگاههای داده کلیدی NCBI
NCBI طیف گستردهای از منابع و پایگاههای داده را ارائه میدهد که برای جنبههای مختلف تحقیقات پزشکی زیستی و ژنومی ضروری هستند. در اینجا برخی از منابع کلیدی آورده شده است: این منابع به محققان اجازه میدهند تا به سرعت اطلاعات مورد نیاز خود را بیابند و به تجزیه و تحلیل دادههای پیچیده بپردازند و در نتیجه سرعت پیشرفت تحقیقات در حوزه زیستشناسی را افزایش دهند. با استفاده از این پایگاهها، دانشمندان میتوانند به کشف روابط بین ژنها، بیماریها و داروها پرداخته و در نهایت به توسعه درمانهای جدید کمک کنند.
GenBank:
- یک پایگاه داده عمومی جامع از توالیهای نوکلئوتیدی از انواع مختلف ارگانیسمها. شامل توالیهایی از مطالعات آزمایشی و مقالات است.
PubMed:
- پایگاهی از مقالات پزشکی زیستی، از جمله مقالات مجلات در زمینههای پزشکی، علوم زندگی و رشتههای مرتبط. PubMed یک منبع کلیدی برای یافتن مقالات تحقیقاتی و بررسیها است.
BLAST (Basic Local Alignment Search Tool):
- ابزاری پرکاربرد برای مقایسه یک توالی ورودی با یک پایگاه داده برای یافتن نواحی شباهت محلی. برای همترازی و انوتیت کردن (annotation) توالی ضروری است.
Entrez:
- یک سیستم جستجو و بازیابی که دسترسی به انواع مختلف پایگاه دادهها، از جمله توالیهای نوکلئوتیدی و پروتئینی، طبقهبندی، مقالات و موارد دیگر را فراهم میکند.
dbSNP:
- پایگاهی از چندشکلیهای تک نوکلئوتیدی (SNP) و سایر تغییرات ژنتیکی. برای مطالعه تغییرات ژنتیکی و تأثیر آن بر سلامت و بیماری مفید است.
RefSeq:
- مجموعهای انتخاب شده از توالیهای مرجع برای ژنومها، رونوشتها و پروتئینها. RefSeq یک نمایش جامع و دقیق از توالیهای ژنها و محصولات آنها را ارائه میدهد.
Gene:
- پایگاهی که اطلاعات مفصلی درباره ژنها، از جمله عملکرد، ساختار و بیماریهای مرتبط با آنها ارائه میدهد.
GEO (Gene Expression Omnibus):
- پایگاهی از دادههای بیان ژن پر بازده و سایر مجموعه دادههای ژنومیکس عملکردی. دسترسی به دادههای بیان ژن از آزمایشهای مختلف را فراهم میکند.
OMIM (Online Mendelian Inheritance in Man):
- پایگاه داده جامعی از ژنهای انسانی و اختلالات ژنتیکی. اطلاعاتی در مورد مبانی ژنتیکی بیماریها و ویژگیها ارائه میدهد.
BLAST:
- یک ابزار همترازی توالی برای شناسایی نواحی شباهت بین توالیهای بیولوژیکی استفاده میشود. اغلب برای مقایسه توالیهای ژن یا پروتئین استفاده میشود.
PubChem:
- پایگاهی از مولکولهای شیمیایی و فعالیتهای آنها. شامل اطلاعات در مورد مواد شیمیایی، ترکیبات و فعالیتهای بیولوژیکی آنها است.
ابزارها و خدمات NCBI
NCBI طیف وسیعی از ابزارها و خدمات را ارائه میدهد که برای پشتیبانی از جنبههای مختلف تحقیقات پزشکی زیستی و ژنومی طراحی شدهاند. NCBI با ارائه طیف گستردهای از ابزارها و خدمات، نیازهای متنوع محققان در حوزههای مختلف زیستشناسی را برآورده میکند و یک پلتفرم جامع برای انجام تحقیقات ژنومی فراهم میآورد. در اینجا برخی از ابزارها و خدمات کلیدی آورده شده است.
BLAST (Basic Local Alignment Search Tool):
- ابزاری برای مقایسه یک توالی ورودی (نوکلئوتیدی یا پروتئینی) با یک پایگاه داده برای یافتن نواحی شباهت محلی. در همترازی توالی و انوتیت کردن (annotation) عملکردی کمک میکند.
Entrez:
- یک سیستم جستجو و بازیابی که به کاربران امکان دسترسی و جستجوی چندین پایگاه داده NCBI، از جمله PubMed، GenBank و موارد دیگر، از یک رابط واحد را میدهد.
Genome Data Viewer (GDV):
- ابزاری برای تجسم و کاوش دادههای ژنومی. دیدگاههای تعاملی از ژنومها، انوتیت کردن (annotation) و ویژگیهای دیگر ژنومی را ارائه میدهد.
Gene Expression Omnibus (GEO):
- مخزنی برای دادههای بیان ژن پر بازده و سایر مجموعه دادههای ژنومیکس عملکردی. GEO ابزارهایی برای تجزیه و تحلیل و تجسم دادههای بیان ژن ارائه میدهد.
dbSNP:
- پایگاهی که اطلاعاتی درباره چندشکلیهای تک نوکلئوتیدی (SNP) و سایر تغییرات ژنتیکی را ارائه میدهد. شامل ابزارهایی برای پرسوجو و تجزیه و تحلیل دادههای تغییرات ژنتیکی است.
RefSeq:
- مجموعهای انتخاب شده از توالیهای مرجع برای ژنومها، رونوشتها و پروتئینها را ارائه میدهد. RefSeq ابزارهایی برای مشاهده و تجزیه و تحلیل این توالیها را ارائه میدهد.
PubChem:
- پایگاهی از مولکولهای شیمیایی و فعالیتهای بیولوژیکی آنها. شامل ابزارهایی برای جستجو و تجزیه و تحلیل دادههای شیمیایی است.
NCBI Variation Viewer:
- ابزاری برای تجسم و کاوش واریانتهای ژنتیکی در زمینه ژنوم. به محققان کمک میکند تا تأثیر واریانتها بر عملکرد ژن و فنوتیپ را درک کنند.
Protein Data Bank (PDB) Tools:
- ابزارهایی برای مشاهده و تجزیه و تحلیل ساختارهای 3 بعدی پروتئینها و سایر ماکرومولکولها. PDB دسترسی به دادههای ساختاری و ابزارهای تجسم را فراهم میکند.
BLAST+ Command Line Tools:
- مجموعهای از ابزارهای خط فرمان برای انجام جستجوهای BLAST. این ابزارها برای کاربرانی که ترجیح میدهند از اسکریپتنویسی و پردازش دستهای استفاده کنند، مفید هستند.
Taxonomy Browser:
- ابزاری برای کاوش طبقهبندی ارگانیسمها. دسترسی به طبقهبندیهای سلسلهمراتبی و اطلاعات مربوط به گونههای مختلف را فراهم میکند.
Sequence Read Archive (SRA):
- پایگاهی از دادههای خام توالیخوانی از فناوریهای مختلف توالیخوانی پر بازده. SRA ابزارهایی برای دسترسی و تجزیه و تحلیل این دادهها را ارائه میدهد.
کاربردها و تأثیر NCBI
مرکز ملی اطلاعات زیستفناوری (NCBI) طیف گستردهای از کاربردها و تأثیر قابل توجهی بر زمینههای مختلف علم و پزشکی دارد. در اینجا برخی از حوزههای کلیدی که منابع و ابزارهای NCBI در آنها تأثیرگذار هستند، آورده شده است:
کاربردها:
- تحقیقات ژنومی:
- تجزیه و تحلیل توالی: ابزارهایی مانند BLAST و پایگاههای داده مانند GenBank و RefSeq به محققان امکان میدهند تا توالیهای DNA، RNA و پروتئین را تجزیه و تحلیل و مقایسه کنند، که تسهیلکننده شناسایی ژنها، تغییرات ژنتیکی و عناصر عملکردی است.
- نقشهبرداری ژنتیکی: منابع NCBI در نقشهبرداری ژنها به مکانهای خاص روی کروموزومها کمک میکنند، که در درک عملکرد ژن و مبانی ژنتیکی بیماریها کمک میکند.
- کشف و توسعه دارو:
- اطلاعات شیمیایی: PubChem اطلاعات مفصلی درباره ترکیبات شیمیایی و فعالیتهای بیولوژیکی آنها ارائه میدهد، که از کشف و توسعه دارو پشتیبانی میکند.
- تجزیه و تحلیل تغییرات ژنتیکی: پایگاههای داده مانند dbSNP در شناسایی تغییرات ژنتیکی که ممکن است بر پاسخ و اثربخشی دارو تأثیر بگذارند، کمک میکنند.
- تحقیقات بیماری:
- اختلالات ژنتیکی: OMIM اطلاعات جامعی درباره اختلالات ژنتیکی و مکانیسمهای مولکولی آنها ارائه میدهد، که به محققان در درک مبانی ژنتیکی بیماریها و شناسایی اهداف درمانی بالقوه کمک میکند.
- مطالعات بیان ژن: GEO دسترسی به دادههای بیان ژن پر بازده را فراهم میکند، که به محققان اجازه میدهد تا تغییرات بیان ژن را در شرایط یا بیماریهای مختلف مطالعه کنند.
- پزشکی شخصی:
- تفسیر واریانت: ابزارها و پایگاههای داده در تفسیر واریانتهای ژنتیکی در زمینه سلامت و بیماری کمک میکنند، که برای توسعه رویکردهای پزشکی شخصی بسیار مهم است.
- بیوانفورماتیک و زیستشناسی محاسباتی:
- ادغام دادهها: ابزارها و پایگاههای داده NCBI ادغام و تجزیه و تحلیل دادههای بیولوژیکی مقیاس بزرگ را تسهیل میکنند، که از تحقیقات زیستشناسی محاسباتی و توسعه الگوریتمها و روشهای جدید پشتیبانی میکنند.
- منابع آموزشی:
- آموزش و آموزشها: NCBI مواد آموزشی و منابع آموزشی را برای کمک به محققان، مربیان و دانشجویان در استفاده مؤثر از ابزارها و پایگاههای داده خود ارائه میدهد.
تأثیر NCBI
پیشبرد کشف علمی:
منابع NCBI در پیشرفتهای علمی متعددی، از جمله شناسایی ژنهای مرتبط با بیماری، توسعه درمانهای جدید و پیشرفتهای در ژنومیکس و بیوانفورماتیک، نقش اساسی داشتهاند.
تسهیل همکاری:
با ارائه دسترسی آزاد به منابع گستردهای از دادههای بیولوژیکی، NCBI همکاری بین محققان در سراسر جهان را تقویت میکند، و به آنها امکان میدهد دادهها را به اشتراک بگذارند، یافتهها را تأیید کنند و بر کار یکدیگر بسازند.
پیشتیبانی از سلامت عمومی:
منابع NCBI به درک مبانی ژنتیکی بیماریها کمک میکنند، که میتواند منجر به ابزارهای تشخیصی، درمانها و استراتژیهای سلامت عمومی بهتر شود.
تقویت دسترسی به دادهها:
تعهد NCBI به دسترسی آزاد تضمین میکند که محققان، پزشکان و عموم مردم میتوانند بدون هیچ مانعی به اطلاعات ارزشمند بیولوژیکی دسترسی داشته باشند، که ترویج شفافیت و انتشار دانش را تقویت میکند.
رانندگی نوآوری:
توسعه ابزارها و پایگاههای داده جدید توسط NCBI، نوآوری در بیوانفورماتیک، ژنومیکس و زمینههای مرتبط را تقویت میکند، و از پیشرفت علم و فناوری پشتیبانی میکند.
ابزار بازیابی پایگاه داده در NCBI
ابزار بازیابی پایگاه داده در NCBI، که اغلب به عنوان Entrez شناخته میشود، یک سیستم جستجو و بازیابی قدرتمند برای دسترسی و بازیابی اطلاعات از پایگاههای داده مختلف NCBI است. Entrez یک رابط یکپارچه برای جستجوی چندین پایگاه داده، از جمله PubMed، GenBank و سایر موارد را فراهم میکند.
ویژگیهای کلیدی Entrez:
- رابط جستجوی یکپارچه: به کاربران امکان میدهد تا همزمان در چندین پایگاه داده جستجو کنند یا بر پایگاههای دادههای خاص تمرکز کنند.
- قابلیتهای جستجو: ویژگیهای جستجوی پیشرفتهای از جمله عملگرهای بولین (Boolean operators)، فیلترها و جستجوهای خاص فیلد را ارائه میدهد.
- پیوندها بین رکوردها: پیوندهایی بین رکوردهای مرتبط در پایگاههای داده مختلف، مانند پیوند دادن یک مقاله PubMed به توالی GenBank مرتبط آن، را فراهم میکند.
- نمایش خلاصه و جزئیات: اطلاعات خلاصه در نتایج جستجو و نمایشهای جزئی برای رکوردهای فردی را نمایش میدهد.
- جستجوهای قابل تنظیم: کاربران میتوانند جستجوها را سفارشی کنند و آنها را برای استفاده آینده ذخیره کنند.
پایگاههای دادههای معمولاً دسترسیپذیر از طریق Entrez:
- PubMed: مقالات پزشکی زیستی
- GenBank: توالیهای نوکلئوتیدی
- Protein: توالیهای پروتئینی.
- Structure: ساختارهای 3 بعدی پروتئینها، اسیدهای نوکلئیک و مجموعههای پیچیده
- Gene: اطلاعات خاص ژن
- SNP: چندشکلیهای تک نوکلئوتیدی
- Taxonomy: اطلاعات مربوط به طبقهبندی بیولوژیکی
- ClinVar: اهمیت بالینی واریانتهای ژنتیکی
دسترسی به Entrez:
میتوانید مستقیماً از طریق وبسایت NCBI به Entrez دسترسی داشته باشید. در اینجا نقطه ورودی اصلی قرار دارد:
از آنجا، میتوانید پایگاه داده مورد نظر خود را انتخاب کرده و پرسوجوی خود را وارد کنید. سیستم نتایج مرتبط را همراه با گزینههای برای اصلاح و کاوش بیشتر ارائه خواهد کرد.
مراحل ارسال توالی به NCBI
ارسال توالیها به NCBI یک فرآیند کلیدی برای به اشتراک گذاری دادههای ژنومی، رونویسی و سایر توالیها با جامعه علمی است. در اینجا یک راهنمای گام به گام در مورد نحوه ارسال توالیها به NCBI ارائه شده است:
مراحل ارسال توالی:
- آمادهسازی دادههای خود: اطمینان حاصل کنید که دادههای توالی شما در قالب صحیح، معمولاً FASTA برای توالیها، هستند. برای انوتیت کردن (annotation)های دقیقتر، ممکن است به فایلهای اضافی در GFF یا قالبهای دیگر نیاز داشته باشید.
- آمادهسازی هرگونه متاداده مورد نیاز، مانند اطلاعات ارگانیسم، انوتیت کردن (annotation)های ژن و جزئیات آزمایشی.
- انتخاب پایگاه داده مناسب:
- GenBank: برای توالیهای نوکلئوتیدی، از جمله ژنومی، رونویسی و سایر توالیهای DNA.
- RefSeq: برای توالیهای مرجع انتخاب شده.
- SRA (Sequence Read Archive): برای دادههای خام توالیخوانی از توالیخوانی پر بازده.
- ایجاد یک حساب NCBI: برای ارسال توالیها به یک حساب NCBI نیاز خواهید داشت. میتوانید یکی را در اینجا ایجاد کنید: ساخت اکانت NCBI
- استفاده از ابزارهای ارسال:
- ارسال توالی خود: دستورالعملهای ابزار انتخابی خود را دنبال کنید. معمولاً باید فایلهای توالی خود را آپلود کنید، متاداده را ارائه دهید و ارسال خود را بررسی کنید.
- برای BankIt، دادههای توالی و متاداده خود را مستقیماً در یک فرم وب وارد خواهید کرد.
- برای Sequin، فایلهای خود را در برنامه بارگذاری خواهید کرد، دادهها را بررسی خواهید کرد و آن را ارسال خواهید کرد.
- بررسی و تأیید: پس از ارسال، یک ایمیل تأییدیه با یک شناسه ارسال دریافت خواهید کرد. ارسال خود را از نظر دقت بررسی کنید و وضعیت آن را از طریق پورتال ارسال NCBI پیگیری کنید.
- انتشار: پس از پردازش و بررسی، دادههای توالی شما از طریق پایگاههای داده NCBI مانند GenBank یا SRA در دسترس عموم قرار خواهند گرفت.
ابزار BLAST
ابزار BLAST یک الگوریتم پرکاربرد برای مقایسه یک توالی بیولوژیکی فردی (مانند DNA، RNA یا پروتئین) با پایگاه دادهای از توالیها برای یافتن نواحی شباهت محلی است. این ابزار به شناسایی توالیهای همولوگ کمک میکند، که میتواند بینشهایی در مورد عملکرد ژن، روابط تکاملی و موارد دیگر را ارائه دهد.
ویژگیهای کلیدی BLAST:
- همترازسازی توالیها:
- BLAST نواحی مشابه لوکال بین توالیها را پیدا میکند. این کار میتواند به شناسایی روابط عملکردی و تکاملی بین ژنها کمک کند.
- برنامههای مختلف BLAST:
- BLASTN: مقایسه توالیهای نوکلئوتیدی با پایگاه دادههای نوکلئوتیدی.
- BLASTP: مقایسه توالیهای پروتئینی با پایگاه دادههای پروتئینی.
- BLASTX: مقایسه توالی نوکلئوتیدی ترجمهشده به پروتئین با یک پایگاه داده پروتئینی.
- TBLASTN: مقایسه یک توالی پروتئینی با پایگاه داده نوکلئوتیدی ترجمهشده به پروتئین.
- TBLASTX: مقایسه توالی نوکلئوتیدی ترجمهشده با پایگاه داده نوکلئوتیدی ترجمهشده.
- پارامترها و تنظیمات:
- کاربران میتوانند پارامترهایی مانند ماتریس امتیازدهی، جریمههای شکاف و فضای جستجو را برای تنظیم دقیق جستجوی خود تنظیم کنند.
- خروجی:
- نتایج همترازسازی را ارائه میدهد که شامل تطابقها بین توالی پرسوجو و پایگاه داده است، از جمله امتیازات، مقادیر E (که نشاندهنده معنیداری آماری است) و نمایشهای گرافیکی از همترازسازیها.
- بصریسازی:
- ابزارهای تصویری ارائه میدهد که به تفسیر نتایج کمک میکنند، مانند نماهای گرافیکی از همترازسازیها و انوتیت کردن (annotation)های تطابقهای مهم.
نحوه استفاده از BLAST:
- دسترسی به BLAST:
- به وبسایت NCBI BLAST بروید.
- انتخاب یک برنامه BLAST:
- ابزار BLAST مناسب را بر اساس نوع توالی پرسوجو (نوکلئوتید یا پروتئین) و اهداف جستجوی خود انتخاب کنید.
- وارد کردن توالی خود:
- توالی پرسوجوی خود را در کادر متنی وارد کنید یا یک فایل حاوی توالی خود را آپلود کنید.
- انتخاب یک پایگاه داده:
- پایگاه دادهای را که میخواهید توالی خود را با آن مقایسه کنید، انتخاب کنید. NCBI پایگاههای داده مختلفی برای انواع مختلف توالیها ارائه میدهد (مانند RefSeq، GenBank، nr)
- تنظیم پارامترها:
- در صورت نیاز پارامترهای جستجو را تنظیم کنید. برای بیشتر جستجوهای باز، تنظیمات پیشفرض کافی هستند.
- اجرای جستجو:
- پرسوجوی خود را ارسال کنید و منتظر بمانید تا جستجو کامل شود. زمان مورد نیاز بسته به اندازه پایگاه داده و پیچیدگی جستجو متفاوت است.
- بررسی نتایج:
- نتایج را بررسی کنید، از جمله جزئیات همترازسازی، امتیازات، مقادیر E و نمایشهای گرافیکی.
پایگاه داده نوکلئوتیدی
پایگاه داده نوکلئوتیدی NCBI، به ویژه GenBank، یک مخزن جامع و به روز از توالیهای نوکلئوتیدی است که به طور گسترده برای تحقیقات در زمینه ژنومیک، ژنتیک و زیستشناسی مولکولی استفاده میشود. این پایگاه داده شامل انواع مختلفی از دادهها مانند DNA ژنومی، mRNA، EST (تگهای توالی بیانشده)، توالیهای کوتاه خوانده شده از روشهای نسل جدید توالییابی (NGS) و غیره میباشد.
GenBank به طور گسترده برای کشف ژنهای جدید، مطالعه تنوع ژنتیکی، طراحی پرایمر برای PCR، و ساخت فیلوژنی استفاده میشود. این پایگاه داده با پایگاه دادههای دیگر NCBI مانند RefSeq (توالیهای مرجع) و PubMed (مقالات علمی) مرتبط است و امکان انجام جستجوهای یکپارچه را فراهم میکند. مهمتر از همه، GenBank به صورت آزاد و رایگان در دسترس عموم قرار دارد و محققان میتوانند به راحتی به دادههای آن دسترسی پیدا کنند
ویژگیهای کلیدی پایگاه داده نوکلئوتیدی:
- دادههای توالی:
- شامل توالیهای خام نوکلئوتیدی از موجودات مختلف از جمله باکتریها، آرکیها، یوکاریوتها و ویروسها است.
- انوتیت کردن (annotation):
- اطلاعات انوتیت کردن (annotation) مرتبط مانند ویژگیهای ژنی، اطلاعات عملکردی و زمینه زیستی را برای بسیاری از توالیها فراهم میکند.
- ارتباط متقابل:
- لینکهایی به دادههای مرتبط در دیگر پایگاههای داده NCBI مانند توالیهای پروتئینی در پایگاه داده پروتئین یا انوتییشنهای(annotation) عملکردی در پایگاه داده ژن ارائه میدهد.
- قابلیتهای جستجو:
- به کاربران اجازه میدهد تا بر اساس توالیهای خاص، کلمات کلیدی یا سایر معیارها جستجو کنند. شما میتوانید جستجوهای ساده و پیشرفته را انجام دهید.
- گزینههای دانلود:
- کاربران میتوانند توالیها را در فرمتهای مختلفی مانند FASTA یا فرمت GenBank برای تحلیل بیشتر دانلود کنند.
- ادغام با BLAST:
- توالیهای پایگاه داده نوکلئوتیدی میتوانند به عنوان مرجع در جستجوهای BLAST استفاده شوند تا توالیهای مشابه را پیدا کنند.
دسترسی به پایگاه داده نوکلئوتیدی:
- بازدید از پایگاه داده:
- شما میتوانید به طور مستقیم از طریق وبسایت NCBI به پایگاه داده نوکلئوتیدی دسترسی پیدا کنید.
- جستجو و بازیابی توالیها:
- جستجوی باز: کلمات کلیدی، شمارههای دسترسی یا توالیهای خاص را در جعبه جستجو وارد کنید.
- جستجوی پیشرفته: از گزینههای جستجوی پیشرفته برای تنظیم دقیق پرسوجوی خود بر اساس معیارهای خاصی مانند موجود زنده، طول توالی و غیره استفاده کنید.
- مشاهده رکوردها:
- نتایج جستجو لینکهایی به رکوردهای دقیق ارائه میدهند که شامل دادههای توالی، انوتیت کردن (annotation) و لینکهایی به اطلاعات مرتبط هستند.
- دانلود توالیها:
- از رکوردهای توالی منفرد یا دانلود گروهی، میتوانید توالیها را در فرمتهای مختلف برای تحلیل بیشتر صادر کنید.
موارد استفاده مثال:
- کشف ژن: شناسایی و تحلیل ژنها در یک ژنوم.
- مقایسه توالی: مقایسه توالیهای جدید با یک پایگاه داده جامع برای شناسایی توالیهای همولوگ یا پیشبینی عملکرد.
- انوتیت کردن (annotation) عملکردی: ارتباط دادن توالیهای تازه کشفشده با عملکردهای شناختهشده بر اساس شباهت به توالیهای انوتیت کردن (annotation)شده.
پایگاه داده پروتئین
پایگاه داده پروتئین NCBI یک مخزن جامع از توالیهای پروتئینی از طیف گستردهای از موجودات است. این پایگاه به توالیهای پروتئینی و انوتیت کردن (annotation) عملکردی آنها دسترسی میدهد و از تحقیقات در زیستشناسی مولکولی، بیوشیمی و زمینههای مرتبط پشتیبانی میکند.
ویژگیهای کلیدی پایگاه داده پروتئین:
- توالیهای پروتئینی:
- شامل مجموعهای گسترده از توالیهای پروتئینی از موجودات متنوعی از جمله باکتریها، آرکیها، یوکاریوتها و ویروسها است.
- انوتیت کردن (annotation)ها:
- برای هر توالی پروتئینی، انوتیت کردن (annotation)های دقیقی ارائه میدهد که شامل اطلاعاتی درباره عملکرد پروتئین، ساختار، دومینها و موارد دیگر است.
- ارتباط متقابل:
- لینکهایی به دادههای مرتبط در سایر پایگاههای داده NCBI مانند توالیهای نوکلئوتیدی در پایگاه داده نوکلئوتیدی و اطلاعات ژنی در پایگاه داده ژن دارد.
- قابلیتهای جستجو:
- به کاربران امکان میدهد تا بر اساس کلمات کلیدی، شمارههای دسترسی، یا دادههای توالی به دنبال پروتئینهای خاص بگردند. گزینههای جستجوی پیشرفته برای پرسوجوهای دقیقتر نیز در دسترس هستند.
- ادغام با BLAST:
- توالیهای پروتئینی از پایگاه داده پروتئین را میتوان در جستجوهای BLAST استفاده کرد تا توالیهای مشابه پیدا شده و روابط عملکردی استنباط شوند.
- گزینههای دانلود:
- کاربران میتوانند توالیهای پروتئینی را در فرمتهای مختلف مانند FASTA برای تحلیل بیشتر دانلود کنند.
دسترسی به پایگاه داده پروتئین:
- بازدید از پایگاه داده:
- از طریق وبسایت NCBI به پایگاه داده پروتئین دسترسی پیدا کنید.
- جستجو و بازیابی توالیها:
- جستجوی باز: کلمات کلیدی، شمارههای دسترسی یا توالیهای پروتئینی را در کادر جستجو وارد کنید.
- جستجوی پیشرفته: از گزینههای جستجوی پیشرفته برای تنظیم دقیق پرسوجوی خود بر اساس معیارهایی مانند موجود زنده، خانواده پروتئین و غیره استفاده کنید.
- مشاهده رکوردها:
- نتایج جستجو لینکهایی به رکوردهای دقیق ارائه میدهند که شامل دادههای توالی پروتئینی، انوتیت کردن (annotation)ها و لینکهای مرتبط هستند.
- دانلود توالیها:
- شما میتوانید توالیها را از رکوردهای منفرد یا با استفاده از دانلود گروهی برای تحلیل بیشتر صادر کنید.
موارد استفاده مثال:
- پیشبینی عملکرد پروتئین: استنباط عملکرد پروتئینهای ناشناخته با مقایسه آنها با پروتئینهای شناختهشده.
- تحلیل ساختاری: بررسی ساختار و دومینهای پروتئینها برای درک نقش آنها در فرآیندهای زیستی.
- مطالعات همولوژی: شناسایی پروتئینهای همولوگ در گونههای مختلف برای مطالعه روابط تکاملی.
پایگاه داده بیان ژن
پایگاه داده بیان ژن NCBI که به عنوان Gene Expression Omnibus (GEO) شناخته میشود، منبعی جامع برای ذخیره و به اشتراکگذاری دادههای بیان ژن و سایر مجموعه دادههای ژنومیکس عملکردی با توان بالا است.
ویژگیهای کلیدی GEO:
- دادههای بیان ژن:
- شامل دادههایی از آزمایشهای میکروآرایه، RNA-Seq و سایر فناوریهای با توان بالا که سطوح بیان ژن را اندازهگیری میکنند.
- فرادادهها و انوتیت کردن (annotation)
- فرادادههای دقیقی درباره آزمایشها، از جمله طراحی آزمایش، شرایط نمونه و جزئیات فنی ارائه میدهد.
- ارسال داده:
- به پژوهشگران امکان میدهد تا دادههای بیان ژن خود را برای دسترسی عمومی ارسال کنند.
- جستجو و بازیابی:
- کاربران میتوانند به دنبال مجموعه دادهها، آزمایشها یا ژنهای خاص بگردند. گزینههای جستجوی پیشرفته به تنظیم دقیق پرسوجوها بر اساس معیارهایی مانند موجود زنده، شرایط آزمایش یا نوع مجموعه داده کمک میکنند.
- ابزارهای تحلیل:
- ابزارهایی برای تحلیل و بصریسازی دادههای بیان ژن ارائه میدهد، از جمله ویژگیهای تعاملی برای کاوش روندها و الگوهای داده.
- ادغام با سایر پایگاههای داده:
- لینکهایی به دادههای مرتبط در سایر پایگاههای داده NCBI مانند توالیهای نوکلئوتیدی در GenBank یا توالیهای پروتئینی در پایگاه داده پروتئین دارد.
دسترسی به GEO:
- بازدید از GEO:
- از طریق وبسایت NCBI به Gene Expression Omnibus دسترسی پیدا کنید.
- جستجو و کاوش دادهها:
- مجموعه دادههای GEO: به دنبال مجموعه دادههای خاص با استفاده از کلمات کلیدی یا شناسه آزمایشها بگردید.
- سریهای GEO: مجموعهای از دادههای مرتبط از جمله فرادادهها و جزئیات آزمایشها را کاوش کنید.
- پروفایلهای GEO: به دنبال پروفایلهای خاص بیان ژن در آزمایشهای مختلف بگردید.
- مشاهده و دانلود دادهها:
- رکوردهای دقیق شامل دسترسی به فایلهای داده خام، دادههای پردازششده و انوتیت کردن (annotation) آزمایش را فراهم میکنند.
- کاربران میتوانند مجموعه دادهها را در فرمتهای مختلف مانند فایلهای متنی یا صفحهگستردهها برای تحلیل بیشتر دانلود کنند.
- ارسال داده:
- پژوهشگران میتوانند دادههای بیان ژن خود را از طریق پرتال ارسال GEO به این پایگاه ارسال کنند.
موارد استفاده مثال:
- تحلیل بیان ژن: مقایسه سطوح بیان ژن در شرایط مختلف، درمانها یا بافتها.
- ژنومیکس عملکردی: بررسی تأثیر عملکردی تغییرات ژنتیکی یا جهشها بر بیان ژن.
- تحلیل مسیر: شناسایی مسیرها و شبکههایی که در شرایط بیماری یا آزمایشهای مختلف بهصورت متفاوتی بیان میشوند.
چگونه از NCBI به توالی ژن دسترسی پیدا کنیم؟ – راهنمای گام به گام
چه دانشجو، پژوهشگر یا فقط علاقه مند به ژنتیک باشید، NCBI یک منبع فوق العاده برای همه چیزهای ژنتیکی است. در ابتدا ممکن است کمی گیج کننده باشد، اما نگران نباشید – ما اینجا هستیم تا شما را در کل فرآیند راهنمایی کنیم. در این راهنمای گام به گام و آسان برای دنبال کردن، نحوه یافتن و دانلود توالی ژن از NCBI را به شما آموزش می دهیم. در پایان، شما با اطمینان در این سایت پیمایش خواهید کرد و داده های مورد نیاز خود را دریافت خواهید کرد.
فرآیند گام به گام برای بازیابی توالی ژن از NCBI
مرحله 1 – با استفاده از لینک زیر به صفحه اصلی NCBI دسترسی پیدا کنید: https://www.ncbi.nlm.nih.gov/
مرحله 2 – روی دکمه اسکرول (منوی کشویی) کلیک کنید و “ژن” را انتخاب کنید.
مرحله 3 – متن مرتبط را در کادر جستجو تایپ کنید یا کلمه کلیدی (مثال: نام ژن، نام گونه و غیره) را وارد کنید.
مرحله 4 – با فشار دادن دکمه جستجو، صفحه نتایج (صفحه خلاصه) نمایش داده می شود.
مرحله 5 – توالی ژن مورد نظر را با دوبار کلیک بر روی نام یا شناسه انتخاب کنید یا برای علامت گذاری توالی مناسب، روی دکمه نمایش کلیک کنید، GenBank یا قالب Fasta را برای بازیابی توالی انتخاب کنید.
مرحله 6 – به پایین اسکرول کنید و روی فرمت فایل مورد نیاز (قالب FASTA یا GenBank) کلیک کنید.
مرحله 7 – توالی ژن مورد نیاز را برای تجزیه و تحلیل بیشتر کپی و ذخیره کنید.
همچنین بخوانید:
مترجم: محمد صادق محمودی لرد
سلام
من میتوانم فایل آموزش ddbj را در کوتاهترین زمان داشته باشم