پایگاه داده TCGA چیست؟ مجموعه داده اطلس ژنوم سرطان

پایگاه داده TCGA چیست؟

مقدمه‌ای بر پایگاه داده TCGA

اطلس ژنوم سرطان (TCGA) یک تلاش جامع و هماهنگ برای تسریع درک ما از اساس مولکولی سرطان از طریق استفاده از فناوری های تجزیه و تحلیل ژنوم، از جمله تعیین توالی ژنوم در مقیاس بزرگ است.

TCGA به عنوان آزمایشی سه ساله در سال 2006 با سرمایه گذاری 50 میلیون دلاری هر یک از مؤسسات ملی سرطان (NCI) و مؤسسه ملی تحقیقات ژنوم انسانی (NHGRI) آغاز شد.

پروژه آزمایشی TCGA تأیید کرد که می‌توان اطلسی از تغییرات را برای انواع خاص سرطان ایجاد کرد. همچنین نشان داد که یک شبکه ملی از تیم‌های تحقیقاتی و فناوری که روی پروژه‌های مجزا اما مرتبط کار می‌کنند، می‌توانند نتایج تلاش‌های خود را با هم ترکیب کنند و زیرساختی را برای دسترسی عموم به داده‌ها ایجاد کنند.

مهمتر از همه، ثابت شد که در دسترس قرار دادن آزادانه داده ها، محققان را در هر نقطه از جهان قادر می سازد تا اکتشافات مهمی را انجام دهند و تأیید کنند. موفقیت آزمایشی باعث شد مؤسسه ملی بهداشت منابع عمده ای را به TCGA اختصاص دهد تا بیش از 20 نوع تومور اضافی را جمع آوری و مشخص کند. شرح کامل پروژه و همچنین دسترسی به داده ها را می توان در این آدرس یافت:

http://cancergenome.nih.gov/

سرور Genomics Viewer (IGV) یک نمایش تعاملی از داده های open source پروژه TCGA را بدون نیاز به دانلودهای بیشتر ارائه می دهد. برخی از مجموعه‌های داده برای دسترسی به تأیید نیاز دارند و نمی‌توانند در این انجمن عمومی ارائه شوند. کاربران فردی که اجازه دسترسی به این مجموعه داده ها را دارند می توانند آنها را از وب سایت فوق دانلود کرده و در IGV بارگذاری کنند.

اطلاعات مربوط به مراحل تجزیه و تحلیل داده های مورد استفاده برای ایجاد این مجموعه داده ها را می توانید در اینجا بیابید:

http://tcga-data.nci.nih.gov/tcga/tcgaAbout.jsp

استفاده از داده ها، منابع TCGA

اطلس ژنوم سرطان (TCGA) نمونه های سرطانی از بیش از 11000 بیمار را در یک دوره 12 ساله جمع آوری، مشخص و آنالیز کرد. این فرآیند پیچیده و دائماً در حال تکامل بود تا فناوری‌های جدید، تفاوت‌های ظریف انواع مختلف سرطان و سایر عوامل در حال تغییر را در خود جای دهد. مراحل اصلی درگیر این پروسه عبارتند از:

  • جمع آوری نمونه ها و داده های بالینی
  • تولید آنالیت های مولکولی از نمونه ها
  • توالی یابی و سایر اشکال خصوصیات مولکولی
  • تجزیه و تحلیل داده ها
  • در دسترس قرار دادن داده ها در اختیار جامعه پژوهشی

داده های tcga

تمام داده های جمع آوری و پردازش شده توسط TCGA در Genomic Data Commons (GDC) موجود است:

TCGA از مجموعه ای از روش های عملیاتی استاندارد برای پردازش بافت ها و سایر نمونه های بیولوژیکی به آنالیت های مولکولی برای تعیین خصوصیات مولکولی استفاده کرد. این پروتکل ها از پایگاه تحقیقاتی نمونه زیستی NCI در دسترس هستند.

داده‌های جمع‌آوری‌شده برای یک مورد خاص در TCGA ممکن است بر اساس کیفیت و کمیت نمونه، نوع سرطان یا فناوری موجود در زمان تجزیه و تحلیل متفاوت باشد. در زیر خلاصه‌ای کلی از انواع مشخصه‌های بالینی، مولکولی و انواع دیگر داده‌هایی که ممکن است برای انواع مختلف سرطان مورد مطالعه ایجاد شده باشند، آورده شده است.

تمام داده‌های جمع‌آوری‌شده و پردازش‌شده توسط برنامه در Genomic Data Commons (GDC)، از جمله فایل‌های داده تکمیلی انتشارات TCGA و فایل‌های داده مرتبط در دسترس است. سوالات مربوط به دسترسی به داده ها باید به تیم پشتیبانی GDC ارسال شود. منابع برای کاربران TCGA و سوالات متداول TCGA در دسترس است. پروتکل های آزمایشی برای هر پلتفرم را می توان در نشریات جداگانه یافت.

داده های gdc

ابزارهای محاسباتی TCGA

اطلس ژنوم سرطان (TCGA) رشد و پیشرفت قابل توجهی را در زمینه زیست شناسی محاسباتی با حمایت از توسعه فناوری های ژنومی با توان بالا، تولید حجم عظیمی از داده ها و تیم هایی از محققین برای تجزیه و تحلیل داده ها تسریع کرد. در زیر مجموعه ای از برخی از ابزارهای توسعه یافته توسط محققان و همکاران شبکه TCGA که برای تجزیه و تحلیل داده های TCGA استفاده شده است، ارائه شده است.

TCGA یک نشریه تحلیل جهانی را به عنوان اولین مقاله تألیف شده توسط شبکه تحقیقاتی اطلس ژنوم سرطان تعریف می کند که شامل داده های حداقل 100 مورد از یک نوع تومور خاص است و شامل تجزیه و تحلیل بسیاری از داده های TCGA موجود در آن نوع تومور در آن زمان است.

برای پروژه های تومور نادر، یک انتشار تحلیل جهانی شامل داده های اکثر موارد واجد شرایط و بسیاری از داده های موجود در مورد آن نوع تومور است. به طور خاص، این دست‌نوشته‌ها در مورد تجزیه و تحلیل جامع و یکپارچه مجموعه‌های داده TCGA در دسترس هستند که یک نشریه تجزیه و تحلیل جهانی همچنین به عنوان تجزیه و تحلیل داده های یک پلت فرم واحد در بیش از یک نوع تومور تحت تعلیق تعریف می شود.

همچنین از مطالب زیر دیدن فرمایید:

نویسنده: مریم آقازاده

منبع

از این مطلب چقدر راضی بودید؟

روی ستاره کلیک کنید تا نظرتون ثبت بشه

4.6 / 5. تعداد رای دهندگان: 12

تا حالا امتیازی برای این مطلب ثبت نشده؛ با ثبت نظرتون مارو خوشحال می‌کنید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *