مقدمهای بر پایگاه داده TCGA
اطلس ژنوم سرطان (TCGA) یک تلاش جامع و هماهنگ برای تسریع درک ما از اساس مولکولی سرطان از طریق استفاده از فناوری های تجزیه و تحلیل ژنوم، از جمله تعیین توالی ژنوم در مقیاس بزرگ است.
TCGA به عنوان آزمایشی سه ساله در سال 2006 با سرمایه گذاری 50 میلیون دلاری هر یک از مؤسسات ملی سرطان (NCI) و مؤسسه ملی تحقیقات ژنوم انسانی (NHGRI) آغاز شد.
پروژه آزمایشی TCGA تأیید کرد که میتوان اطلسی از تغییرات را برای انواع خاص سرطان ایجاد کرد. همچنین نشان داد که یک شبکه ملی از تیمهای تحقیقاتی و فناوری که روی پروژههای مجزا اما مرتبط کار میکنند، میتوانند نتایج تلاشهای خود را با هم ترکیب کنند و زیرساختی را برای دسترسی عموم به دادهها ایجاد کنند.
مهمتر از همه، ثابت شد که در دسترس قرار دادن آزادانه داده ها، محققان را در هر نقطه از جهان قادر می سازد تا اکتشافات مهمی را انجام دهند و تأیید کنند. موفقیت آزمایشی باعث شد مؤسسه ملی بهداشت منابع عمده ای را به TCGA اختصاص دهد تا بیش از 20 نوع تومور اضافی را جمع آوری و مشخص کند. شرح کامل پروژه و همچنین دسترسی به داده ها را می توان در این آدرس یافت:
سرور Genomics Viewer (IGV) یک نمایش تعاملی از داده های open source پروژه TCGA را بدون نیاز به دانلودهای بیشتر ارائه می دهد. برخی از مجموعههای داده برای دسترسی به تأیید نیاز دارند و نمیتوانند در این انجمن عمومی ارائه شوند. کاربران فردی که اجازه دسترسی به این مجموعه داده ها را دارند می توانند آنها را از وب سایت فوق دانلود کرده و در IGV بارگذاری کنند.
اطلاعات مربوط به مراحل تجزیه و تحلیل داده های مورد استفاده برای ایجاد این مجموعه داده ها را می توانید در اینجا بیابید:
http://tcga-data.nci.nih.gov/tcga/tcgaAbout.jsp
استفاده از داده ها، منابع TCGA
اطلس ژنوم سرطان (TCGA) نمونه های سرطانی از بیش از 11000 بیمار را در یک دوره 12 ساله جمع آوری، مشخص و آنالیز کرد. این فرآیند پیچیده و دائماً در حال تکامل بود تا فناوریهای جدید، تفاوتهای ظریف انواع مختلف سرطان و سایر عوامل در حال تغییر را در خود جای دهد. مراحل اصلی درگیر این پروسه عبارتند از:
- جمع آوری نمونه ها و داده های بالینی
- تولید آنالیت های مولکولی از نمونه ها
- توالی یابی و سایر اشکال خصوصیات مولکولی
- تجزیه و تحلیل داده ها
- در دسترس قرار دادن داده ها در اختیار جامعه پژوهشی
تمام داده های جمع آوری و پردازش شده توسط TCGA در Genomic Data Commons (GDC) موجود است:
TCGA از مجموعه ای از روش های عملیاتی استاندارد برای پردازش بافت ها و سایر نمونه های بیولوژیکی به آنالیت های مولکولی برای تعیین خصوصیات مولکولی استفاده کرد. این پروتکل ها از پایگاه تحقیقاتی نمونه زیستی NCI در دسترس هستند.
دادههای جمعآوریشده برای یک مورد خاص در TCGA ممکن است بر اساس کیفیت و کمیت نمونه، نوع سرطان یا فناوری موجود در زمان تجزیه و تحلیل متفاوت باشد. در زیر خلاصهای کلی از انواع مشخصههای بالینی، مولکولی و انواع دیگر دادههایی که ممکن است برای انواع مختلف سرطان مورد مطالعه ایجاد شده باشند، آورده شده است.
تمام دادههای جمعآوریشده و پردازششده توسط برنامه در Genomic Data Commons (GDC)، از جمله فایلهای داده تکمیلی انتشارات TCGA و فایلهای داده مرتبط در دسترس است. سوالات مربوط به دسترسی به داده ها باید به تیم پشتیبانی GDC ارسال شود. منابع برای کاربران TCGA و سوالات متداول TCGA در دسترس است. پروتکل های آزمایشی برای هر پلتفرم را می توان در نشریات جداگانه یافت.
ابزارهای محاسباتی TCGA
اطلس ژنوم سرطان (TCGA) رشد و پیشرفت قابل توجهی را در زمینه زیست شناسی محاسباتی با حمایت از توسعه فناوری های ژنومی با توان بالا، تولید حجم عظیمی از داده ها و تیم هایی از محققین برای تجزیه و تحلیل داده ها تسریع کرد. در زیر مجموعه ای از برخی از ابزارهای توسعه یافته توسط محققان و همکاران شبکه TCGA که برای تجزیه و تحلیل داده های TCGA استفاده شده است، ارائه شده است.
TCGA یک نشریه تحلیل جهانی را به عنوان اولین مقاله تألیف شده توسط شبکه تحقیقاتی اطلس ژنوم سرطان تعریف می کند که شامل داده های حداقل 100 مورد از یک نوع تومور خاص است و شامل تجزیه و تحلیل بسیاری از داده های TCGA موجود در آن نوع تومور در آن زمان است.
برای پروژه های تومور نادر، یک انتشار تحلیل جهانی شامل داده های اکثر موارد واجد شرایط و بسیاری از داده های موجود در مورد آن نوع تومور است. به طور خاص، این دستنوشتهها در مورد تجزیه و تحلیل جامع و یکپارچه مجموعههای داده TCGA در دسترس هستند که یک نشریه تجزیه و تحلیل جهانی همچنین به عنوان تجزیه و تحلیل داده های یک پلت فرم واحد در بیش از یک نوع تومور تحت تعلیق تعریف می شود.
همچنین از مطالب زیر دیدن فرمایید:
- کارآموزی سیستم بیولوژی: R و آنالیز داده های میکرواری
- دوره مهارت آموزی ژن درمانی
- کارآموزی بیوانفورماتیک
نویسنده: مریم آقازاده