درباره CNV ها
CNV یا Copy number variation ها مجموعه ای از تغییرات ساختاری بزرگ در حد مگاباز می باشند که اخیرا نقش آن ها در بیماری های ذهنی Mental Disorders همچون اسکیزوفرنی، عقب ماندگی ذهنی و پارکینسون دیده شده است. تقریباً دو سوم کل ژنوم انسان ممکن است از تکرارها تشکیل شده باشد و 4.8 تا 9.5 درصد از ژنوم انسان را می توان به عنوان تغییرات تعداد کپی طبقه بندی کرد. تغییرات تعداد کپی (CNVs) تغییرات ژنومی هستند که منجر به تعداد غیرعادی کپی از یک یا چند ژن می شود.
مطالعات قبلی CNV را به عنوان یک قطعه DNA بزرگتر از 1000 جفت باز تعریف می کردند، اما در حال حاضر، اندازه Copy number variation ها از 50 جفت باز تا چندین مگابایت تعریف شده است. بازآرایی های ساختاری ژنومی مانند تکرارها، حذف ها، جابه جایی ها و وارونگی ها می توانند باعث ایجاد CNV شوند. CNV ها، مواد خام را برای گسترش و تنوع خانواده ژن فراهم می کند، که یک نیروی تکاملی مهم است.
علاوه بر این، واریانتهای تعداد کپی (CNVs) میتوانند بر سطوح رونویسی و ترجمه ژن نیز تأثیر بگذارند و با حساسیت به بیماریهای پیچیده مرتبط هستند. تا به امروز، تقریباً 2000 CNV توصیف شده است. ممکن است هزاران CNV دیگر در جمعیت انسانی وجود داشته باشد. جهشهای بالقوه بیماریزای DNA شامل تغییرات تک نوکلئوتیدها تا کروموزومهای کامل است. تغییرات کوچک 1 نوکلئوتیدای (nt) را SNP و تغییرات تا 50 nt در مکان واحد را تغییر کوتاه درج – حذف (indel) می نامند.
در حالی که تغییرات بزرگتر از 50 nt را واریانت های ساختاری (SVs) نامیده شده که قبلاً به عنوان تغییرات بزرگتر از 1000 nt تعریف شده است. چنین SV ها شامل درج، حذف، تکرار، وارونگی و جابجایی است. ترکیب این SVها نیز در یک ژنوم واحد امکان پذیر است. حذفها و تکرارها، که معمولاً تغییرات تعداد کپی (CNV) نامیده میشوند، به بخش بزرگی از تغییرات ژنتیکی کمک میکنند و از اهمیت تشخیصی برخوردار هستند، زیرا میتوانند نقش مهمی در ایجاد بیماریهای ژنتیکی ایفا کنند.
چندین روش مبتنی بر آزمایشگاه از جمله (MLPA) ، هیبریداسیون ژنومی مقایسهای مبتنی بر ریزآرایه (aCGH) و Arrays SNP ، توالییابی RNA هیبریداسیون درجا فلورسانس (FISH) و روش های مبتنی بر PCR برای تشخیص CNV استفاده می شود. همه این روش ها آزمایشگاهی توان عملیاتی پایینی داشته و گران هستند. در این میان، آزمایشگاههای تشخیصی معمولاً از aCGH/SNP Arrays و MLPA استفاده میکنند. روش aCGH حساس است، اما تنها محدود به تشخیص توالی های CNV موجود در ژنوم مرجع که از قبل برای طراحی پروب های آرایه استفاده شده است می باشد.
محدودیت در آزمایش های مبتنی بر MLPA تعداد پروب های موجود در کیت است که برای مالتیپلکس کردن تا حدود 50 پروب طراحی شده است، بنابراین برای یک یا چند ژن کوچکتر مناسب است. با ارائه یک نمای نوکلئوتید به نوکلئوتید از ژنوم، NGS واریانت های کوچک یا جدید CNV را که در مطالعات Array اغلب از دست می رود، تشخیص می دهد. NGS همچنین می تواند مکان دقیق یک CNV را نیز ترسیم کند. وضوح بالای توالی یابی، توان عملیاتی بالای آرایه ها را تکمیل می کند و یک دید جامع از ژنوم را به دست می دهد.
برای تشخیص CNV ها از روش های مختلفی از جمله کاریوتایپ، CGH array،FISH و غیره استفاده می شود که در این میان روش های توالی یابی نسل دوم و سوم امروزه بسیار مورد توجه قرار گرفته اند. با تکامل فناوری های نسل بعدی توالی یابی (NGS)، آزمایشگاه های تشخیص به شدت از داده های NGS در تشخیص SNP ها و ایندل ها استفاده می کنند.
علاوه بر این، NGS مزایای تشخیص دقیق موقعیت های نقطه شکست CNV در ژنوم را فراهم می کند. از این رو استفاده از NGS برای تشخیص CNV به آزمایشگاههای تشخیصی در آزمایش تعداد بیشتری از ژنها برای CNV کمک میکند. در روشهای معمول تشخیصی سنتی، نمونهها با آزمایش MLPA از ژنها بر اساس درخواستها آنالیز میشوند. از آنجایی که CNV اغلب اتفاق نمی افتد، نتایج MLPA اغلب منفی است. نتایج نشان داده شده است که استفاده از NGS در تشخیص، در مقایسه با استفاده از آزمایش مبتنی بر MLPA برای CNV ها، توان عملیاتی بهتری را با هزینه کمتر ارائه می دهد.
بنابراین MLPA عمدتاً برای تأیید نتایج حاصل از دادههای NGS که نشاندهنده CNV است استفاده میشود. استراتژی های مختلفی برای یافتن CNV ها در روش های توالی یابی از جمله WGS، WES و Targeted Sequencing وجود دارد از جمله آنالیز به وسیله روش Read pair ، آنالیز به وسیله روش Split Read آنالیز به وسیله روش Read depth و در نهایت آنالیز به وسیله روش Assembly می باشد.
در حال حاضراز چهار رویکرد مختلف نام برده برای تشخیص CNV ها در داده های NGS استفاده می شود یا به بیان دیگر تشخیص مبتنی بر نقشه برداری جفتی (PE)، تشخیص مبتنی بر خواندن تقسیم (SR)، تشخیص مبتنی بر مونتاژ جدید (DA) و تشخیص مبتنی بر عمق خواندن (RD). علاوه بر این، از رویکردهای ترکیبی نیز می توان استفاده کرد.
در میان این رویکردها، PE، SR و DA را می توان برای تشخیص انواع SV ها استفاده کرد، اما استفاده از این رویکردها نیازمند کیفیت داده بالا و سازگاری داده ها در مناطق است که اغلب کاربرد آنها را برای داده های توالی یابی کل ژنوم محدود می کند. از سوی دیگر، رویکرد RD فقط میتواند CNV ها (حذفها و تکراریها) های کوچک یا بسیار بزرگ را در همه انواع مناطق در ژنوم تشخیص دهد.
بسته به کیفیت داده، عمق پوشش، طول خواندن و مناطق ثبت شده، RD همچنین می تواند نقاط شکست دقیق را با دقت بالا تشخیص دهد. بهترین روش برای تشخیص CNV به داده های توالی یابی شده بستگی دارد. دادههای حاصل از پنل های ژنی (در این روش تنها ژن های هدف مانند اگزونهای خاص توالی یابی می شوند)، بنابراین مناطق ژنوم پیوسته نیستند.
از آنجایی که رویکرد RD از عمق خوانشی بالایی برای شناسایی CNV ها استفاده می کند، این رویکرد برای پانل های ژنی مناسب است. به دلیل deep-sequenced، دادههای پانل اغلب دارای عمق پوشش بالایی هستند، که دقت تشخیص CNV را از طریق رویکرد RD افزایش میدهد، اگرچه این واقعیت که مناطق اینترونیک در آنالیز گنجانده نشدهاند ممکن است حساسیت کمی نسبت به CNVهای خاص داده های کل ژنوم داشته باشد.