فراز: محققان دادههای ژنتیکی ۱۰۲۱ (در جایی دیگر ۱۰۶۹. مترجم.) داوطلب را تحلیل کردند، که در آنها والدین و همینطور پدربزرگها و مادربزرگها خود را متعلق به یکی از ۱۱ قومیت منتخب ایرانی معرفی نمودند؛ از اقوام بزرگتری چون پارس و آذری گرفته تا گروههای کوچکتری مثل عرب و بلوچ و گیلکی و کرد. این داوطلبان از سراسر ایران نمونهگیری شدند. نتایج نشان داد که به عنوان مثال ایرانیانِ پارسی و کردها، تنوع ژنتیکیِ درونگروهیِ بیشتری نسبت به مثلاً آلمانیها داشتهاند. با این حال احتمال میرود که کل این استخر ژنی، در طول لااقل ۵ هزار سال پیش، و به احتمال بیشتری لااقل از ۱۰ هزار سال پیش به این سو بدون تغییر باقی مانده باشد.
به علاوه نویسندگان، دادههای ژنومی جمعآوری شده را در رابطه با دادههای منتشره از سایر جوامع انسانهای زنده و تقریباً ۸۰۰ نمونه حفاریشده افرادی که هزاران سال پیش در این منطقه و حوالی آن میزیستند، در کنار هم قرار دادند. مایکل نوتنگل خاطرنشان کرد: «دلیل ارزشمند بودن اطلاعات ژنتیکی ایران به ویژه آن است که خلاء دادههای معرف جمعیت و ژنومی جمعیتی بزرگ را در منطقهای مهم از جهان پر میکند.» مجموعه دادههای تولیدشده و الگوهای آشکارکننده آنها، برای تحقیقات بعدی در مورد بیماریهای نادر ژنتیکی و نیز در جهت روشنساختن جنبشهای مهاجرتی گذشته بسیار حائز اهمیت است.
در هزاره گذشته، ایران بارها و بارها با هجوم مهاجرتی مواجه شده است: هند و اروپاییزبانها در آن سکنی گرفتهاند و اعراب نیز از قرن هفتم میلادی به این سرزمین ورود کردند و بعدها هم که ترکزبانان آسیای مرکزی به جمعیت پیوستند. در نتیجه جمعیت امروز ایران متشکل است از گروههای متعدد قومی، مذهبی و زبانی که با درجاتی مختلف با هم ترکیب شدهاند.
به عنوان مثال، با توجه به همپوشانی ژنتیکی قدرتمند کردهای ایرانی با لرها و فارسیزبانان و سایر گروههای جمعیتی، که نشان پیشینه مشترک و تا حدودی هم ترکیب کمّی است، به نظر میرسد جزیرهنشینان خلیجفارس بارها مورد هجوم (در معنای ریزش جمعیتی) گروههایی از خارج ایران قرار گرفتهاند. نوتنگل گفت: «اینها با گزارشها تاریخی از تجارت جاری دریایی در هزارههای پیشین مطابقت دارد.» همچنین برخی گروهها، زبان گروههای تازهوارد را پذیرفتند. این مطالعه با ترکیب یافتههای باستانشناسی همراه با آخرین فناوریها در توصیف ژنوم، شواهدی سیستماتیک از این الگوهای مهاجرتی و سکونت ارائه کرد.
تنوع ژنتیکی متمایز و ناهمگنی جمعیت ایران
کشور ایران علیرغم وسعت، موقعیت جغرافیایی و نفوذ فرهنگی دیرینهاش، تا حد زیادی نقطه کوری برای مطالعات ژنتیکی جمعیت انسانی بوده است. مطالعهای که پیش روتان قرار گرفته و سعی شده است بینقص خدمت شما انتقال یابد، مستخرج از مشخصات ژنومی و جغرافیایی کشور ایران بوده، و یافتههای آن براساس ۱۲۰۱ نمونه موردی از یازده گروه قومی به دست آمده است. در این مطالعه نشان داده شده است که ایرانیها، در عین نزدیک بودن به جماعت کشورهای همسایه، تنوع ژنتیکی متمایز و سازگاری تؤام با تداوم ژنتیکی طولانیمدت عرضه میکنند… ناهمگونیشان بالاست و سطوح خویشاوندیشان به همین میزان متفرق و گونهگون. جماعت ایرانی، مجموعهای است از گروههایی مشابه و چندین گروه مختلط… جمعیتی که زبانهای گوناگونی را در دل خود پذیرفته و گذشتهشان نیز آبستن پذیرش زبانهای متعددی در درون خود بوده است.
این یافتهها ایران را به منبع مهمی از تنوع ژنتیکی انسانی در آسیای غربی و مرکزی تبدیل میکند. همانطور که به تفسیر تنوع ژنتیکی احتمالی مرتبط با بیماری نیز میپردازد. با توجه به ناهمگونی ژنتیکی داخلی ایران، مطالعات آینده باید وابستگیهای قومیتی و ترکیبات احتمالی را در نظر داشته باشند.
مقدمه
«ارتفاعات ایران» از زمان پراکنده شدن انسانهای امروزی به خارج از افریقا، به سبب موقعیت ژئواستراتژیکیشان در چهارراه مهاجرتهای انسانی قرار داشتهاند. ایران ضمن اعمال نفوذ فرهنگی گستردهای که به مناطق همسایه داشته است، در هزارههای پیشین بارها مورد هجوم مهاجران نیز قرار گرفته است. از جمله مهاجرت متوالی گروههای از زبانهای هند و اروپایی (IE) به سمت جنوب (مثل سکاها، مادها و پارسها)، ورود اعراب در قرن هفتم پس از میلاد و هجوم متعاقب مردم ترکزبان از آسیای مرکزی.
در نتیجهی مهاجرتها، انشعابات داخلی، اختلاطها و سایر جنبشها، جمعیت امروز ایران شامل گروههای متعدد قومی، مذهبی و زبانی است. به طور عمده فارسیزبانها (حدود ۶۵ درصد جمعیت این کشور)، آذریهای ایرانی (۱۶ درصد)، عربها (۲ درصد)، بلوچهای ایرانی (۲ درصد)، ترکمنهای ایرانی (۱ درصد)، قشقایی و سایر گروههای عشایری ترکزبان (۱ درصد) و همچنین ارامنه، آشوریها، گرجیها، یهودیان، زرتشتیان (روی هم کمتر از ۱ درصد) و جمعی دیگر… البته که نسبتهای گزارششده میان منابع مختلف، متفاوت است. تعداد گویشوران یک زبان ایرانی، یعنی هند و اروپایی، زبان یا لهجه زبانی (مثل فارسی، کردی، لری و بلوچی) بسیار بیشتر از شمار گویشوران یک زبان ترکی یا سامی است.
ایران در کمربند کشورهایی واقع شده است که در آنها به طور گسترده ازدواجهای فامیلی اتفاق میافتند. این نمونههای ازدواج، به طور برجستهای در مطالعات مرتبط با بیماری نیز منعکس شدهاند؛ همینطور که شناسایی ژنهای دخیل در بیماریهای اتوزوم مغلوب با تجزیه و تحلیل پیوند و نقشهبرداری اتوزیگوسیتی و کمک به درک علتشناختی عمیقتر از اختلالات پیچیده را نیز تسهیل میکنند. نمونههایی که ارزش این جمعیتها را برای تحقیقات ژنتیکی انسانی نشان میدهند، فراوان هستند؛ مطالعاتی که احتمالش هست در آینده از مطالعه چند خانوار به مطالعات مبتنی بر جمعیت شیفت پیدا کنند.
با این حال میان ایران، سطح خویشاوندی همگنی وجود ندارد. مطالعات اولیه، که نه براساس دادههای ژنتیکی، بلکه بر پایه ارزیابی روابط خانوادگی انجام شده بود، نشان داد که این سطوح میان مناطق جغرافیایی مختلف و بین گروههای قومی مختلف فرق میکند. مطالعهای که در حوالی سالهای ۲۰۱۸ و ۲۰۱۹ براساس ارزیابی روابط خانوادگی انجام گرفت، این نتایج را اصلاح کرد و تفاوتهای فامیلی را براساس استان، منطقه محل سکونت، گروه تولد، ازدواج و نیز سطح تحصیلات افراد گزارش نمود. الگوهای هوزیگوسیتی (ROHها)، یا به اشتراک گذاری هاپلوتیپ از طریق تبار (HBD) میتواند نشانگر اتوزیگوسیتی (تخمیدگی خودکار-خود تخمیدگی) بوده و میان جمعیتها و در مکانهای ژنومی متفاوت باشد؛ مثل فراوانی همخونی و درجه متوسط همبستگی همخونی ژنومی. به علاوه نگاشت اتوزیگوسیتی عمدتاً قادر به تشخیص جهشهای پایهگذار محلی اخیر است. به علاوه فراوانی ناقل بیماریهای مستعد، در مناطق جغرافیایی مختلف ایران شدتهای متفاوتی دارد.
قدری حیرتآور است که آسیای مرکزی و بخشهایی از آسیای غربی، تا حد زیادی نقطه کور مطالعات ژنتیکی غیرپزشکی در دهههای گذشته بودهاند. تا همین اواخر، پروژههای ژنتیکی اختصاصی در زمینه جمعیتهای موجود انسانی و یا تمرکز جهانی و قارهای (در صورت وجود) تنها به طور پراکنده نمونههایی را در ایران شامل میشد و منطقه را به صورت جامع پوشش نمیداد. شایان ذکر اینکه مطالعاتی که نمونههای ایرانی را شامل میشد، اغلب آنها را به عنوان یک جمعیت همگن منفرد و یا نمایندهای از آن در نظر میگرفت.
مطالعات بر روی نمونههای پراکنده DNA باستانی، از دوران نوسنگی اولیه تا کالکولیتیک در ایران، وجود جمعیتهایی را با تمایز ژنتیکی بالا نشان داد که اجداد اروپاییان نبودند، اما در مورد نمونههایی از کوههای زاگرس، قرابتهایی با زرتشتیان داشتند. مطالعه اولیهای که روی گروههای خونی ABO انجام شد، تفاوتهای شدیدی را میان برخی از ۲۱ گروه قومی در نظر گرفته در ایران نشان داد، در حالی که مطالعه دیگری که یک سال بعد منتشر شد و علاوه بر آن، اساسش بر پروتئینهای سرم و آنزیمهای سلولی بود، شواهدی برای زیرساخت جمعیت میان شش گروه شامل [آذریهای ایرانی، کرد، لر، زابلی، بلوچ و زرتشتی] با میانگین امتیاز ۰.۰۲ برای FST، بر پایه گروههای خونی، پروتئینهای سرم و آنزیمهای سلولی و درجاتی از همخونی ارائه کرد. مطالعات متمرکز منطقهای بیشتر بر روی ایران، براساس نشانگرهای تکوالدینی نظیر هاپلوتیپهای کروموزومی Y و هاپلوتیپهای نشانگر تکرار کوتاه پشتسر هم (STR) و نیز هاپلوگروههای میتوکندری (mtDNA)، درجات بالایی از تنوع ژنتیکی را در جمعیت ایرانی تأیید کردند. این مطالعات، تغییرات مربوطه را عمدتاً دارای منشأ اوراسیای غربی گزارش کردند، و تنها تعداد محدودی را متعلق به اوراسیا شرقی، آسیای جنوبی و افریقا، که بیشتر هم در استانهای جنوبی ایران دیده میشد، دانستند. این مطالعات همچنین جریان ژنی و باستانی اخیر را میان ایران و شبهجزیره عربستان، یک رابطه نزدیک و شگفتانگیز میان ایرانیان و قشقاییهای ترکزبان ایرانی و به طور کلی سطوح بالایی از تنوع قابل مقایسه با تغییرات در قفقاز جنوبی، آناتولی و اروپا گزارش دادند. این مشاهدات همهشان از این تصور که ایران چهارراه مهاجرتهای انسانی را تشکیل میدهد، حمایت میکند. مطالعهای که روی ارامنه واقع در شمال ایران انجام شد، رویدادهای ترکیبی متعدد و نقش کلی را به عنوان پلی میان مناطق مختلف جغرافیایی پیشنهاد داد.
تعدادی از مطالعات، با استفاده از دادههای ژنوتیپ گسترده ژنوم یا اگزوم، تعدادی از مطالعات نمونههای جمعیتی را که میشد به عنوان نماینده گروههای قومی در ایران از کشورهای اطراف در نظر گرفت، مورد تجزیه و تحلیل قرار دادند. در مطالعهای که روی ۱۵۶ نفر انجام شد، جمعیت قطر، سه گروه مجزا را گزارش کرد که یکیشان (Q۲) میل و بستگی زیادی با ایرانیها و الگوهای اختلاط داشت. مطالعهای بر روی ۲۲ کویتیِ دارای اصل و نسب ایرانی، سطوح نسبتاً بالایی از تنوع ژنتیکی را برای یک جمعیت غیرافریقایی نشان داد که با رویدادهای ترکیبی پیش نیز قابل توضیح است. مطالعه بر روی ۴۳ فرد متعلق به پارسیان، که یک جامعه دینی زرتشتی در هند و پاکستان است، میل ژنتیکی نزدیکتری به جمعیتهای امروزی ایران و قفقاز، نسبت به جمعیتهای جنوب آسیا نشان داد. اما شباهتی که به نمونههای DNA دوران نوسنگی ایران، در مقایسه با ایرانیان مدرن داشت، هم با سوابق تاریخی مهاجرت به جنوب ناشی از ورود اعراب به ایران در قرن هفتم و هم با رویدادهای اخیر آمیختگی با جمعیت مدرن ایران مطابقت داشت. تکمیلکنندهی این نتایج، یافتههایی بودند که افزایش همگنی و تاریخگذاری رویدادهای اختلاط پیشین را در نمونههای بیشتر زرتشتیان ایرانی و هندی نشان میدادند. تجزیه و تحلیل ۲۴ نفر از کلاس هند و اروپایی زبان (منظور جمعیت ایزولهشده در هندوکش، افغانستان)، نشاندهنده یک جمعیت باستانی اوراسیای شمالی است که از نظر ژنتیکی دچار تغیر و انحراف شده؛ این جماعت در اوایل دوران نوسنگی تقسیم شده و متعاقباً به سوی جنوب مهاجرت کردهاند. و در نهایت نیز مطالعهای که همان اواخر انجام شد، محدود گردید به دادههای اگزومی که ۸۷ نمونه ایرانی را با ۱۳۶ نمونه پاکستانی ادغام میکرد… نتیجهی به دست آمده، در مقایسه با سایر جمعیتهای مغرب و شبهجزیره عربستان از راه ترکیه، موضعی تا حدی افراطی و شاید منزوی را نشان داد. با این حال هیچیک از این مطالعات تا این لحظه نه به طور مستقیم و نه در حالت مقایسهای، اقوام ایران را مورد بررسی قرار نداده است.
همبستگیای که میان نزدیکی ژنتیکی و زبانی جمعیتها وجود دارد، اغلب به عنوان یک قاعده فرض شده است، در حالی که پذیرش زبان معمولاً به عنوان استثنائی از قاعده تکامل مشترک در نظر گرفته میشود، اگرچه چنین ادعاهایی بارها مورد مناقشه قرار گرفتهاند. شواهد چنین همبستگیهایی در اروپا زیادند، از جمله دادههای اتوزومی و میتوکندری، دادههای کروموزومی، و حتی عطف به گسترشی که در زبانهای هند و اروپایی در اروپا رخ داده است: دادههای DNA باستانی. مطالعات عمیق در سایر نقاط دنیا نشان میدهند که میان پراکندگی زبان با دودمانهای کروموزومی ارتباط وجود دارد. هر چند که این ارتباط در تمام بخشها دیده نمیشود. علاوه بر این برخی موارد ژن با واسطه مرد، از برخی موانع اصلی زبانی نیز عبور کرده است. یکی از مطالعات اولیه، پیشتر ارتباط ژنتیکی نزدیکی را میان گروههای سامیزبان و هندواروپاییزبان در ایران مشاهده کرده بود. مطالعاتی که روی ارمنستانِ همسایه انجام شد، به شواهدی برای رویداد جایگزینی زبان دست پیدا کرد که احتمالاً با اختلاط چندین جمعیت منبع در طول دوران برنز تسهیل شده است. با این حال، رابطه میان نزدیکی ژنتیکی و زبانی برای ایران و کشورهای همسایه، به ندرت موضوعی بوده که مورد بررسی قرار گرفته باشد.
در حالی که به نظر میرسد ایران قرار است سهم مهم دیگری را در تحقیقات ژنتیک انسانی بازی کند، طراحی و تفسیر کافی از مطالعات ژنتیکی پزشکی و جمعیتی آینده، نقشی الزامی جهت دستیابی به یافتههای قابل تفسیر دارد. ما در اینجا به صورت جامع تنوع ژنومی ۱۱ گروه قومی ایران، ارتباطشان با یکدیگر و همچنین با جمعیتهای مرجع جهانی و محلی را مورد تجزیه و تحلیل قرار دادیم. به علاوه، براساس قومیت، سطوح همبستگی، توزیع نواحی هموزیگوت و شماره مناطق و CNVها و همچنین میزان طبقهبندی جمعیتی در ایران و آثار احتمالی در مطالعات ارتباطی و نیز ارتباط میان خانواده زبان گفتاری و نزدیکی ژنتیکی بررسی انجام دادیم.
نتایج
در اینجا مجموعهای از دادههای ژنومی را که شامل ۱۰۲۱ فرد از ۱۱ گروه قومی اصلی و ساکن ایران بود، گرد آوردیم (جدول ۱). این مجموعه دادههای ایرانی، جهت مقایسه یا جمعیتهای موجود، با نمونههایی از پروژه ۱۰۰۰ ژنوم (۱۰۰۰G)، و یا با نمونههای سه مطالعه اخیر با تمرکز منطقهای ادغام شد؛ گروهبندیها اغلب براساس منطقه جغرافیایی بود (جدول S۱) و یا خانواده زبانی (جدول S۲). ما همچنین ۷۹۸ نمونه DNA باستانی انسانی را از ۲۱ نشریه مختلف برای تجزیه و تحلیل مکانی-زمانی گردآوری کردیم (جداول S۳ و S۴).
تنوع متمایز ژنتیکی و ناهمگنی قابل توجه
این ۱۱ گروه قومی، ناهمگونیهای ژنتیکی متمایز و قابل توجهی داشتند (شکل ۱A). هفت گروه (عربهای ایرانی، آذریها، گیلکها، کردها، مازندرانیها، لرها و فارسیزبانان) در یک تحلیل MDS (شکل ۱B) به مقدار زیادی در تنوع کلی اتوزومی همپوشانی داشتند، که خود وجود خوشهای مرکزی (CIC) را در ایران نشان میدهد، که به ویژه شامل اعراب ایرانی و آذریها نیز میشود. چهار گروه دیگر (بلوچهای ایرانی، جزیرهنشینان خلیجفارس، سیستانیها و ترکمنها) به عنوان جوامعی معرفی شدند که شدیداً آمیخته بودند با مشارکت جوامع اجدادی مختلف، اما همسو با جهتگیری CIC و در عین حال دارای تفاوتهایی قابل توجه با CIC و با یکدیگر؛ به جز بلوچها و سیستانیهایی که تا حدی همپوشانی داشتند (شکل ۱A). در مقیاس جهانی (شکل ۲ تنها شامل جوامع «دنیای قدیم» است؛ جهت دیدن تمام جوامع ۱۰۰۰G، شکل S۲ را ببینید.)، ایرانیان CIC نزدیک به اروپاییها بودند؛ در حالی که ترکمنهای ایرانی درجاتی مشابه و در عین حال متمایز از اختلاط را در مقایسه با سایر بخشهای جنوب آسیا نشان دادند. این میزان در بلوچها، و جزیرهنشینان خلیج فارس، میزانش کمتر بود. در حالی که دومی (جزیرهنشینان)، سوگیری معلومی را نسبت به افریقاییهای صحرای جنوب و نیز محلیسازیهای مشترکی با نمونههایی متعدد از امریکای لاتین داشتند. نکته قابل توجه اینکه حالا اعراب ایرانی مقداری از CIC را نسبت به جماعت صحرای جنوب نشان دادند. یک مقایسه محلی، تنوع ژنتیکی متمایز ایرانیان CIC را نسبت به سایر جمعیتهای جغرافیایی تأیید کرد (شکل ۳ و شکل S۳). موقعیت ژنتیکی نسبی اقوام ایرانی، به طور شایان ذکری، انعکاسی است از موقعیت جغرافیایی آنها در پیوند میان آسیای جنوبی و مرکزی و غرب آسیا، شمال افریقا و قفقاز. بلوچها و سیستانیهای ایرانی در نزدیکی پاکستان و دیگر جوامع جنوب آسیا زندگی میکنند، و این در حالی است که ترکمنهای ایرانی به ترتیب در مجاورت یا بالادست جمعیت آسیای مرکزی میزیند. اعراب ایرانی از دیگر جوامع عرب در غرب آسیا و شمال افریقا متمایز بودند. به علاوه نمونههای زرتشتی، به عنوان اعضای اصلی CIC قرار گرفتند. این نتایج کاملاً با مقادیر شاخص تثبیت زوجی (EST) منعکس گردیده است (جدول ۲ و جدول S۵). گروههای CIC تمایز اندکی را نشان دادند (۰.۰۰۰۸–۰.۰۰۳۳)، در حالی که گروههای غیر CIC به طور مداوم مقادیر بزرگتری را ارائه میکردند که شدیدترینشان متعلق بود به جزیرهنشینان PG در مقابل ترکمنهای ایرانی (FST: ۰.۰۱۱۰). با این حال زیرساخت ژنتیکی میان گروههای ایرانی بسیار کمتر از هر یک جوامع ۱۰۰۰G بود و از این دیدگاه حمایت میکرد که گروههای CIC با وجود ناهمگونی درونی، یک موجودیت ژنتیکی مجزا را تشکیل میدهند… اروپاییان (FST حدفاصل مقادیر ۰.۰۱۰۵ تا ۰.۰۲۹۴)، آسیای جنوبی (FST حدفاصل تقریباً ۰.۰۱۴۱ تا ۰.۰۳۳۸)، و برخی جوامع امریکای لاتین (کلمبیاییها: FST حدفاصل مقادیر ۰.۰۱۷۰ تا ۰.۰۲۶۱ و پورتوریکوئیها حدفاصل ۰.۰۱۵۳ تا ۰.۰۲۲۸) نزدیکترین افراد به ایرانیان بودند. و این در حالی است که افریقاییهای صحرای جنوبی و افریقاییامریکاییها (FST حد فاصل ۰.۰۷۶۴ تا ۰.۱۴۲۴) و همچنین ساکنین آسیای شرقی (FST حدفاصل ۰.۰۶۴۵ تا ۰.۱۰۵۵) درجات زیادی از تمایز را با ایرانیان نشان دادند. لازم به ذکر است که در صورت عدم تصحیح، میزان مشاهدهشده از زیرساخت جمعیت میتواند مطالعات انجمن ژنتیکی مبتنی بر جمعیت ایران را به شدت مخدوش کند.
تحلیل نسب اقوام ایرانی
ما بررسی بیشتری روی ترکیبات ژنتیکی و منشأ اقوام ایرانی انجام دادیم. تجزیه و تحلیلهای ADMIXTURE، وجودCIC فرضی را تأیید کرده و وجود جزئی متمایز از اجداد ایرانی را تصدیق نمود. در تحلیل ۱۱ گروه ایرانی، هر هفت گروه CIC دارای اصل و نسبی غالب و نیز نسبتهای نسبتاً متمایزی از سه گروه اجدادی دیگر بودند. در حالی که چهار مورد دیگر از نظر درجه اختلاط با جوامع اجدادی مختلف تفاوتهایی داشتند (شکل ۴A). قابل توجهتر تحلیل مجموعه دادههای جهانی (بهترین تناسب K: ۱۳) بود که سه جمعیت اجدادی را به دست آورد که به طور عمده و تقریباً به ۱۱ گروه ایرانی اشاعه داشتند و اما به ندرت در جمعیت ۱۰۰۰G دیده میشدند… یک جمعیت اجدادی بین ۱۱ گروه مشترک بود (به رنگ آبی در شکل ۴B)، و دیگری نیز در همه گروهها به جز جزیرهنشینان خلیجفارس (که جوامع غالب اجدادی متفاوتی داشتند)، مشترک بود (به ترتیب با رنگهای سبز روشن و آبی روشن در تصویر ۴B). یک استثنای قابل توجه، توسکانیها (TSI) بودند که نسبت قابل توجهی از نسب خود را با ایرانیان، به ویژه آنهایی که از CIC بودند، به اشتراک گذاشتند. مقایسههای منطقهای، ترکیب منحصر به فرد گروههای قومی ایرانی (شکل ۴C) را با نمونههای زرتشتی و سایر ایرانیانی که تصویری همخوان نشان میدهند، تأیید کرد. مدلسازی صریح رویدادهای مهاجرتی ۰-۱۵، با استفاده از TreeMix، استحکام خوشهبندی نزدیک تمام گروههای ایرانی را ثابت کرد… اروپاییان نیز همیشه نزدیکترین افراد به ایرانیها بودند (شکلهای S۵ تا S۱۰). هجوم نیاکان از جوامع آسیایی به ترکمنها و فنلاندیها مداوم از خلال نتایج استنباط میشد، و این در حالی بود که اعراب ایرانی ظاهراً اغلب در معرض هجوم افریقاییان بودند. مدلسازی گروههای غیر CIC منتج از اختلاط میان یک گروه CIC و یک جمعیت ۱۰۰۰G، تصویر ظریفتری ارائه داد (جدول S۷). در حالی که به نظر میرسد سیستانیها به طور مداوم میان گروههای CIC و جنوب آسیا و مشخصاً با چینیهای جنوبی مخلوط میشوند؛ ترکمنها، مؤلفههایی را از CIC، افریقا، اروپا، آسیای شرقی و کمی کمتر از گروههایی از جنوب آسیا عاریه گرفتهاند. جزیرهنشینان خلیجفارس و همچنین اهالی بلوچ، یک جزء محدود افریقایی را تشکیل میدادند، اما جز CIC، هیچ هجوم آشکاری از سوی هیچ گروهی به سوی آنها وجود نداشت.
رابطه زمانی-مکانی ایرانیان باقیمانده با نمونههای DNA باستانی
با برقراری ارتباطی میان نمونههای ایرانی موجود با نمونههای منتشر شده از DNA باستانی از دورههای مختلف زمانی ایران و ورای آن جهت ردیابی جنبشهای زمانی-مکانی جوامع انسانی، هیچ نشانهای از مهاجرتهای اساسی به گروههای CIC به غیر از جوامع قفقاز در دوران نوسنگی تا عصر برنز پیدا نکردیم (اشکال ۵ تا ۷)؛ دومی به عنوان منبع و پایگاه، یعنی همان هدف مهاجرت ارائه میگردد. به طور خاص، همبخشی مردمان استپ، ظاهراً بسیار محدود بوده است و مشخصاً متعلق به عصر برنز و مدت کوتاهی پیش از آن (شکل ۶). به طور کلی به نظر میرسد که گروههای CIC لااقل در ۵۰۰۰ سال اخیر، توسعهای کاملاً مستقل را تجربه کردهاند. قابل توجهتر اینکه نمونههای ایرانی دوران نوسنگی اولیه از ایران غربی و تپه حصار، هممحل بودهاند با جزیرهنشینان موجود و کنونی خلیجفارس (تصویر ۵). در حالی که نمونههای بعدی عصر مفرغ از تپه حصار، روندی را به سوی CIC نشان دادند (شکل ۶)، که احتمالاً نشاندهنده اختلاط مداوم میان گروهها است. قابل توجه اینکه نمونههای باستانی DNA آسیای مرکزی از دوران نوسنگی و عصر برنز نیز با ساحلنشینان خلیجفارس محلیسازی شده و روندی مشابه را نشان دادند (اشکال ۵ و ۶). نمونههای سیستانی که از CIC دورتر بودند، نزدیک به نمونههای پاکستانی عصر آهن (شکل ۷) خوشهبندی شدند و ممکن هم هست که ترکیب مشابهی با گروههای CIC داشته باشند… گرچه فقدان نمونههایی از هزارههای پیشین این موضوع را به سؤالی باز تبدیل میکند.
نمونههای خاص DNA باستانی (جدول S۳) روی تغییرات انسانی موجود مورد بررسی قرار گرفتهاند (شکل S۱۸). منشأ جغرافیایی نمونههای باستانی با رنگ کدگذاری شده است. طبقات زمانی قبلی با محدودیتهای چگالی ۹۵ درصد نشان داده شدهاند (به شکل ۵ و ۶ مراجعه کنید).
شواهدی برای چندین رویداد پذیرش زبان
زبانهایی که ۱۱ قوم ایرانی به آنها صحبت میکردند به سه خانواده تقسیم میشدند: افریقایی-آسیایی (سامی، اعراب)، آلتایی (ترکی، ترکمنی، آذری) و هند و اروپایی (IE و سایرین). این تنوع زبانی تنها اندکی انعکاس مجاورتهای ژنتیکی بود… با آذریهای ترک زبان ایرانی و عربهای سامی زبان ایرانی که به لحاظ ژنتیکی شبیه CICهایی بودند که به زبان IE تکلم میکردند. این در حالی بود که بلوچهای IE، جزیرهنشینان خلیج فارس و سیستانیها به لحاظ ژنتیکی از سایر گروههای IE زبان جدا بودند. پس از طبقهبندی دوباره دادههای محلیمان، روند کلی موجود در نزدیکی ژنتیکی، به همان ترتیبی که با تجزیه و تحلیل مؤلفههای اصلی ارزیابی میشد، برای گویشوران زبانی از همان خانواده نیز آشکار گردید (شکل S۱۱A). با این حال گویشوران IE به طور کلی به دو گروه مجزا تقسیم شدند (مرتبط با زیرشاخههای اروپایی و هند و ایرانی)، در حالی که گویشوران زبان آلتایی، تنوع ژنتیکی گستردهای را شامل میشدند. تحلیل خودهمبستگی تقریبی براساس فاصله ژنتیکی در دو جزء اصلی اول، وجود یک همبستگی قوی و محلی مثبت را میان نزدیکی ژنتیکی و خانواده زبان گفتاری تأیید کرد (شکل S۱۱B).
سطوح مختلف خویشاوندی در اقوام ایرانی
اقوام ایرانی در سطوح خویشاوندی بسیار متفاوت بودند. اعراب ایرانی، بلوچها و سیستانیها ضریب همخونی بسیار بالایی را نشان دادند (FI در حدفاصل ۰.۰۱۲۲ تا ۰.۰۱۳۲)، که این مقداری بود فراتر از همخونی جمعیت ۱۰۰۰G. گیلکهای ایرانی و کردها تقریباً هیچ رابطه خویشاوندی نشان ندادند، در حالی که سایر گروهها در مقایسه با جمعیتهای ۱۰۰۰G (شکل S۱۲A و جدول ۳) به میزان قابل توجهی همبستگی بالایی به ثبت رساندند (FI در حدفاصل ۰.۰۰۲۴ تا ۰.۰۶۹). شایان ذکر است که خویشاوندی در هر گروه بسیار متفاوت بود، به طوری که ۵۰ درصد افراد به ترتیب مقادیر FI کمتر از ۰.۰۰۵۱ (اعراب ایرانی)، ۰.۰۰۴۲ (سیستانیهای ایرانی) و ۰.۰۰۳۶ (بلوچهای ایرانی)، و تقریباً برابر با صفر در گروههای باقیمانده داشتند. طول تجمعی نواحی اتوزیگوت استنباطشده توسط IBDseq و دورههای هموزیگوتی تعریفشده با PLINK (ROHs) دقیقاً منعکسکننده توزیع مقادیر همخونی است (شکل S۱۲B وS۱۲C) تعریف ROH مبتنی بر احتمال و طبقهبندی طول بعدی توسط سیر (شکلS۱۲D–S۱۲F) مقادیر قابلتوجهی از طول تجمعی ROH کلاس A اجدادی را در تقریباً همه گروههای قومی ایرانی و جمعیتهای ۱۰۰۰G نشان داد، اما طول ROH تجمعی کلاس C به طور کلی بسیار کوتاهتر بود. اعراب، بلوچها و سیستانیهای ایرانی بهطور بارز از این روند منحرف شدند، در حالی که بیشتر گروههای ایرانی ارزشهای بالا را نشان میدادند، که نشاندهنده همبستگی مداوم در طول هزارههای پیشین است.
مشابه با جمعیتهای پیشتر مطالعه شده، توزیع ژنومی ROHهای تعریفشده با PLINK از یک الگوی بسیار غیریکنواختی پیروی میکرد که همخوانی زیادی در تمام گروهها داشت (شکل S۱۳A) و مشابه آن چیزی بود که از تحلیل جمعیتهای ۱۰۰۰G غیرآفریقایی انجام شده بر روی نشانگرهای موجود در مجموعه دادههای ادغامشده به دست آمد (شکل S۱۴).
بحث و گفتگو
مطالعه ما بر پایه دادههای ژنومی حاصل از نمونهگیری گروههای قومی و همچنین شامل گروههایی میشود که قبلاً به خوبی پوشش داده نشدهاند… مثل گیلکهای ایرانی، کردها، مازنیها و سیستانیها. اکثر گروههای قومی ایران، دارای تنوع اتوزومی ژنتیکی هستند که به طور عمده تباری مشترک و عمدتاً خودمختار را شامل میشود… که به عنوان خوشه مرکزی ایران میشناسندش (CIC). قابل ذکر است که CIC همچنین شامل اعراب و آذریهای ایرانی (شکل ۱) و همچنین گروههای مذهبی زرتشتیان (شکل ۳) میشود؛ که با این ایده که زرتشتیان برای هزاران سال در منطقه ایران کنونی زندگی کردهاند و گروهی اولیه از هند و اروپایی زبان را شکل دادهاند، همخوانی دارد. با این حال CIC، دارای ساختار داخلی قابل توجهی بود، به انضمام مقادیر جفتی FST تا مرتبهای بالاتر از مقادیر همگنتر با اندازههای جمعیتی مشابهی نظیر آلمان… اما کمتر از سطح زیربنای گزارش شده برای اروپا و آسیای مرکزی و خاور نزدیک و آسیای جنوب شرقی و به طور کلی بسیار پایینتر از کشور همسایه ارمنستان در قفقاز. بلوچها، سیستانیها، ترکمنهای ایرانی و جزیرهنشینان خلیجفارس، آمیختگی قدرتمندی با CIC و جوامع اجدادی آن دارند. از آنجا که بخش قابل توجهی از جمعیت ایران به گروههای قومی غیر فارس تعلق دارد و یا اختلاطی از چند گونه است، لذا در مطالعات ژنتیکی آتی، مراجعه به گروههای قومی لازم و ضروری به نظر میرسد.
همبستگی تمایل ژنتیکی با زبان گفتار، شواهدی را برای جمعی از موارد پذیرش زبان در ایران در اختیار قرار داد. تنوع ژنتیکی خودمختار و متمایز CIC نشان میدهد که زبان یا زبانهای هند و اروپایی، احتمالاً توسط برخی از جوامع باستانی ایران از چندین هزار سال پیش مورد پذیرش قرار گرفته بودهاند؛ گرچه هنوز مشخص نیست که آیا این موضوع از مهاجرت گروههای تهاجمی و جنگجو ناشی میشود یا خیر… این کاستی را بگذارید پای کمبود دادههای کروموزومی که در این مطالعه وجود داشت. نزدیکی ژنتیکی مشاهده شده، بر پایهی دادههای ژنومی، آذریهای ایرانی ترکزبان و نیز اعراب ایرانی سامیزبان، با گروههای هندواروپایی زبان در CIC، گزارشهای پیشین را در مورد گروههای سامی زبان و آذربایجانیهای ترک زبان تأیید میکند. با توجه به مجاورت ژنتیکی آنها با دیگر جوامع عرب و قفقازی، این امر به خوبی با آمیختگی برخی از جوامع هند و اروپایی اجدادی (که همبخشیشان عمده بوده) و نیز همبخشی ژنتیکی اندک یکی از مشارکتکنندگانی که زبانش در دورههای پیش مورد پذیرش قرار گرفته بود، قابل توضیح است. در نهایت گسترش بلوچها، سیستانیها و جزیرهنشینان ایرانی، از دیگر گروههای CIC هند و اروپایی زبان، با اختلاط مکرر برخی جوامع اجدادی هند و اروپایی و جوامع باستانی جنوب و غرب آسیا و نیز ایرانیان غربی دوران نوسنگی اولیه قابل توضیح است.
CIC در مقایسه با دادههای مرجع جهانی و محلی، موجودیتی متمایز را نشان میدهد که شامل یک جزء ژنتیکی خودگردان است و نزدیک به جمعیتهای جغرافیایی همجوار خوشهبندی میشود و در «نقشه ژنتیکی» موقعیتی را فرض میگیرد که با موقعیت جغرافیایی آن در پیوند میان آسیای جنوبی، مرکزی و غربی، شمال افریقا و قفقاز مطابقت دارد. این مشاهدات با جریان ژن محدود گزارششده در مطالعات قبلی که مبتنی بودند بر نشانگر تکوالدینی و افزودن نمونه دیگر در تطابق میان تنوع ژنتیکی و موقعیت جغرافیایی، قابل توضیح است. توسعه عمدتاً مستقل گروههای CIC مطابق با انشعاب اولیه از جمعیت اوراسیایی پیش از نوسنگی، بیشتر با تمایزی که این گروهها در مقایسه با اقشار زمانی مختلف دارند، تأیید میشود؛ موضوعی که نشان از تداوم ژنتیکیای دارد که در زرتشتیان نیز انعکاس پیدا کرده است. به نظر میرسد کشاورزان دوران نوسنگی اولیه از ایران غربی و مردم استپ، کمک محدودی به گروههای CIC کردهاند. مؤلفه «افریقایی» مشترک میان ساکنان جزایر PG و برخی از جوامع صحرای جنوب به احتمال زیاد به پیش از آغاز نوسنگی برمیگردد و بنابراین جزایر PG را به عنوان یک گروه خودگردان اولیه معرفی میکند که متعاقباً با گروههای CIC مخلوط شدهاند. قابل ذکر است که به نظر میرسد اعراب ایرانی به لحاظ ژنتیکی اندکی با سایر جوامع عربی که در غرب آسیا و شمال افریقا سکونت دارند، فرق داشته باشند. تبار مشترکی که میان CIC و توسکانیها وجود دارد، میتواند آینه مهاجرتهای اولیه از خاور نزدیک باشد… که البته این موضوع به بررسیهای بیشتری نیاز دارد.
سطوح ناهمگون زیرساخت جمعیتی و نیز افزایش خویشاوندی در جماعت ایرانی، پیامدهای عمیقی در مطالعات ژنتیکی آینده دارد. اینها گزارشهای پیشین را در مورد فراوانیهای مختلف در سراسر ایران تأیید میکنند و بر نیاز رویکردی آگاهانه از قومیت به هنگام انجام مطالعات ژنتیک انسانی یا مشاوره ژنتیکی در ایران تأکید میورزند. مطالعات انجمن مبتنی بر جمعیت باید بر گروههای CIC متمرکز شود؛ دلیلش هم به حداقل رساندن آثار سوگیری به دلیل طبقهبندی جمعیت است و استفاده از آنالیز رایج تکنشانگر که بویژه برای آزمونهای نادر و مواقعی که باید ویژگیهای گروهی منطقهای و قومی را انتظار داشت، کارآیی دارد. عطف به تنوع ژنتیکی بالا حتی در CIC، اصلاح تبار ضروری و اجباری به نظر میرسد. در حالی که گنجاندن نمونههایی از گروههای بسیار مختلط خود میتواند خطر نتایج مغرضانه را افزایش دهد. در برخی اقوام افزایش قوم و خویشی با گزارشهای قبلی در مورد ایران و سایر جوامع غرب آسیا مطابقت داد، که این موضوع نشاندهنده ازدواجهای فامیلی پیشین و جاری در این کشور است. همچنین که احتمالاً تفاوتهای موجود میان استانهای ایران و مناطق مختلف مسکونی را نشان میدهد.
به طور خلاصه، ایرانیان دارای تنوع ژنتیکی متمایزی نسبت به کشورهای اطراف هستند که از تداوم ژنتیکی طولانیمدت و نیز ناهمگونی ژنتیکی قابل توجه ناشی میشود….در آینده مطالعات ژنتیکی انسان باید وابستگیهای قومیتی را برای نمونهبرداری و تحلیل در نظر بگیرد. و باید انتظار داشت که هم نمونههای موجود و هم نمونههای باستانی گستردهی مختلطی داشته باشد. تطابق مشاهدهشده بین تنوع ژنتیکی و موقعیت جغرافیایی و نیز نمونههایی از گسست نسب میان زبان و مجاورت ژنتیکی، مطابق است با شواهد باستانشناسی و تاریخی که در مورد ایران (به عنوان سرزمینی که در هزارههای پیشین شاهد مهاجرتهای متعدد و رویدادهای آمیخته بوده است) وجود دارند. امیدی که در ارائه مقاله مزبور رفته است اینکه با ارائه دادههای ژنومی جمعیت غرب آسیا، کمبودی را که بیش از یک دهه است که این منطقه را علیرغم تنوع شناختهشده و جایگاه برجستهاش در تاریخ بشر، عقب نگه داشته جبران کنیم. امید میرود این کار پژوهشی ترغیبی باشد برای جمعیت آینده مطالعات ژنتیکی، تکاملی و پزشکی.
پانوشت مترجم: متأسفانه با توجه به محدودیتهای حجمی سایت در استقرار تصاویر، تنها شماری از اشکال و جداول در خلال متن مستقر گردیدند…
منبع: ژورنال پلوس