polyhedron博文:五個新石器時代祖先M134-M117(Oα)、M134-F444(Oβ)、002611-F11(Oγ)、O1a1-P203-F78、C3a-F1144的後代占到漢族及中國人的60%

严实、王传超等《40%的中國人的Y染色體來自3個新石器時代的超級祖先》中Y树系图及迁徙路线图(发表>>>

 

polyhedron博文链接:人類學雜記——24. 中國人的超級祖先

  王传超、严实等在《Journal of Systematics and Evolution》(《系统与进化学报)发表的《Late Neolithic expansion of ancient Chinese revealed by Y chromosome haplogroup O3a1c-002611》(《Y染色体单倍群O3a1c-002611揭示的新石器时代晚期中国人的扩张)部分译文:(PDF 全文下载摘要讨论李辉人类生物学论著目录

  Y染色体单倍群O3-M122是东亚地区最普遍的单倍型类群,Y-STR多样性一般从南往北降低,与史前向北迁移一致。当中,O3a1c-002611单倍群向北迁移大约自13000年前开始。汉族祖先和藏缅祖先分离后,古代汉族的F11F238自大约57千年前立即开始扩张。

  O3a1c-002611O3a2c1*-M134O3a2c1a-117在中国汉族所占比例分别为16.9%11.4%16.3%。我们分析了东亚超过7800个男性样本,新发现了002611下游的分支F11(rs17276393)与F238(hg18-12607511),我们还研究了相关O3a1c-002611STR多样性。

   O3a1c-002611单倍群在中国及东南亚大陆普遍存在,但南岛印度尼西亚和大洋洲未发现或非常低频,O3a1c-002611在地理上的分布如下图所示。O3a1c2-F238分布限于中国,老挝样品没有检测到,而O3a1c1-F11最普遍,分布从东南亚老挝到中国东北地区,O3a1c1-F11在汉族、朝鲜族及蒙古族中高频,而在西藏人群中低频。STR基因多样性估计,O3a1c-002611一般自南往北降低,中国西南及老挝人多样性最高,如青海藏族、西南部汉族、满族人也显示了一个比较高的多样性,相比之下,东北汉族和蒙古族多样性相对较低,西北、中部汉族的多样性和东部汉族几乎相同。STR多样性模式表明O3a1c-002611可能来自东南亚,然后向北迁移,O3a1c1-F11的多样性也表现出几乎相同的模式。结合STR多样性模式的分析,002611F11的突变似乎同时发生于约12千年前的东南亚人群,然后向北迁移到东亚。单倍群可能包含有O3a1c*未识别的亚类型,其相对较老,网络较复杂。汉族O3a1c1-F11的变异年龄为4.8±1千年,反映出最近的汉族人口的扩张,O3a1c2-F238在汉族的STR年龄为7.2±1.1千年,被研究人群所估计的年龄相同与最近有同一起源有关。O3a1c2-F238未见于老挝人,藏族和其他人群非常低频,认为F238突变可能产生于约7千年前的中国古汉族。O3a1c2-F238 STR多样性在西北汉族和东部汉族之间是相等的,很难说突变起源于哪里。总之,O3a1c-002611遗传证据勾勒出新石器时代晚期汉族祖先清晰的传播和扩展模式,单倍群O3a1c-002611O3a1c1-F11在约12千年前开始从东南亚大陆向北迁移,与O3-M122其他成员一起达到黄河上中游地区,约7千年前,单倍群O3a1c2-F238起源于汉藏祖先人群,约6千年前,汉族祖先脱离原始汉藏族群,并开始迁移到东部和南部,约5千年前,单倍群O3a1c1-F11可能在东部汉族经历了快速的扩张过程,并与周围人群融合形成东亚各个民族。

 
 
 

  汉族一共3120例(不包括平话汉),其中O-M175有2158例占69.17%、O3-M122有1629例占52.21%、O3a1c-002611有433例占13.88%、O3a1c*-002611xF11,xF238有41例占1.31%、O3a1c1-F11有283例占9.07%、O3a1c2-F238有70例占2.24%。当中,甘肃、山东两省的样本共2083例,占汉族总样本量的66.76%。

  甘肃汉族有1174例,其中O-M175有714例占60.82%、O3-M122有569例占48.47%、O3a1c-002611有133例占11.33%、O3a1c*-002611xF11,xF238有19例占1.62%、O3a1c1-F11有80例占6.81%、O3a1c2-F238有33例占2.81%。

  山东汉族有909例,其中O-M175有639例占70.3%、O3-M122有543例占59.74%、O3a1c-002611有140例占15.40%、O3a1c*-002611xF11,xF238有14例占1.54%、O3a1c1-F11有107例占11.77%、O3a1c2-F238有19例占2.09%。

  藏族有1690例,其中O-M175有613例占36.27%、O3-M122有566例占33.49%、O3a1c-002611有11例占0.65%、O3a1c1-F11有7例占0.41%、O3a1c2-F238有4例占0.24%。

  老挝人共1133例,其中O-M175有1049例占92.6%、O3-M122有291例占25.7%、O3a1c-002611有18例占1.6%、O3a1c*-002611xF11,xF238有7例占0.6%、O3a1c1-F11有11例占1%,未见O3a1c2-F238

  上图湘北有个F11高频区,样本偏少,24例出现8例002611(33.33%),其中7例F11(29.17%)及1例002611xF11,xF238(4.17%)。

  广东有两组样本,一组是广宁40例,出现2例002611(未细分) ,占5%;另一组是8例,出现1例F238,占12.5%。

  福建有两组样本,一组是53例,出现14例002611(未细分) ,占26.4%;另一组是13例,未见002611。


评论:

  颇感意外的是,除在苗族、土家族有一定比例的002611,南方其他瑶畲壮侗少数民族当中的M122*并非大多为002611。002611可能分布于北部荆蛮,源头偏北的苗族有较高比例,而南部荆蛮,源头偏南的扬越及后期的瑶、畲等002611比例甚低,南方侗台人群比例更低。暗示002611爆发于长江以北。南荆蛮及侗台的M122*主要可能是P201*。

  以往数据南方少数民族当中除了M134*、M117、M7以外的O3-M122*(即O3-M122xM134,M117,M7)又是什么呢?是P201*?002611及F11诞生于南方,但002611尤其是其下游的F11及F238大规模爆发于北方,如果南方少数民族当中的O3-M122*不是来自于北方的002611(F11),O3当中的M134及M117很可能也不是来自北方,而是南方土著。

  轩辕黄帝后裔的单倍型是F11吗?汉族父系002611约占16.2%,当中F11约占10%。从地域分布、F238突变年代、汉族F11变异年代以及巨大的人口数量来看,汉族的002611(包括F11及F238)可能初始扩张于黄帝部落(如轩辕黄帝),然后F11在河南的颛顼王朝-帝喾王朝(4900~4200aBP)中爆发,再在尧舜时期及夏商周进一步扩散到周边地区,这似乎可以推定汉族的F11绝大部分是轩辕黄帝的后裔,因为其他M117、M134*等很难再有规模与F11相当、共祖五千年的下游分支。然而,从韩日尤其是韩国人的002611亦有相当比例的F11来看,他们似乎更有可能来自东夷而不是华夏族群,山东汉族F11比例高于甘肃汉族也暗示,东夷也是一个F11爆发区。也许F11从南方迁移至北方河南时,就有一部分东迁形成东夷(太昊族群),他们与黄河中上游的华夏族群没有关系,而韩、日的F11有可能源自东夷支系或属太昊裔。只是东夷F11分支与华夏F11分支混在一起的共祖年龄就不可能只有4.8±1ka,华夏、东夷要作为汉族F11的源头只能是两者挑其一。由于藏族002611稀少,其O3系统中90%为M117,可以判断,作为藏族O3系统的源头,中原西部大地湾、老官台等前仰韶文化期原始炎帝部落很可能是欠缺002611的(包括F11、F238),M134*亦相当低频,后来中原西部002611的来源无非有两个可能:一个是随着黄帝部落沿黄河的西迁,另一个是随着山东龙山文化向西传播时的人群迁徙。根据炎黄华夏集团兼并东夷两昊集团的传说,认为与黄帝部落西迁的关联性更大,如果是后者,意味着东夷吞并华夏,这与传说不符。东夷人群后来可能被华夏削弱或替代了(被吞并),导致山东汉族F11高频。如果汉族的F11是轩辕黄帝的后裔,就得承认韩国人、日本人的F11也是黄帝的后裔,搜索朝鲜半岛的古代史,这种可能性也有,汉人征服及迁入朝鲜半岛的历史有“箕子朝鲜”、汉代设立汉四郡以及唐灭高句丽等。日本的F11有可能是传说中徐福及三千童男童女的后代,再可能是来自于朝鲜半岛。韩国人几份数据002611的比例为6.8%(样本数317)14.2%(506)10.2%(706),平均10.8%(1529);日本人有一份数据,002611占6.05%(729),没有细分出F11。

  传超、严实等从STR多样性判断,002611及F11大约在1.2万年前似乎同时诞生于东南亚(指的应是中南半岛)人群,然后进入东亚向北方迁徙。此似乎证据不足,可能性太小。1.2万年前应属中石器时代,从旧石器晚期到中石器时代再到新石器时代早期,岭南的文化遗址要比中南半岛多且年代更早,人群迁徙及文化传播很可能是从岭南往中南半岛方向而不是相反,002611尤其是F11要穿越岭南又不在岭南留下大的痕迹几乎是不太可能;再说多样性,北方人群多样性低很可能是由于战争引起的,是战争消灭了北方单倍群的多样性;中南半岛老挝人的多样性也并非最高,青海藏族、甘肃藏族都比他们高,西南四川、广西、云南汉族的多样性也不低甚至高于老挝人,如F11最高达0.471,再说老挝人002611及F11的比例也实在太低,更像是零星的南迁人群,他们的源头可能在岭南或北方。所以还是认为,002611及F11的诞生及初始扩张地应在湘南湘西一带。

  可能是因为复旦对广东人群的取样太少(就那么几份),才导致东亚人群主要支系的起源地跑到云南或中南半岛去了。最近翁玮霞、刘宏等对广东汉族1000个男性无关个体的17个Y-STR基因座进行了收集与分析结果表明广东人单倍型的多样性高得惊人,1000个广东男性无关个体竟然没有发现相同的单倍型,而其他地区的数据样本量在一两百人中就可能出现完全相同的单倍型(据风虎云龙)。

  李辉最近在《Y染色体与人类谱系学术报告》中讲,近半的中国男人共祖于三个祖先:一个是单倍群为O3a4-002611的祖先,共祖年代大约在6700年前,推测是伏羲;另一个是单倍群为O3a3c*-M134的祖先,共祖年代大约在6100年前,推测是神农氏;再一个是单倍群为O3a3c1-M117的祖先,共祖年代在5000年前,推测是轩辕黄帝。李辉还说,华东南人群O1a1-P203的共同祖先可追索到大约4000年前,应为夏代的禹帝;陕北神木县石峁遗址有与良渚文化相同的玉文化,人骨特征与华南人群相近,可能与禹帝部落扩张、与良渚人群北迁有关;当今甘肃裕固族有大约10%的O1a有可能源自新石器时代的东部沿海。但也有网友指,李辉的判断具有一定的娱乐性质。从2005年至今,李辉都坚持O3从云南走西线,一支M117、M134*北迁黄河中上游地区,后来发展成华夏族群,另一支主体是002611的族群沿长江而下,再迁河南山东(形成东夷),见2013年调查遗传学.王传超,李辉《通过Y染色体研究推测东亚的人类历史》(译文>>>)当中的Figure2-c(如右图中的O3路线)。不解的是,至少是1.5万年前已经分开的M117、M134*及002611两大族群,在语言上必是差异巨大,他们后来又是如何能广泛地融合在一起?汉藏语系是如何形成的?汉语是什么?002611的东夷语成分跑到哪里去了?还有原始华夏族群的农业文化源自哪里?华中的M117与北方的M117在点位上有较大差异,两者共祖难道也不出五千年吗?南方苗瑶、侗台、孟高棉的M117源自哪里?如果当初沿长江而下的一支也混有M117,他们必定也随002611到达河南山东一带,并与华夏族群相混,其势必造成北方的M117的共祖年代远早于五千年前,002611在北方都能很好地发展,M117与他相随没理由全部死光。再有,既然O3走云南西线,沿长江而下的一支大约在1.5万年前才分出,台湾原住民当中的O3a3*-P201又来自何处?假如不是盛冰期低海平面时的移民而是新石器时代中晚期的渡海者,为什么只见O3a3*-P201而没有该支系的主体成员002611?假如是来自于盛冰期绕行北部湾的另一支,为什么海南黎族没有包括O3a3*-P201在内的O3成员?

  回复突变会导致采用STR变突估算的年龄偏小 hercules网友认为:“一旦出现重复突变,那么观察到的突变数就会小于实际突变数”。因为历史上曾发生过汉武帝迁闽越至江浙一带的强制性移民事件(见2007年3月广西民族大学学报第29卷第2期李辉《分子人类学所见历史上闽越族群的消失》一文),当今江浙一带的O1a1-P203至少是两个古族群的后代,一部分是江浙一带的原住民、良渚族群的后人,另一部分是福建闽越的后代。良渚族群P203与闽越P203的共祖年龄不可能只有4千年,从考古年代上看,他们分开至少在1.5万年以上。有网友(以同样的方法?)算得江浙一带的O1a1-P203与台湾原住民的O1a1-P203也有近的、约4千年的共祖年龄,甚至在2千年以内,这现象恰好说明估算方法是有问题的,因为台湾原住民独有的母系单倍群的年龄已达万余年,台湾原住民作为盛冰期移民从大陆分出至少有1.5万年之久。与网友调侃中引出一句戏言:族群间单倍群真实的共祖年龄大致为STR估算年龄的4倍。即说江浙一带的O1a1-P203、台湾原住民的O1a1-P203共祖年代大概在1.6万年前,北方算得共祖于5000年前的M117等O3系单倍群实际上共祖于2万年前,跟他们诞生的年代已差不多了。足够大的共祖年龄意味着F11、M117、M134*(F444)在北方可以有多个爆发中心,如华夏、东夷与荆蛮等。

YFull YTree v8.10.00-O系(2021/1/6 转)