OAK

A phylogenomic study of Magnoliaceae and its evolutionary implications

Metadata Downloads
Alternative Title
A phylogenomic study of Magnoliaceae and its evolutionary implications
Abstract
Reconstruction of the phylogeny of a taxonomic group provided a deep understanding of its evolution and diversification history. Phylogenetic studies in Magnoliaceae have been mainly done using a few chloroplast or nuclear DNA regions. The recent molecular phylogenetic study in Magnoliaceae analyzed ten chloroplast DNA regions from 48 taxa representing all subgroups of Magnoliaceae and identified major eleven clades within Magnolioideae. However, relationships among them were unclear with low supporting values. The Hyb-Seq technique, which is a method combining hybridization-based target enrichment and genome skimming, can generate data for hundreds of single-copy (or low-copy) nuclear genes and organellar genomes from hundreds of individuals, even if from non-model organisms. In this study, chloroplast genomes and 400 nuclear genes for 124 taxa (125 samples) that cover all major subgroups in Magnoliaceae were sequenced and assembled based on the Hyb-Seq to clarify phylogenetic relationships and to understand the evolutionary history of Magnoliaceae. The chloroplast genome of Magnoliaceae has a typical structure consisted of a pair of IRs separated by LSC and SSC in length ranging from 159,269 bp to 160,186 bp, containing 79 protein-coding genes, 30 tRNA genes, and four rRNA genes. The comparative and phylogenetic analyses were carried out on the aligned matrix of 136,930 bp in length except for an IR, and the dataset included 8,962 variable sites (6.54%) and 5,697 parsimonious informative sites (4.16%). The genome structure, gene organization, and IR border structure are well conserved within the family. The chloroplast phylogenetic tree confirms the eleven major clades in the subfamily Mangolioideae identified from the previous studies and provides their relationships with high supporting values. At the base of the tree (hereafter, capital-lettered words indicate clade names), TALAUMA and GWILLIMIA are placed. MACROPHYLLA and FRASERI are the second basal group. After these four groups, two groups are recognized consisting of one including MICHELIA, YULANIA, GYNOPODIUM, and KMERIA and the other containing MANGLIETIA, RYTIDOSPERMUM, and THEORHODON. The regions containing the best phylogenetic information (five intergenic spacers: atpH-atpI, petA-psbJ, ndhF-rpl32, rpl32-trnL, and rps15-ycf1; four protein coding genes: matK, ndhF, psaC, and ycf1) were suggested for the future phylogenetic analysis of additional samples based on the sequence analyses of completed chloroplast whole genomes. In nuclear genome analyses, specific probes for capturing 504 single-copy nuclear genes were designed, and assembly results showed that the probes worked well by recovering an average of 87% for the total target transcripts (443,988 bp) used for probe design per sample across Magnoliaceae. Phylogenetic analyses were performed with 400 loci using two different approaches: the concatenation approach and the coalescent approach. The concatenated matrix is 765,376 bp in alignmened length and includes 321,537 variable sites (42.01%) and 186,094 parsimony-informative sites (24.31%). The nuclear tree is slightly different from the chloroplast tree. It shows 13 major clades in Magnolioideae and some conflicts are identified in topologies between trees inferred under the two different approaches. However, most of the clades in the coalescent ASTRAL tree conflicting with the concatenated ML tree have low LPP values and show considerable discordance among individual gene trees. The source of the gene tree discordance at those nodes was detected mainly as low-frequency alternative bipartitions. Although the result of the coalescent analysis reflects different evolutionary histories for different loci, the phylogenetic noise is maximized due to insufficient phylogenetic signals in each locus. The concatenated ML tree shows two primary clades in the subfamily Magnolioideae. One contains MANGLIETIA, RYTIDOSPERMUM, OYAMA, FRASERI, and SPLENDENTES (clade A, BS= 98), and the other contains MICHELIA, YULANIA, KMERIA, GYNOPODIUM, THEORHODON, MACROPHYLLA, GWILLIMIA, and TALAUMA (clade B, BS= 88). In clade A, the SPLENDENTES is placed at the base of this tree and FRASERI, OYAMA, RYTIDOSPERMUM, and MANGLIETIA are followed. The clade B consists of clade C and clade D. The clade C (BS = 96) contains GWILLIMIA and TALAUMA, and the clade D (BS= 99) contains MICHELIA, YULANIA, KMERIA, GYNOPODIUM THEORHODON, and MACROPHYLLA. In clade D, THEORHODON and MACROPHYLLA forms an independent clade (clade E, BS= 100), which is sister to a clade consisting of MICHELIA, YULANIA, KMERIA, and GYNOPODIUM (clade F, BS= 100). In clade F, GYNOPODIUM is branched first, and KMERIA, YULANIA, and MICHELIA are followed. Counting the number of quartets shared with the concatenated ML tree in each gene tree provides the phylogenetically best loci in 400 nuclear genes included in this study. The subset of the best 20 loci recovers 94.1% of quartets in the concatenated ML tree, suggesting the proper DNA regions for the future phylogenetic studies of additional samples in Magnoliaceae based on nuclear genome regions. Conflict topologies between highly supported two trees that from chloroplast genome and nuclear genome suggests the ancient hybridizations of 1) MICHELIA+YULANIA and 2) RYTIDOSPERMUM. It is suggested that they are originated from ancestors between GYNOPODIUM (female) and KMERIA (male) and between ancestors of OYAMA (female) and MANGLIETIA (male), respectively. Results of molecular dating and biogeographic analyses showed that 1) Magnolioideae is originated in a large ancestral region including Asia and the Americas in the late Eocene (37.84 mya) and 2) the intercontinental disjunctions of Magnoliaceae from the ancestral region into Asia or the Americas is occurred during the late Eocene and early Oligocene (32-35 mya), which is correlated with the global cooling event in the late Eocene, following global warming in the early Eocene. The independent temperate disjunctions in Liriodendron (between L. tulipifera and L. chinense; 17.54 mya), RYTIDOSPERMUM (between M. tripetala and M. obovata/M. officinalis; 13.00 mya), and YULANIA (between M. acuminata and the other taxa in the clade; 25 mya; one of calibration points) may have occurred during the global climate fluctuating period in early Oligocene and mid-Miocene. Since the climate during the Mid-Miocene Climatic Optimum (MMCO, 15 mya) was as warm as in the late Eocene (34 mya), the hypothesis is supported. The current classification system of Magnoliaceae recognized three subgenera (Magnolia, Yulania, and Gynopodium) and 12 sections within Magnolioideae by reflecting a piece of findings of previous molecular phylogenetic studies of Magnoliaceae. The massive molecular data and highly supported phylogenetic trees from both bi-parental lineage (nuclear) and uni-parental lineage (chloroplast) provided in this study will be a direct evidence for supporting future new classification system and will be resources to understanding the evolution and diversification history in Magnoliaceae.|특정 분류군에 대한 계통의 재구성은 그 분류군의 진화와 종다양화 역사를 이해하기 위한 중요한 정보를 제공한다. 목련과의 계통연구는 주로 소수의 엽록체 또는 핵 DNA 구간들을 사용하여 수행된 바 있다. 목련과의 최근 분자적 계통 연구는 목련과의 모든 하위 그룹들을 대표하는 48 개의 분류군에서 10 개의 엽록체 DNA 구간들을 분석하였고 목련아과 내에서 주요 11 개의 분계군를 확인하였지만, 이들 간의 유연관계는 아직 명확하게 판명되지는 않았다. Hyb-Seq 기술은 혼성화 기반의 표적 농축과 유전체를 얕게 훑는 시퀀싱(skimming)을 결합한 방법으로, 모델 식물이 아닌 분류군에서도 수백 개의 개체들로부터 수백 개의 단일(또는 적은) copy 수의 핵 유전자들과 세포소기관의 유전체에 대한 데이터들을 생성해낼 수 있다. 본 연구는 목련과 식물들의 명확한 계통유연관계를 밝히고 이들에 대한 진화의 역사를 이해하기 위하여 Hyb-Seq 기술을 적용하여 목련과의 모든 하위 그룹들을 대변하는 총 124 개의 분류군(125 개 샘플) 각각에 대하여 엽록체 유전체 전체와 400 개의 핵 구간들의 염기서열을 결정하였다. 목련과 식물의 엽록체 유전체들은 LSC와 SSC에 의해 분리 된 한 쌍의 IR로 구성된 전형적인 구조이고, 159,269 ~ 160,186 bp의 길이이며, 각각 79 개의 단백질 암호화 유전자, 30 개의 tRNA 유전자 및 4 개의 rRNA 유전자를 포함하고 있다. 하나의 IR을 제외하고 길이가 136,930 bp의 정렬된 매트릭스에 대해 비교유전체학적 분석이 수행되었는데, 이 자료에서는 8,962 개의 변이(6.54%)와 5,697 개의 계통학적 정보를 갖는 변이(4.16%)가 발견되었다. 목련과 식물들의 엽록체 유전체의 서열들은 유전체의 구조, 유전자 구성 및 IR 경계가 전반적으로 잘 보존되어 있었다. 엽록체 유전체를 기반으로 한 계통수는 이전 연구에서 인식된 목련아과 내 11 개의 주요 분계군들을 확인하였고, 높은 신뢰도의 계통유연관계를 보여주었다. 계통수의 기저에(이하 대문자로 표시된 단어들은 분계군의 이름을 나타냄), TALAUMA와 GWILLIMIA의 분계군이 위치하였고, MACROPHYLLA와 FRASERI의 분계군이 두 번째 기저 그룹으로 확인되었다. 이 네 개의 그룹에 이어서, MICHELIA, YULANIA, GYNOPODIUM, KMERIA를 포함한 분계군과 MANGLIETIA, RYTIDOSPERMUM, THEORHODON을 포함하는 분계군으로 구성된 두 개의 하위 분계군들이 확인되었다. 추가 시료에 대한 이후 계통학적 분석을 위해 완성된 엽록체 유전체 전체 서열들을 분석한 결과를 바탕으로 최상의 계통학적 정보를 포함한 구간들(5 개의 유전자 간 구간들: atpH-atpI, petA-psbJ, ndhF-rpl32, rpl32-trnL, rps15-ycf1; 4 개의 단백질 암호화 구간들: matK, ndhF, psaC, ycf1)이 제시되었다. Hyb-Seq에 의한 핵 데이터 분석에서는 504 개의 single-copy의 핵 유전자들을 포획하기 위하여 목련과 식물들에 대한 맞춤형 탐침들이 설계되었다. 이들에 대한 염기서열을 결정한 결과는 탐침 설계에 사용된 총 표적 전사물 서열 길이(443,988 bp)에 대해 평균 87%를 얻었음을 보여주었고, 이는 탐침이 성공적으로 잘 작동하였음을 보여주고 있다. 핵 유전체에 의한 계통학적 분석은 최종 얻어진 400 개 구간에 대해서 수행되었고, 전체 유전자들이 연결된 자료는 정렬된 길이가 765,376 bp였으며 321,537 개의 변이(42.01%)와 186,094 개의 계통학적인 정보를 갖는 변이(24.31%)를 포함하였다. 계통학적 분석은 concatenation 접근과 coalescent 접근의 두 가지 접근 방식으로 이루어졌는데, 이들의 계통수 작성 일부 서로 상충되는 부분들이 확인되었다. 그러나 concatenated ML 계통수와 상충되는 coalescent ASTRAL 계통수의 절들은 대부분 LPP 값이 낮았고, 해당 절에 대한 유전자 계통수들 간의 불일치가 있었다. 이러한 불일치의 주요 원인은 유전자 계통수들이 모두 서로 다른 bipartition들을 지지하기 때문인 것으로 확인되었다. Coalescent 분석의 결과는 유전자 구간마다 서로 다른 진화 이력을 반영했을 수 있지만, 각 구간에서 불충분한 계통학적 신호의 노이즈로 인한 것으로 판단되었고, 따라서, 후속 분석은 concatenated ML 계통수를 기반으로 수행하였다. Concatenated ML 계통수는 목련아과 내에 13개의 주요 분계군들이 존재하며, 이들은 두 개의 큰 분계군을 형성함을 보여주었다: 분계군 A (BS=98)은 MANGLIETIA, RYTIDOSPERMUM, OYAMA, FRASERI, SPLENDENTES를 포함하고, 분계군 B (BS=88)는 MICHELIA, YULANIA, KMERIA, GYNOPODIUM, THEORHODON, MACROPHYLLA, GWILLIMIA, TALAUMA로 구성되었다. 분계군 A에서 SPLENDENTES가 가장 먼저 분지 된 다음 FRASERI, OYAMA, RYTIDOSPERMUM, MANGLIETIA가 차례로 분지되었다. 분계군 B는 분계군 C와 D를 포함하는데, 분계군 C는 GWILLIMIA와 TALAUMA가 단계통군(BS=96)을 이루고, 이들은 MICHELIA, YULANIA, KMERIA, GYNOPODIUM, THEORHODON, MACROPHYLLA로 구성된 분계군 D (BS=99)과 자매군을 형성하였다. 분계군 D 내에서는 THEORHODON과 MACROPHYLLA가 독립된 분계군(분계군 E; BS=100)을 형성하였고, 이는 MICHELIA, YULANIA, KMERIA 및 GYNOPODIUM으로 구성된 분계군(분계군 F; BS=100)과 자매군을 형성하였다. 분계군 F에서 GYNOPODIUM이 가장 먼저 분지되었고 KMERIA, YULANIA, MICHELIA가 차례로 분지되었다. 각 유전자 계통수에서 concatenated ML 계통수와 공유된 quartet의 수를 세어 공유도가 높은 순으로 400 개의 구간들 각각에 순위를 부여하였는데, 상위 20개 구간으로 구성된 부분집합은 concatenated ML 계통수의 총 quartet의 94.1%를 공유하였다. 이들 높은 순위의 유전자들은 향후 목련과 식물들에 대하여 추가적인 시료 확보를 통한 확장된 연구를 위해 적합한 DNA 구간들로 제시되었다. 엽록체 유전체와 핵 유전체에 의해 도출된 분계군들이 서로 상충되지만, 각각의 계통수에 있어서 높은 지지도를 보일 경우 이것은 ancient hybridization의 결과로 추정할 수 있다. 목련과 식물에서는 계통수 분석 결과 1) MICHELIA+YULANIA는 GYNOPODIUM(암)과 KMERIA(수)의 고대 계통 간에, 그리고 2) RYTIDOSPERMUM은 OYAMA (암)와 MANGLIETIA (수)의 고대 계통 간에 ancient hybridization이 일어났음을 제시하였다. 분자 연대 측정 및 생물 지리학적 분석 결과, 1) 목련아과는 Eocene 후기(37.84 mya)에 아시아와 아메리카를 포함한 하나의 큰 조상 지역에서 유래됨을 보여주었고, 2) 고대 목련과의 최초 분포지가 아시아와 아메리카로 대륙간 분리가 일어난 것은 Eocene 후기에서 Oligocene 초기(32-35 mya)로 추정되는데, 이는 Eocene 초기의 지구 온난화 이후 Eocene 후기의 지구한랭화와 연관되어진다. 분석결과는 Liriodendron (L, tulipifera 와 L. chinense 간; 17.54 mya), RYTIDOSPERMUM (M. tripetala와 M. obovata와 M. officinalis로 구성된 분계군 간; 13.00 mya) 및 YULANIA (M. acuminata와 분계군 내 다른 분류군들 간; 25 mya; 교정 지점)에서 온대 지역에서의 독립적인 분지는 Oligocene 초기 및 Miocene 중기의 지구 기후 변동 기간 동안에 일어났음을 제시하고 있다. 이는 Mid-Miocene Climatic Optimum (MMCO, 15 Mya) 동안에 기후가 Eocene 후기(34 mya)만큼 따뜻했던 것이 가설에 의해 뒷받침된다. 목련과의 현재 분류 체계는 단편적인 분자 계통 학적 연구 결과들에 의해 목련아과 내에 3 개의 아속(Magnolia, Yulania, Gynopodium)과 12 개의 절을 인식하고 있었다. 본 연구에서는 부계와 모계의 공통 계통(핵)과 모계의 계통(엽록체)을 반영하는 대량의 분자 데이터를 도출하였고, 이를 이용하여 높은 신뢰도로 지지된 계통수들을 재구성하였다. 본 연구결과는 이후 새 분류 체계 제시를 위한 직접적인 증거가 될 것이며, 목련의 진화와 분화 역사의 이해를 돕는 주된 자료가 될 것이다.
Author(s)
박수현
Issued Date
2020
Awarded Date
2020-08
Type
Dissertation
URI
https://repository.sungshin.ac.kr/handle/2025.oak/1314
http://dcollection.sungshin.ac.kr/common/orgView/000000014017
Alternative Author(s)
Park, Suhyeon
Affiliation
성신여자대학교 일반대학원
Department
일반대학원 생물학과
Advisor
김상태
Table Of Contents
Chapter 1. Introduction 1
1.1 Magnoliaceae 1
1.1.1 Family Magnoliaceae 1
1.1.2 Classification history of the Magnoliaceae 4
1.1.3 Previous molecular phylogenetic studies on the Magnoliaceae 9
1.1.4 Report of misidentified Magnoliaceae chloroplast genomes deposited in the GenBank 10
1.2 Hyb-Seq 18
1.2.1 Hybridization-based target enrichment 18
1.2.2 Application of Hyb-Seq 20
1.2.3 Probe design 21
1.2.4 Experimental workflow in Hyb-Seq 24
1.2.5 Data analysis workflow in Hyb-Seq 25
1.2.6 Assemblers for Hyb-Seq data 26
1.2.7 Hyb-Seq as an ultimate phylogenomic tool 28
Chapter 2. Comparative and phylogenetic analyses of Manglietia (Magnoliaceae) based on complete chloroplast genomes 35
2.1 Introduction 35
2.2 Materials and Methods 37
2.3 Results 39
2.3.1 Structure of chloroplast genomes in Manglietia 39
2.3.2 Variation of IR borders 42
2.3.3 Small repeated sequences 46
2.3.4 Sequence divergence and hot spots 48
2.3.5 Phylogenetic analyses in Manglietia 52
2.4 Discussion 53
2.4.1 Structure of chloroplast genomes in Manglietia 53
2.4.2 Diversity of repeated sequences and SSRs 54
2.4.3 Genome variation and hotspots 55
2.4.4 Phylogenetic relationship within Manglietia 56
Chapter 3. Comparative and phylogenetic analyses of chloroplast genomes in Magnoliaceae 61
3.1 Introduction 61
3.2 Materials and Methods 62
3.2.1 Taxon sampling, DNA extraction, and sequencing 62
3.2.2 Genome assembly and annotation 64
3.2.3 Repeat structure and sequence divergence analyses 66
3.2.4 Phylogenetic analyses 67
3.3 Results 68
3.3.1 Structure of chloroplast genomes in Magnoliaceae 68
3.3.2 Variation of IR borders 71
3.3.3 Repeat sequences 73
3.3.4 Sequence divergence and hot spots 77
3.3.5 Phylogenetic analyses in Magnoliaceae 78
3.4 Discussion 84
3.4.1 Structure of chloroplast genomes in Magnoliaceae 85
3.4.2 Diversity of repeated sequences and SSRs 86
3.4.3 Genome variation and hotspots 87
3.4.4 Phylogeny of Magnoliaceae based on chloroplast genomes 88
Chapter 4. Phylogeny of Magnoliaceae based on 400 nuclear DNA regions using target-enrichment NGS 91
4.1 Introduction 91
4.2 Materials and Methods 91
4.2.1 Probe design 91
4.2.2 Taxon sampling, DNA extraction and sequencing 94
4.2.3 Assembly and alignment 95
4.2.4 Phylogenetic analyses 96
4.2.5 Molecular dating 98
4.2.6 Biogeographical analysis 100
4.3 Results 101
4.3.1 Sequencing, assembly, and alignment 101
4.3.2 Phylogenetic analyses results 104
4.3.3 Comparison between phylogenies based on nuclear and chloroplast dataset 113
4.3.4 Molecular divergence time estimation 118
4.3.5 Biogeography 119
4.4 Discussion 122
4.4.1 Alignment of Hyb-Seq data 123
4.4.2 Comparison of phylogeny-reconstruction methods 124
4.4.3 Ancient hybridization history in the evolution of Magnoliaceae 125
4.4.4 Molecular date and biogeography of Magnoliaceae 129
4.4.5 Further studies 132
Degree
Doctor
Publisher
성신여자대학교 일반대학원
Appears in Collections:
생물학과 > 학위논문
공개 및 라이선스
  • 공개 구분공개
  • 엠바고2020-08-31
파일 목록

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.