The evolution and diversification of Scutellaria (Lamiaceae) based on phylogenomic analyses
- Alternative Title
- 계통유전체학적 분석을 통한 골무꽃속 식물의 진화와 종분화 연구
- Abstract
- 꿀풀과에 속하는 골무꽃속(Scutellaria)은 과 내에서 두 번째로 큰 속으로, 세계적으로 약 470 분류군이 포함된다. 많은 식물들이 약용식물 또는 향신료로 쓰이며 주로 온대 지역에 널리 분포한다. 일년생 또는 다년생 초본식물로 합판악의 숙존성, 자방병의 존재, 무배유성 등의 특징으로 꿀풀과의 다른 속들과 구분된다.
골무꽃속 내의 형태학적 분류체계는 여러 학자에 의해 제시되어왔지만, 대부분 지역적으로 한정된 종들을 대상으로 연구되었다. 전 세계적으로 분포하는 골무꽃속에 대한 연구는 Paton (1990)에 의해 수행되었는데, 골무꽃속에 속하는 110종을 대상으로 외부형태학적인 고찰을 통해 2아속 7절 2아절 38 종그룹(비공식 아절 이하 범주)으로 속 내 분류체계가 정립된 바 있고, 이는 현재까지 널리 받아들여지고 있다. 최근 골무꽃속에 대한 분자계통학적인 연구는 Zhao et al. (2017), Safikhani et al. (2018)에 의해 연구된 바 있지만, 이들은 지역적으로 한정된 종들을 그 대상으로 하여 골무꽃 속 내 분류군들의 유연관계를 이해하는 데에는 부족하였다.
본 연구에서는, 현재까지 수행된 바 없는 전 세계 골무꽃속 식물의 계통유전체학적인 연구를 통해 이들에 대한 진화와 종 분화를 이해하고자 하였다. 본 연구의 목적은 1) 골무꽃속의 분자 계통학적 정보에 의해 골무꽃속 내의 계통을 명확히 하며 이를 기존의 분류체계와 비교하고, 2) 분자계통학적 연구에 의해 얻어진 속 내 주요 그룹이 갖는 외부 형질을 재검토하고, 3) 비교유전체학적 정보로부터 미래의 새로운 분류체계 제시를 위한 분자계통학적 증거를 제공하고자 한다.
연구의 첫 번째 단계로, 이 전에 보고되었던 엽록체 유전체들(S. baicalensis, S. insignis)을 사용한 분석을 기반으로 빠르게 진화하는 DNA 유전자들을 선별하였다(ccsA, matK, ndhF). 계통 분석에는 골무꽃 속 내의 주요 그룹들을 대표하는 분류군들을 포함하여 총 200 분류군이 분석에 포함되었다. 계통 분석 결과, 여섯 개의 주요 분기군이 인식되었으며 Apeltanthus 아속은 단계통군, Scutellaria 아속은 측계통군으로 나타났다. 또한, Apeltanthus 아속에 포함되는 Apeltanthus, Lupulinaria 절은 모두 측계통군이었으며, Scutellaria 아속에 포함되는 절 중 Perilomia 절만 단계통군이었고, 나머지 절과 종그룹들은 모두 측계통군으로 나타났다.
골무꽃속 식물들의 계통학적 관계를 해결하기 위한 두 번째 단계로 골무꽃속 식물들의 전체 엽록체 유전체를 시퀀싱하였고, 군외군을 포함하여 47 분류군이 전체 엽록체 유전체 시퀀싱에 포함되었다. 골무꽃속 식물들의 엽록체 전체 길이는 151,030 bp에서 152,594 bp를 나타냈고, 이들은 한 쌍의 IR 구간 (25,190-25,314 bp)과 LSC구간(83,008-84,622 bp), SSC구간 (17,292-17,600 bp)으로 구성되었다. 모든 엽록체 유전체는 80개의 단백질 암호화 유전자, 30개의 tRNA 유전자와 4개의 rRNA 유전자로 이루어져 있었고, 매우 보존적인 구조를 보여주었다. 또한, 전체 엽록체 유전체에 대한 염기서열 분석을 통해 빠르게 진화하는 엽록체 구간을 조사하였고, 상위 10개의 구간을 선별한 결과 trnK-rps16, ycf1, ndhF, petA-psbJ, petN-psbM, ccsA-ndhD, trnT-UGU-trnL-UAA, rpoB-trnC, rpl32-ccsA and rbcL-accD 구간 순으로 다양성이 높게 나타났다. 계통 분석은 super-matrix 접근법을 기반으로 이전의 세 엽록체 구간(ccsA, matK, ndhF) 시퀀스들과 50분류군의 엽록체 유전체 시퀀스들을 결합하여 총 213 분류군을 대상으로 계통 분석이 수행되었다. 계통 분석 결과, 분류군들의 계통학적 관계는 Salviifoliae 절을 제외하고 세 엽록체 유전자를 사용한 이전의 계통수와 유사하게 나타났고, 신뢰도가 대부분 높아진 것을 확인하였다.
세 번째 단계로, 272개의 핵 구간을 포함한 핵 유전체를 기반으로 골무꽃속 식물들에 대한 계통 분석이 수행되었으며, 분석에는 군외군을 포함하여 95 분류군이 포함되었다. 각 구간에서 정렬된 염기서열들을 하나의 matrix로 연결한 전체 길이는 965,469 bp였다. 연결된 matrix를 기반으로한 Maximum-Likelihood (ML) 계통수는 높은 신뢰도와 함께 해결된 계통 유연관계를 보여주었다. 이전 super-matrix 엽록체 계통수와 비교하였을 때, 핵 유전체 기반 ML 계통수는 해상력이 매우 개선되었음을 확인하였다. 또한, Apeltanthus 아속의 단계통성과 Scutellaria 아속의 측계통성이 명확하게 재인식되었다. 이전 엽록체의 super-matrix 계통수와는 달리, Salviifoliae 절에 속하는 두 종 (S. heterophylla, S. pontica)이 측계통군으로 나타남에 따라 이 종들이 모계 관계에 더 가까움을 확인하였다. 이전의 엽록체 계통수들과 유사하게, Salazaria 아절은 Scutellaria 아절에 속하는 일부 종들을 포함하는 분기군과 자매 관계를 나타냈다. 또한, Perilomia 절은 단계통군으로 나타났고, Anaspis 절은 계통수의 기부에 위치하였다. 272개 구간들 중 추후 계통 분석에 유용하게 쓰일 최상의 핵 DNA 구간을 찾기 위해, 개별 유전자 계통수와 핵 유전체 ML 계통수 사이에서 공유된 quartet의 수를 계산하였다. 계산 결과, DN17712_c1_g5_i1 (Arabidopsis AT3G54460: SNF2 도메인, helicase 도메인, F-box family 단백질 관여 유전자) 구간은 이 구간 하나만으로도 전체 자료와 87.27 %에 해당하는 공유도를 갖고 있음이 확인되었다.
위의 연구와는 독립적인 연구로서 골무꽃속 49 분류군에 대한 핵 리보솜 DNA 염기서열이 결정되었고, ITS2 구간에 대한 2차 구조의 구조적 변이를 확인하였다. S. orientalis를 대상으로, 핵 리보솜 DNA의 한 반복 단위 전체의 서열이 결정되었고, 그 길이는 8,047 bp였다. 핵 리보솜 DNA 구간을 기반으로 계통 분석한 결과, 분류군들은 이전 연구의 계통수들과 유사한 계통 유연관계를 보였다. 진핵생물에서 ITS2 2차 구조는 네 가지 공통적인 특징을 보인다고 제시된 바 있지만(Schultz et al., 2005), 골무꽃속 식물들은 공통적인 특징을 공유하지 않았다. 또한 ITS2 2차 구조는 계통수에서 골무꽃속 내 하위그룹들을 구분할 수 있는 특별한 구조를 가지고 있지 않았으며, 이는 골무꽃속 내의 각각의 분류군에서 독립적인 구조적 진화가 일어났음을 제시하고 있다.
본 연구에서는 최초로 골무꽃속 식물들의 전 세계적인 샘플링과 대량의 엽록체 데이터와 핵 데이터에 의한 분석을 통해 골무꽃속 내 계통학적 유연관계를 보여주었다: 52 분류군의 엽록체 유전체 데이터(150 kbp)와 272개의 핵 구간 데이터(960 kbp). 엽록체와 핵 유전체 데이터를 기반으로 한 두 계통수에서 공통적으로 네 개의 주요 분기군들이 인식되었는데, 이는 Paton에 의해 제시된 분류체계(Paton, 1990)와는 매우 달랐으며, 이들은 추후 새로운 아속으로서 제시될 가능성이 있음을 확인하였다. 네 분기군 중 두 개의 분기군에 있어서, 각각의 분류군들은 양쪽 계통수에서 서로 다른 위치를 보이고 이러한 관계는 각각 높은 신뢰도를 나타내고 있어, 이는 이들 분류군들이 hybridization에 의한 기원으로 형성되었음을 제시하고 있다. 또한, 모든 계통수에서 공통적으로 나타나고 강하게 지지 되는 분기군들은 추후 새로운 계통학적 분류체계(phylogenetic classification)에서 인식될 수 있는 그룹으로 정의될 수 있을 것이다. 따라서, 본 연구 결과는 골무꽃속 내 새로운 분류체계를 확립하는 데에 중요한 기초 자료가 될 것이다.| Scutellaria is the second largest genus in Lamiaceae including approximately 470 taxa in the world. It is economically important as the medicinal and aromatic value. Plants are annual or perennial herbs that can be distinguished from other genera of Lamiaceae by their characteristics such as persistent synsepal, presence of gynophore, exalbuminous seeds, and so on.
Morphological classification systems of Scutellaria have been suggested by many researchers. However, most of them were regional studies. A global classification system of Scutellaria based on the morphological study was conducted by Paton (1990) and it is widely used to date. In this classification system, two subgenera, seven sections, two subsections, and 38 species groups (unofficial rank under the subsections) were included. Regional molecular phylogenetic studies of Scutellaria have been performed by Zhao et al. (2017) and Safikhani et al. (2018). However, these studies failed to show the detailed phylogenetic structure of Scutellaria because of regional sampling.
In this study, global phylogenomic studies were performed to understand the evolution and diversification of Scutellaria. The aims of this study were: 1) a comparison between molecular data and the current classification system (Paton, 1990), 2) the morphological re-examination of each subgroup recognized from the molecular studies, and 3) providing evidence for the future new classification system based on phylogenomic data.
As the first step of this study, rapidly evolved chloroplast genes (ccsA, matK, and ndhF) were selected based on the analysis of previously reported chloroplast genomes in Scutellaria (S. baicalensis and S. insignis). As a result of combined phylogenetic analysis of these three genes for 200 representatives in Scutellaria, six major clades were recognized with subgenus Apeltantus being a monophyletic group and subgenus Scutellaria being a paraphyletic group. Both sections Apeltanthus and Lupulinaria included in subgenus Apeltanthus were paraphyletic groups. Most sections and species groups were paraphyletic groups, and only section Perilomia included in subgenus Scutellaria formed a monophyletic group.
The second step to address phylogenetic relationships in Scutellaria is the sequencing of chloroplast whole genome. Forty-seven taxa representing each section and species group of Scutellaria including outgroups were selected for chloroplast whole-genome sequencing. Total lengths of chloroplast genomes sequenced in Scutellaria ranged from 151,030 bp to 152,594 bp, containing a pair of IR regions (25,190-25,314 bp), LSC region (83,008-84,622 bp), and SSC region (17,292-17,600 bp). Chloroplast genomes of Scutellaria included in this study contain 80 protein-coding genes, 30 tRNA genes, and 4 rRNA genes without gene-content variations and showed a highly conserved structure without rearrangements. Sequence analysis showed fast-evolving chloroplast regions in Scutellaria. Top ten fast-evolving chloroplast DNA regions were identified as trnK-rps16, ycf1, ndhF, petA-psbJ, petN-psbM, ccsA-ndhD, trnT-UGU-trnL-UAA, rpoB-trnC, rpl32-ccsA, and rbcL-accD (in order from the best regions). The phylogenetic analysis based on super-matrix phylogeny was performed for 213 taxa by combining sequences of three chloroplast genes (ccsA, matK, and ndhF) and chloroplast genome sequences of 50 taxa including genomes from previous studies. Except for the position of section Salviifoliae, the topology of the super-matrix phylogenetic tree was congruent with the phylogenetic tree based on three chloroplast genes, and bootstrap values were increased in most clades.
As the third step, phylogenetic analyses based on the nuclear genome were conducted using 272 nuclear loci with 95 Scutellaria representatives. The length of aligned concatenation sequences was 965,469 bp. A maximum-likelihood tree based on the concatenated matrix produced a highly supported and well-resolved tree. The topology was similar to previous chloroplast trees and the resolution of the concatenated ML tree was improved with high supporting values compared to the previous chloroplast trees. Again, the monophyly of subgenus Apeltanthus and the paraphyly of subgenus Scutellaria was clearly confirmed in this analysis. Different from the previous super-matrix chloroplast tree, two species (S. heterophylla and S. pontica) of section Salviifoliae formed a paraphyletic group indicating the close maternal relationship of these species. Similar to the previous chloroplast trees, section Salazaria was a sister to a clade containing some species of section Scutellaria. Section Perilomia was a monophyletic group and section Anaspis was located at the base of the tree. Most of the taxa in which the phylogenetic positions had been ambiguous were resolved in the chloroplast trees in the concatenated ML tree. To find the best nuclear DNA region among 272 loci that were useful in phylogenetic analysis with additional samples, the number of shared quartets between individual gene trees with the concatenated ML tree was calculated. As a result, the subset containing only one DN17712_c1_g5_i1 (Arabidopsis AT3G54460 homolog: the protein containing SNF2 domain, the helicase domain, and F-box family protein) locus showed the highest shared quartet proportion (87.27 %).
As an independent study, nuclear ribosomal DNA sequences were determined for 49 representatives, and the structural variation of the secondary structure of the internal transcribed spacer 2 (ITS2) region in nuclear ribosomal DNA was identified. The repeating unit of nuclear ribosomal DNA in S. orientalis was identified and the total length of the unit was 8,047 bp. The phylogenetic tree based on nuclear ribosomal DNA region was similar to that from nuclear 272 single-copy loci. It is reported that four structural characteristics in the secondary structure of ITS2 are shared in eukaryotes (Schultz et al., 2005). However, the structure was not found in Scutellaria. In addition, secondary structures did not provide a key to identify the subgroups of Scutellaria recognized from the molecular phylogenetic tree, indicating lineage-free independent structural evolution happened in Scutellaria.
This study showed that the first molecular phylogenetic relationships of Scutellaria based on global sampling with proper representatives and genome-scale data: including 52 chloroplast genomes (150 kbp) and nuclear 272 loci (960 kbp). Based on both chloroplast and nuclear phylogenetic trees, four major groups were recognized in Scutellaria. These groups were completely different from major groups in the current classification system (Paton, 1990), and these are potential subgenera in the new classification system. In addition, the result confirms potential hybridization origins of many taxa in two major groups, and highly supported common clades in both chloroplast and nuclear trees could be named by the concept of the phylogenetic classification. The result will provide the basis for a new classification system in Scutellaria.
- Author(s)
- 이윤경
- Issued Date
- 2021
- Awarded Date
- 2021-02
- Type
- Dissertation
- URI
- https://repository.sungshin.ac.kr/handle/2025.oak/1904
http://dcollection.sungshin.ac.kr/common/orgView/000000014150
- Affiliation
- 성신여자대학교
- Department
- 일반대학원 생물학과
- Advisor
- 김상태
- Table Of Contents
- CHAPTER 1. Introduction 1
I. Lamiaceae 2
1. Background of the family 2
2. Classification history in the family 5
3. Recent molecular phylogenetic studies. 9
II. Scutellaria 14
1. Background of the genus 14
2. Classification history in Scutellaria 17
3. Recent molecular phylogenetic studies and the purposes of this study 22
CHAPTER 2. Phylogenetic relationships in Scutellaria inferred from three chloroplast genes (ccsA, matK, and ndhF) 24
I. Introduction 25
II. Materials and Methods 28
1. Taxon sampling 28
2. DNA extraction, polymerase chain reaction, and sequencing 28
3. Phylogenetic analyses 34
III. Results 35
1. Sequence analyses 35
2. Phylogenetic relationships based on three fast-evolving chloroplast genes tree 36
IV. Discussion 42
1. Comparison between the phylogenetic tree and the current classification system 42
2. Comparison between trees from this study and previous molecular phylogenetic studies 46
CHAPTER 3. Comparative analyses of chloroplast genomes in Scutellaria and phylogeny based on the super-matrix approach 49
I. Introduction 50
II. Materials and Methods 53
1. Taxon sampling 53
2. DNA extraction, amplification, and sequencing 53
3. De-novo assembly and annotation . 54
4. Sequence analyses 55
5. Phylogenetic analyses based on super-matrix approach 56
6. Calculation of quartet distance among phylogenetic trees 57
III. Results 58
1. Completion of chloroplast genome sequences 58
2. Structural analyses of chloroplast genomes 63
3. Repeat sequences 71
4. Nucleotide diversity in chloroplast genomes 77
5. Comparison between super-matrix tree and three chloroplast genes tree 79
6. Quartet distance among phylogenetic trees 85
IV. Discussion 87
1. Characteristics of chloroplast genomes in Scutellaria 87
2. Phylogenetic relationships based on super-matrix tree 89
3. Screening of the best region for the phylogenetic study. 91
CHAPTER 4. Phylogeny of Scutellaria based on 272 nuclear single-copy genes using Hyb-Seq technique 94
I. Introduction 95
II. Materials and Methods 100
1. Probe design 100
2. Taxon sampling, DNA extraction, and sequencing 102
3. Raw data analyses 104
4. Phylogenetic analyses 105
III. Results 107
1. Sequence analyses 107
2. Phylogenetic analyses based on concatenation approach 111
3. Phylogenetic analyses based on coalescent approach 117
IV. Discussion 122
1. Discordance between the concatenated ML tree and the coalescent ASTRAL tree 122
2. Reexamination of phylogenetic relationships based on the concatenated ML tree 123
CHAPTER 5. Phylogenetic analyses based on nuclear ribosomal DNA sequences and the secondary structure of ITS2 in Scutellaria 126
I. Introduction 127
II. Materials and Methods 130
1. Taxon sampling and De-novo assembly 130
2. Completion of nrDNA sequences by PCR and Sanger sequencing 131
3. Phylogenetic analyses 133
4. Secondary structure analyses of ITS2 133
III. Results 134
1. Completion of nrDNA sequences and phylogeny based on nrDNA 134
2. Analyses of ITS2 secondary structures 140
IV. Discussion 146
CHAPTER 6. Conclusion 148
I. Comparison between chloroplast and nuclear phylogenetic trees 149
II. Comprehensive review of phylogenetic relationships in Scutellaria 152
III. Futher studies 156
- Degree
- Doctor
- Publisher
- 성신여자대학교 일반대학원
-
Appears in Collections:
- 생물학과 > 학위논문
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.