Cây phả hệ (phylogenetic tree)


Trước đây cây phả hệ được dùng như biểu hiện quan hệ lịch sử của những nhóm sinh vật, thường là những loài và mỗi nhóm được gọi là taxon (số nhiều là taxa). Charles Darwin giới thiệu ý tưởng “cây phả hệ” sự phát sinh giống loài (phylogeny), (tree of life) trong cuốn sách gây ảnh hưởng mạnh của mình mang tên “Nguồn gốc các loàiOrigin of Species (1859). Cho đến thập niên 70 thế kỹ 20 những quan hệ nầy chỉ dựa vào những đặc tính hình thái từ taxa hiện có và những di chỉ hóa thạch. Với sự xuất hiện của những trình tự phân tử, những dữ liệu mới phát triển đến mức độ khó tin tạo nên một bức tranh hoàn toàn mới trong phân loại học.

Hình 1. Cây phả hệ trong sổ tay ghi chép của Darwin

Cây phả hệ mô tả lịch sử tiến hóa của một nhóm các loài (species) với những đặc tính khác nhau nhưng cùng có mối quan hệ họ hàng với nhau và cùng hình thành từ một tổ tiên chung trong quá khứ. Có nhiều hướng nghiên cứu khác nhau để chứng minh đặc điểm phát sinh sinh loài này.

Chúng ta có thể hiểu đơn giản cây phả hệ bao gồm 2 yếu tố nốt (nodes) và nhánh (branches). Một nhánh là đường nối liền 2 nốt. Nốt có thể ở bên ngoài hoặc bên trong. Như hình 2 : nốt F42nagami, F43 quat, F44hanhMK và M37duong là nốt ngoài. Nốt Mk8Camsan, M11Waly Tangerine…M4ClemenD là nốt trong.  

Hình 3 là cây cùng gốc (rooted tree) các đầu nhánh của nó tượng trưng cho 5 taxa (A, B, C, D, E), bao gốm gốc R với 4 nốt bên trong (R, X, Y, Z). Một cây được gọi là cùng gốc nếu nó có một nốt đặc biệt – gốc – từ đó một đường dẫn hướng duy nhất đến mỗi taxon. Trong hình 3, R là gốc vì nó là nốt bên trong duy nhất từ đó có thể đến tấc cả những nốt khác. Trong hình 4 các taxa không có cùng gốc  tree.

Chỉ số bootstrap: là tần số xuất hiện của một nhóm (cluster) trên số lần giản đồ được thiết lập. Đơn vị tính là % (phần trăm). Theo Felsenstein (1985) bootstrap là một công cụ hỗ trợ cho việc xây dựng cây phát sinh loài. Chỉ số bootstrap nói lên độ tin cậy của sự gần gủi các thành viên của nhóm của cây phả hệ, .

Chỉ số CI (Consistency Index): là tỉ số đo tương thích giữa một cây bất kỳ nào đó trong tổng số các cây được phân tích có tổng số nhánh ít nhất. Giá trị CI biến động trong khoảng 1.0 (tương thích tối đa) tiệm cận đến 0 (ít tương thích nhất). Giá trị CI càng lớn thì kết quả có mức độ tin cậy càng cao.

Chỉ số CI được tính bằng công thức:    CI = M/S

M: số lượng nhỏ nhất có thể có của sự thay đổi tính trạng (bậc) trong một cây phát sinh loài bất kỳ.

S: số lượng sự thay đổi tính trạng thật sự (bậc) trong cây phát sinh đang nói đến (cây phát sinh đã có ý nghĩa giải thích tất cả sự phân bố tính trạng của giống cần phân loại).

RI (Retention Index): chỉ số thể hiện số lượng tính trạng tương đồng của 2 hay nhiều giống cùng tổ tiên trên cây phân loại.

Hình 2. Cây phả hệ các giống cam, quýt, tắc ở Việt Nam

A

                                           Z                    B

C

                               X                 Y

D

                    R

E

Hình 3. Một rooted tree

                     A                                                                     B

C

C

C

A

B

D

Hình 4. Hai cây không cùng gốc (unrooted tree)

 

Có 3 nhóm phương pháp thường được dùng để vẽ cấu trúc cây phát sinh sinh loài từ một ma trận.

– Distance methods – nhóm phương pháp khoảng cách: Khoảng cách chính là khoảng cách tiến hóa giữa các cặp đối tượng đang được so sánh.

– Maximum parsimony method – phương pháp hà tiện đến mức tối đa. Phương pháp này sẽ chọn lựa cây tiến hóa thỏa điều kiện là số lượng đặc tính bị biến đổi phải thấp nhất để giải thích những dữ liệu đã quan sát được. Phương pháp Hà tiện tối đa (Maximum parsimony) giả định cho rằng cây tiến hóa tốt nhất mổ tả tiến trình tiến hóa tốt nhất chính là cây mô tả được các loài ít thay đổi nhất tức là có ít đột biến nhất, cây vì thế có điểm thấp nhất (hà tiện) theo một tiêu chuẩn định sẵn (Hall, 2001).

– Maximum Likelihood methods – Nhóm phương pháp hợp lý cực đại nhóm phương pháp này dựa trên một hàm toán học tính toán xác suất khả năng một cây tiến hóa được tạo thành từ dữ liệu đã quan sát. Hàm này cho phép việc tích hợp các quá trình tiến hóa của đặc tính thành mô hình xác suất. Phương pháp hợp lý cực đại chọn lựa cây tiến hóa tối đa mà khi quan sát các dữ liệu dưới một mô hình nào đó có xác xuất tối đa (Hall, 2001).

.C A T

C T G

C A C

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s