อันนี้ลองทำให้นิสิต ที่เรียน 266402 Intro. to Bioinf. ครับ (ท่านผู้อ่านท่านอื่นต้องขอโทษด้วยครับ อาจไม่เข้าใจเนื่องจากเป็นส่วนเพิ่มเติมของเนื้อหาที่นิสิตได้เรียนทั้งทฤษฎีและปฏิบัติการไปแล้ว ในส่วนนี้ให้ใช้ประกอบกับเอกสารที่แจกไป) นิสิตก็เม้นได้ อาจารย์ไม่โกรธ (ฮึมๆ จริงๆ) เพราะจะได้มีข้อมูลแล้วค่อยไปแก้ไข
ถ้านิสิตคิดว่า เร็วเกิน ก็ใช้การหยุด (Pause) เป็นช่วงๆ เพราะถ้าไม่สปีดเวลาเร็วขึ้น เวลาทั้งหมดของวีดิทัศน์จะเกิน 10 นาที ยูทู้บ จะไม่แฮปปี้
หมายเหตุ
1. ขอย้ำว่า วีดิทัศน์นี้ไม่ได้พยายามทำให้เข้าใจการใช้ MEGA3.1 สมบูรณ์ในตัวเอง ตรงกันข้ามทำเพื่อเสริมกับวิธีปฏิบัติที่เขียนเป็นข้อๆในชีท ในวีดิทัศน์อาจารย์เขียนไว้ด้วยว่าแต่ละส่วน (มี3ส่วน) ตรงกับเอกสารหน้าหรือข้อใด
2. ไฟล์ข้อมูล ที่โหลดเข้าโปรแกรม เป็นไฟล์ที่บันทึกมาจาก ที่อาจารย์สอนในการใช้โปรแกรมนี้ เรียกข้อมูลจากฐานข้อมูลเข้าโปรแกรมโดยตรง แล้วใช้คำสั่ง Align by ClustalW
อาจารย์คะ
รบกวนอธิบายค่าตัวเลขที่อยู่บนกิ่งหน่อยค่ะ ว่าหมายถึงค่าอะไร
ค่าจากNeighbor joining, minimum evolution, maximum parsimony, UPGMA ให้ตัวเลขบนกิ่งไม่เหมือนกัน แปลว่ายังไงคะ
ดิฉันไม่ได้เรียนมาเลยแต่กำลังทำงานวิจัยที่ต้องใช้โปรแกรมพวกนี้อยู่ค่ะ
อ๋อ
ขอบคุณคุณอ๋อที่สอบถามเข้ามา
ถ้าทำวิจัยแนะนำว่าต้องอ่านเกี่ยวกับเรื่องนี้เพิ่มขึ้นอีกเล็กน้อย อย่างน้อยจะต้องใช้อ้างอิงในงานวิจัยของคุณอ๋อเองด้วย
ในที่นี่ขออธิบายพอเป็นแนวทาง คือ เป็นตัวเลข (ส่วนใหญ่เป็นเปอร์เซ็นต์) ที่แสดงความเชื่อมั่นวิธีหนึ่ง ซึ่งวิธีที่นิยมมักใช้วิธีการทำ Bootstraping (อาจลองหาบทความเรื่องนี้อ่านดูครับ มีเยอะมาก) หลังจากการทำขั้นตอน Boostraing ก็จะนำข้อมูลมาสร้างแผนภูมิต้นไม้ "ด้วยวิธีต่างๆ NJ, UPGMA, Maximum likelihood ect)" จนได้แผนภูมิต้นไม้เท่ากับจำนวน pseudodataset ที่สร้างในขั้น Bootstraping ก็ทำการหาแผนภูมิสอดคล้องก็จะได้เลขกำกับดังกล่าว
เนื่องจาก หลักการสร้างแผนภูมิต้นไม้ต่างๆมีแนวคิดต่างกัน ผลก็คือตัวเลขก็จะต่างๆกัน ดังนั้นการนำเสนอแผนภูมิต้นไม้ในทางวิชาการจึงต้องแจกแจงว่าได้มาโดยวิธีใด และควรจะวิเคราะห์โดยใช้หลายๆวิธีแล้วเสนอแผนภูมิต้นไม้ที่ให้ผลสอดคล้องกับวิธีต่างๆครับ
อาจารย์คะ
1. ถ้าตัวเลขเป็นเปอร์เซนต์แสดงว่าตัวอย่างในกลุ่มนั้นๆมีความคล้ายคลึงกันตามเปอร์เซนต์ที่แสดงใช่ไหมค่ะ
2. ลองใช้ MEGA4 สร้าง tree ออกมา ค่าที่กำกับไว้ข้างล่าง 0.05 คืออะไรคะ
3. มีหนังสือภาษาไทยที่เข้าใจง่ายๆแนะนำไหมคะ อ่านหนังสือ Bioinformatics แล้วรู้เรื่องถึงแค่การใช้ clustal W เทียบ DNA seq เท่านั้นเองค่ะ
ขอบคุณค่ะ
อ๋อ
ตอบคุณอ๋อ
1. พูดว่ากลุ่มนั้นมีความคลึงกันตามเปอร์เซ็นต์นั้นคงไม่ถูกต้อง
ขออธิบาย ขอบเขตการหาความเชื่อมั่น (Confident limit) โดยวิธี บูตแสตร็พพิง เล็กน้อย คือหลังจากมีลำดับที่จัดเรียงแล้ว โปรแกรมจะทำการสร้างข้อมูลขึ้นใหม่โดยสร้างจำนวนเท่ากับที่ผู้ใช้กำหนด (100-10,000 ชุด) การสร้างเป็นแบบสุ่มหยิบ"คอลัมน์" จากลำดับการจัดเรียงมาประกอบเป็นข้อมูลใหม่ การสุ่มหยิบนั้นเป็นแบบการคืนสิ่งที่หยิบเลือกมาแล้วใส่กลับคืน (radom sampling with replacement) ดังนั้นบางคอลัมน์อาจถูกหยิบเลือกซ้ำๆก็ได้ และบางคอลัมน์อาจไม่ถูกเลือกเลย เมื่อได้ข้อมูลครบแล้ว ผู้วิเคราะห์จึงนำข้อมูลที่สร้างใหม่ทั้งหมด (pseudodata set) มาสร้างแผนภูมิต้นไม้ จะได้แผนภูมิต้นไม้ในจำนวนเท่ากับชุดข้อมูลที่สร้างขึ้นในระหว่างการทำบูตสแตร็พพิง เมื่อถึงขั้นหาแผนภูมิสอดคล้องก็จะพบว่าในจำนวนแผนภูมิต้นไม้ทั้งหมดนั้น แต่ละสปีชีส์หรือสิ่งมีชีวิต (taxon) นั้นที่แยกไปจาก node เดียวกันเหมือนกันกี่เปอร์เซ็นต์
ดังนั้น ถ้าเปอร์เซ็นต์เป็น 85 ก็บอกความเชื่อมั่นว่าคู่นั้นพบได้ 85 %จากแผนภูมิต้นไม้ทั้งหมด
2. ค่ากำกับ 0.05 คือสเกลเพื่อใช้เปรียบเทียบ ความยาวของก้าน ความยาวของก้าน บอกถึง จำนวนการแทนที่ต่อตำแหน่ง (the length of a branch is scaled to the expected number of substitutions per site along that branch.)
3. ไม่แน่ใจครับ น่าจะมีนะครับ