สาธิต MEGA3.1 วิชา 266402

อันนี้ลองทำให้นิสิต ที่เรียน 266402 Intro. to Bioinf. ครับ (ท่านผู้อ่านท่านอื่นต้องขอโทษด้วยครับ อาจไม่เข้าใจเนื่องจากเป็นส่วนเพิ่มเติมของเนื้อหาที่นิสิตได้เรียนทั้งทฤษฎีและปฏิบัติการไปแล้ว ในส่วนนี้ให้ใช้ประกอบกับเอกสารที่แจกไป) นิสิตก็เม้นได้ อาจารย์ไม่โกรธ (ฮึมๆ จริงๆ) เพราะจะได้มีข้อมูลแล้วค่อยไปแก้ไข

ถ้านิสิตคิดว่า เร็วเกิน ก็ใช้การหยุด (Pause) เป็นช่วงๆ เพราะถ้าไม่สปีดเวลาเร็วขึ้น เวลาทั้งหมดของวีดิทัศน์จะเกิน 10 นาที ยูทู้บ จะไม่แฮปปี้

หมายเหตุ

1. ขอย้ำว่า วีดิทัศน์นี้ไม่ได้พยายามทำให้เข้าใจการใช้ MEGA3.1 สมบูรณ์ในตัวเอง ตรงกันข้ามทำเพื่อเสริมกับวิธีปฏิบัติที่เขียนเป็นข้อๆในชีท ในวีดิทัศน์อาจารย์เขียนไว้ด้วยว่าแต่ละส่วน (มี3ส่วน) ตรงกับเอกสารหน้าหรือข้อใด

2. ไฟล์ข้อมูล ที่โหลดเข้าโปรแกรม เป็นไฟล์ที่บันทึกมาจาก ที่อาจารย์สอนในการใช้โปรแกรมนี้ เรียกข้อมูลจากฐานข้อมูลเข้าโปรแกรมโดยตรง แล้วใช้คำสั่ง Align by ClustalW

เขียนใน GotoKnow โดย พันคำ
ใน ถนนชื่อ พันคำ

คำสำคัญ (Tags): #266402#mega3.1#phylogenetic tree#ชีวสารสนเทศ

หมายเลขบันทึก: 236979เขียนเมื่อ 23 มกราคม 2009 16:41 น. ()แก้ไขเมื่อ 16 มิถุนายน 2012 22:43 น. ()สัญญาอนุญาต: จำนวนที่อ่าน

ความเห็น (4)

อ๋อ

เขียนเมื่อ 4 มีนาคม 2011 16:10 น. ()

อาจารย์คะ

รบกวนอธิบายค่าตัวเลขที่อยู่บนกิ่งหน่อยค่ะ ว่าหมายถึงค่าอะไร

ค่าจากNeighbor joining, minimum evolution, maximum parsimony, UPGMA ให้ตัวเลขบนกิ่งไม่เหมือนกัน แปลว่ายังไงคะ

ดิฉันไม่ได้เรียนมาเลยแต่กำลังทำงานวิจัยที่ต้องใช้โปรแกรมพวกนี้อยู่ค่ะ

อ๋อ

พันคำ

เขียนเมื่อ 4 มีนาคม 2011 16:57 น. ()

ขอบคุณคุณอ๋อที่สอบถามเข้ามา

ถ้าทำวิจัยแนะนำว่าต้องอ่านเกี่ยวกับเรื่องนี้เพิ่มขึ้นอีกเล็กน้อย อย่างน้อยจะต้องใช้อ้างอิงในงานวิจัยของคุณอ๋อเองด้วย

ในที่นี่ขออธิบายพอเป็นแนวทาง คือ เป็นตัวเลข (ส่วนใหญ่เป็นเปอร์เซ็นต์) ที่แสดงความเชื่อมั่นวิธีหนึ่ง ซึ่งวิธีที่นิยมมักใช้วิธีการทำ Bootstraping (อาจลองหาบทความเรื่องนี้อ่านดูครับ มีเยอะมาก) หลังจากการทำขั้นตอน Boostraing ก็จะนำข้อมูลมาสร้างแผนภูมิต้นไม้ "ด้วยวิธีต่างๆ NJ, UPGMA, Maximum likelihood ect)" จนได้แผนภูมิต้นไม้เท่ากับจำนวน pseudodataset ที่สร้างในขั้น Bootstraping ก็ทำการหาแผนภูมิสอดคล้องก็จะได้เลขกำกับดังกล่าว

เนื่องจาก หลักการสร้างแผนภูมิต้นไม้ต่างๆมีแนวคิดต่างกัน ผลก็คือตัวเลขก็จะต่างๆกัน ดังนั้นการนำเสนอแผนภูมิต้นไม้ในทางวิชาการจึงต้องแจกแจงว่าได้มาโดยวิธีใด และควรจะวิเคราะห์โดยใช้หลายๆวิธีแล้วเสนอแผนภูมิต้นไม้ที่ให้ผลสอดคล้องกับวิธีต่างๆครับ

อ๋อ

เขียนเมื่อ 7 มีนาคม 2011 13:58 น. ()

อาจารย์คะ

1. ถ้าตัวเลขเป็นเปอร์เซนต์แสดงว่าตัวอย่างในกลุ่มนั้นๆมีความคล้ายคลึงกันตามเปอร์เซนต์ที่แสดงใช่ไหมค่ะ

2. ลองใช้ MEGA4 สร้าง tree ออกมา ค่าที่กำกับไว้ข้างล่าง 0.05 คืออะไรคะ

3. มีหนังสือภาษาไทยที่เข้าใจง่ายๆแนะนำไหมคะ อ่านหนังสือ Bioinformatics แล้วรู้เรื่องถึงแค่การใช้ clustal W เทียบ DNA seq เท่านั้นเองค่ะ

ขอบคุณค่ะ

อ๋อ

พันคำ

เขียนเมื่อ 7 มีนาคม 2011 15:36 น. ()

ตอบคุณอ๋อ

1. พูดว่ากลุ่มนั้นมีความคลึงกันตามเปอร์เซ็นต์นั้นคงไม่ถูกต้อง

ขออธิบาย ขอบเขตการหาความเชื่อมั่น (Confident limit) โดยวิธี บูตแสตร็พพิง เล็กน้อย คือหลังจากมีลำดับที่จัดเรียงแล้ว โปรแกรมจะทำการสร้างข้อมูลขึ้นใหม่โดยสร้างจำนวนเท่ากับที่ผู้ใช้กำหนด (100-10,000 ชุด) การสร้างเป็นแบบสุ่มหยิบ"คอลัมน์" จากลำดับการจัดเรียงมาประกอบเป็นข้อมูลใหม่ การสุ่มหยิบนั้นเป็นแบบการคืนสิ่งที่หยิบเลือกมาแล้วใส่กลับคืน (radom sampling with replacement) ดังนั้นบางคอลัมน์อาจถูกหยิบเลือกซ้ำๆก็ได้ และบางคอลัมน์อาจไม่ถูกเลือกเลย เมื่อได้ข้อมูลครบแล้ว ผู้วิเคราะห์จึงนำข้อมูลที่สร้างใหม่ทั้งหมด (pseudodata set) มาสร้างแผนภูมิต้นไม้ จะได้แผนภูมิต้นไม้ในจำนวนเท่ากับชุดข้อมูลที่สร้างขึ้นในระหว่างการทำบูตสแตร็พพิง เมื่อถึงขั้นหาแผนภูมิสอดคล้องก็จะพบว่าในจำนวนแผนภูมิต้นไม้ทั้งหมดนั้น แต่ละสปีชีส์หรือสิ่งมีชีวิต (taxon) นั้นที่แยกไปจาก node เดียวกันเหมือนกันกี่เปอร์เซ็นต์

ดังนั้น ถ้าเปอร์เซ็นต์เป็น 85 ก็บอกความเชื่อมั่นว่าคู่นั้นพบได้ 85 %จากแผนภูมิต้นไม้ทั้งหมด

2. ค่ากำกับ 0.05 คือสเกลเพื่อใช้เปรียบเทียบ ความยาวของก้าน ความยาวของก้าน บอกถึง จำนวนการแทนที่ต่อตำแหน่ง (the length of a branch is scaled to the expected number of substitutions per site along that branch.)

3. ไม่แน่ใจครับ น่าจะมีนะครับ