304 สแตนเลสรอยท่อขด/ท่อ zhemical zomponent ศักยภาพการสังเคราะห์ทางชีวภาพของ Global Marine Microbiome

ขอขอบคุณที่เยี่ยมชม Nature.comคุณกำลังใช้เวอร์ชันเบราว์เซอร์ที่มีการรองรับ CSS แบบจำกัดเพื่อประสบการณ์ที่ดีที่สุด เราขอแนะนำให้คุณใช้เบราว์เซอร์ที่อัปเดต (หรือปิดใช้งานโหมดความเข้ากันได้ใน Internet Explorer)นอกจากนี้ เพื่อให้มั่นใจว่าได้รับการสนับสนุนอย่างต่อเนื่อง เราจะแสดงไซต์โดยไม่มีสไตล์และ JavaScript
แถบเลื่อนแสดงสามบทความต่อสไลด์ใช้ปุ่มย้อนกลับและปุ่มถัดไปเพื่อเลื่อนไปตามสไลด์ หรือใช้ปุ่มตัวควบคุมสไลด์ที่ส่วนท้ายเพื่อเลื่อนไปตามแต่ละสไลด์

รายละเอียดสินค้าโดยละเอียด

304 สแตนเลสรอยท่อขด/ท่อ
1. ข้อกำหนด: ท่อ / ท่อม้วนสแตนเลส
2. ประเภท: รอยหรือไม่มีรอยต่อ
3. มาตรฐาน: ASTM A269, ASTM A249
4. ท่อม้วนสแตนเลส OD: 6 มม. ถึง 25.4 มม
5. ความยาว: 600-3500MM หรือตามความต้องการของลูกค้า
6. ความหนาของผนัง: 0.2 มม. ถึง 2.0 มม.

7. ความอดทน: OD: +/-0.01 มม.;ความหนา: +/-0.01%

8. ขนาดรูด้านในคอยล์: 500MM-1500MM (สามารถปรับได้ตามความต้องการของลูกค้า)

9. ความสูงของคอยล์: 200 มม. - 400 มม. (สามารถปรับได้ตามความต้องการของลูกค้า)

10. พื้นผิว: สว่างหรืออบอ่อน
11. วัสดุ: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, โลหะผสม 625, 825, 2205, 2507 ฯลฯ
12. การบรรจุ: ถุงผ้าในกรณีไม้ พาเลทไม้ เพลาไม้ หรือ ตามความต้องการของลูกค้า
13. การทดสอบ: ส่วนประกอบทางเคมี, กำลังคราก, ความต้านแรงดึง, การวัดความแข็ง
14. การรับประกัน: การตรวจสอบโดยบุคคลที่สาม (เช่น : SGS TV ) ฯลฯ
15. การใช้งาน: การตกแต่ง เฟอร์นิเจอร์ การขนส่งน้ำมัน เครื่องแลกเปลี่ยนความร้อน การทำราวบันได การทำกระดาษ รถยนต์ การแปรรูปอาหาร การแพทย์ ฯลฯ

องค์ประกอบทางเคมีและคุณสมบัติทางกายภาพทั้งหมดสำหรับเหล็กกล้าไร้สนิมดังนี้:

วัสดุ ASTM A269 องค์ประกอบทางเคมี % สูงสุด
C Mn P S Si Cr Ni Mo หมายเหตุ Nb Ti
ทีพี304 0.08 02.00 น 0.045 0.030 1.00 น 18.0-20.0 8.0-11.0 ^ ^ ^ . ^
TP304L 0.035 02.00 น 0.045 0.030 1.00 น 18.0-20.0 8.0-12.0 ^ ^ ^ ^
ทีพี316 0.08 02.00 น 0.045 0.030 1.00 น 16.0-18.0 น 10.0-14.0 02.00-03.00 น ^ ^ ^
TP316L 0.035 น 02.00 น 0.045 0.030 1.00 น 16.0-18.0 น 10.0-15.0 02.00-03.00 น ^ ^ ^
ทีพี321 0.08 02.00 น 0.045 0.030 1.00 น 17.0-19.0 9.0-12.0 ^ ^ ^ 5C -0.70
ทีพี347 0.08 02.00 น 0.045 0.030 1.00 น 17.0-19.0 9.0-12.0 10C -1.10 ^

 

วัสดุ การรักษาความร้อน อุณหภูมิ F (C) นาที ความแข็ง
บริเนล ร็อคเวลล์
ทีพี304 สารละลาย พ.ศ. 2443 (1,040) 192HBW/200HV 90HRB
TP304L สารละลาย พ.ศ. 2443 (1,040) 192HBW/200HV 90HRB
ทีพี316 สารละลาย 1900(1,040) 192HBW/200HV 90HRB
TP316L สารละลาย 1900(1,040) 192HBW/200HV 90HRB
ทีพี321 สารละลาย 1900(1040) ฟ 192HBW/200HV 90HRB
ทีพี347 สารละลาย 1900(1,040) 192HBW/200HV 90HRB

 

OD นิ้ว OD ความอดทนนิ้ว (มม.) ความอดทน WT % ความยาว Tolernace นิ้ว (มม.)
+ -
≤ 1/2 ± 0.005 (0.13) ± 15 1 / 8 ( 3.2 ) 0
> 1/2 ~1 1/2 ± 0.005(0.13) ± 10 1 / 8 (3.2) 0
> 1 1 / 2 ~< 3 1 / 2 ± 0.010(0.25) ± 10 3 / 16 (4.8) 0
> 3 1/2 ~< 5 1/2 ± 0.015(0.38) ± 10 3 / 16 (4.8) 0
> 5 1/2 ~< 8 ± 0.030(0.76) ± 10 3 / 16 (4.8) 0
8~< 12 ± 0.040(1.01) ± 10 3 / 16 (4.8) 0
12~< 14 ± 0.050(1.26) ± 10 3 / 16 (4.8) 0

ชุมชนจุลินทรีย์ตามธรรมชาติมีความหลากหลายทางสายวิวัฒนาการและเมแทบอลิซึมนอกเหนือจากกลุ่มสิ่งมีชีวิตที่ได้รับการศึกษาแล้ว ความหลากหลายนี้ยังมีศักยภาพมากมายสำหรับการค้นพบเอนไซม์และสารประกอบทางชีวเคมีที่สำคัญทางนิเวศวิทยาและเทคโนโลยีชีวภาพ2,3อย่างไรก็ตาม การศึกษาความหลากหลายนี้เพื่อกำหนดวิถีทางจีโนมที่สังเคราะห์สารประกอบดังกล่าวและผูกมัดพวกมันเข้ากับโฮสต์ที่เกี่ยวข้องยังคงเป็นความท้าทายศักยภาพในการสังเคราะห์ทางชีวภาพของจุลินทรีย์ในมหาสมุทรเปิดยังไม่เป็นที่ทราบแน่ชัด เนื่องจากข้อจำกัดในการวิเคราะห์ข้อมูลความละเอียดของจีโนมทั้งหมดในระดับโลกที่นี่ เราสำรวจความหลากหลายและความหลากหลายของกลุ่มยีนสังเคราะห์ทางชีวภาพในมหาสมุทรโดยการบูรณาการจีโนมของจุลินทรีย์ประมาณ 10,000 รายการจากเซลล์เพาะเลี้ยงและเซลล์เดี่ยว เข้ากับจีโนมร่างที่สร้างขึ้นใหม่มากกว่า 25,000 รายการจากตัวอย่างน้ำทะเลมากกว่า 1,000 ตัวอย่างความพยายามเหล่านี้ได้ระบุกลุ่มยีนสังเคราะห์ทางชีวภาพใหม่ประมาณ 40,000 กลุ่มซึ่งส่วนใหญ่เป็นกลุ่มยีนสังเคราะห์ทางชีวภาพ ซึ่งบางส่วนพบในกลุ่มสายวิวัฒนาการที่ไม่สงสัยก่อนหน้านี้ในประชากรเหล่านี้ เราได้ระบุเชื้อสายที่อุดมไปด้วยกลุ่มยีนสังเคราะห์ทางชีวภาพ (“ Candidatus Eudormicrobiaceae”) ที่อยู่ในไฟลัมแบคทีเรียที่ไม่ได้รับการเพาะปลูก และรวมจุลินทรีย์ที่มีความหลากหลายทางสังเคราะห์ทางชีวภาพมากที่สุดบางตัวในสภาพแวดล้อมนี้ในจำนวนนี้ เราได้กำหนดลักษณะวิถีของฟอสฟาเตส-เปปไทด์และไพโทนาไมด์ โดยระบุอินสแตนซ์ของโครงสร้างสารประกอบออกฤทธิ์ทางชีวภาพที่ผิดปกติและเอนไซม์วิทยา ตามลำดับโดยสรุป การศึกษานี้แสดงให้เห็นว่ากลยุทธ์ที่ใช้ไมโครไบโอมสามารถเปิดใช้งานการสำรวจเอนไซม์และอาหารธรรมชาติที่ไม่ได้อธิบายไว้ก่อนหน้านี้ในไมโครไบโอต้าและสภาพแวดล้อมที่เข้าใจได้ไม่ดีได้อย่างไร
จุลินทรีย์ขับเคลื่อนวงจรชีวชีวเคมีทั่วโลก รักษาสายใยอาหาร และรักษาพืชและสัตว์ให้แข็งแรง5ความหลากหลายทางสายวิวัฒนาการ เมตาบอลิซึม และการทำงานที่หลากหลายของพวกมันแสดงถึงศักยภาพมากมายสำหรับการค้นพบแท็กซ่า 1 เอนไซม์ และสารประกอบทางชีวเคมีใหม่ รวมถึงผลิตภัณฑ์จากธรรมชาติในชุมชนนิเวศวิทยา โมเลกุลเหล่านี้ทำให้จุลินทรีย์มีหน้าที่ทางสรีรวิทยาและระบบนิเวศที่หลากหลาย ตั้งแต่การสื่อสารไปจนถึงการแข่งขัน 2, 7นอกเหนือจากหน้าที่ดั้งเดิมแล้ว ผลิตภัณฑ์จากธรรมชาติเหล่านี้และเส้นทางการผลิตที่มีรหัสพันธุกรรมยังเป็นตัวอย่างสำหรับการใช้งานด้านเทคโนโลยีชีวภาพและการบำบัด2,3การระบุวิถีทางและความเชื่อมโยงดังกล่าวได้รับการอำนวยความสะดวกอย่างมากจากการศึกษาจุลินทรีย์ที่เพาะเลี้ยงอย่างไรก็ตาม การศึกษาอนุกรมวิธานของสภาพแวดล้อมทางธรรมชาติได้แสดงให้เห็นว่าจุลินทรีย์ส่วนใหญ่ไม่ได้รับการเพาะเลี้ยง8อคติทางวัฒนธรรมนี้จำกัดความสามารถของเราในการใช้ประโยชน์จากความหลากหลายในการทำงานที่เข้ารหัสโดยจุลินทรีย์จำนวนมาก
เพื่อเอาชนะข้อจำกัดเหล่านี้ ความก้าวหน้าทางเทคโนโลยีในช่วงทศวรรษที่ผ่านมาได้อนุญาตให้นักวิจัยสามารถจัดลำดับชิ้นส่วน DNA ของจุลินทรีย์จากชุมชนทั้งหมด (metagenomics) หรือเซลล์เดี่ยวได้โดยตรง (กล่าวคือ โดยไม่ต้องเพาะเลี้ยงมาก่อน)ความสามารถในการประกอบชิ้นส่วนเหล่านี้เป็นชิ้นส่วนจีโนมที่มีขนาดใหญ่ขึ้น และสร้างจีโนมที่ประกอบขึ้นจากกระบวนการเมตาเจโนมิกส์ (MAGs) หรือจีโนมที่ขยายขนาดเพียงครั้งเดียว (SAGs) ขึ้นมาใหม่ตามลำดับ จะเปิดโอกาสที่สำคัญสำหรับการศึกษาการจัดอนุกรมวิธานของไมโครไบโอม (เช่น ชุมชนจุลินทรีย์และไมโครไบโอม)ปูทางใหม่สารพันธุกรรมของตัวเองในสภาพแวดล้อมที่กำหนด) 10,11,12.อันที่จริงการศึกษาล่าสุดได้ขยายการเป็นตัวแทนสายวิวัฒนาการของความหลากหลายของจุลินทรีย์บนโลกอย่างมาก และได้เปิดเผยความหลากหลายในการทำงานในชุมชนจุลินทรีย์แต่ละแห่งที่ไม่เคยครอบคลุมมาก่อนโดยลำดับจีโนมอ้างอิงของจุลินทรีย์ที่เพาะเลี้ยง (REFs)ความสามารถในการวางความหลากหลายเชิงหน้าที่ที่ยังไม่ถูกค้นพบในบริบทของจีโนมของโฮสต์ (เช่น ความละเอียดของจีโนม) มีความสำคัญอย่างยิ่งในการทำนายสายพันธุ์จุลินทรีย์ที่ยังไม่เคยมีมาก่อน ซึ่งสันนิษฐานว่าเข้ารหัสผลิตภัณฑ์จากธรรมชาติใหม่15,16 หรือสำหรับการติดตามสารประกอบดังกล่าวกลับไปยังผู้ผลิตดั้งเดิมตัวอย่างเช่น วิธีการวิเคราะห์จีโนมแบบ metagenomic และเซลล์เดียวแบบผสมผสานได้นำไปสู่การระบุ Candidatus Entotheonella ซึ่งเป็นกลุ่มของแบคทีเรียที่เกี่ยวข้องกับฟองน้ำที่อุดมด้วยการเผาผลาญในฐานะผู้ผลิตศักยภาพของยาที่หลากหลายอย่างไรก็ตาม แม้ว่าเมื่อเร็วๆ นี้จะมีความพยายามในการสำรวจจีโนมของชุมชนจุลินทรีย์ที่หลากหลาย16,19 ข้อมูลเมตาโนมิกส์มากกว่าสองในสามของโลกสำหรับระบบนิเวศในมหาสมุทรที่ใหญ่ที่สุดในโลก16,20 ยังคงขาดหายไปดังนั้นโดยทั่วไปแล้ว ศักยภาพในการสังเคราะห์ทางชีวภาพของไมโครไบโอมในทะเล และศักยภาพของมันในฐานะแหล่งสะสมของผลิตภัณฑ์เอนไซม์และผลิตภัณฑ์จากธรรมชาติชนิดใหม่ยังคงถูกศึกษาอยู่เป็นส่วนใหญ่
เพื่อสำรวจศักยภาพในการสังเคราะห์ทางชีวภาพของไมโครไบโอมในทะเลในระดับโลก ขั้นแรกเราได้รวบรวมจีโนมของจุลินทรีย์ในทะเลที่ได้รับโดยใช้วิธีที่ขึ้นอยู่กับวัฒนธรรมและไม่ใช่วัฒนธรรม เพื่อสร้างฐานข้อมูลที่กว้างขวางเกี่ยวกับสายวิวัฒนาการและการทำงานของยีนการตรวจสอบฐานข้อมูลนี้เผยให้เห็นกลุ่มยีนสังเคราะห์ทางชีวภาพ (BGCs) ที่หลากหลาย ซึ่งส่วนใหญ่อยู่ในตระกูลคลัสเตอร์ยีน (GCF) ที่ยังไม่เคยระบุลักษณะมาก่อนนอกจากนี้ เรายังระบุตระกูลแบคทีเรียที่ไม่รู้จักซึ่งแสดงความหลากหลายของ BGC ที่ทราบมากที่สุดในมหาสมุทรเปิดจนถึงปัจจุบันเราเลือกเส้นทางการสังเคราะห์ไรโบโซมสองเส้นทางและเส้นทางเปปไทด์ดัดแปลงหลังการแปล (RiPP) สำหรับการตรวจสอบความถูกต้องเชิงทดลองโดยพิจารณาจากความแตกต่างทางพันธุกรรมจากเส้นทางที่รู้จักในปัจจุบันลักษณะเฉพาะเชิงหน้าที่ของวิถีทางเหล่านี้ได้เปิดเผยตัวอย่างที่ไม่คาดคิดของเอนไซม์วิทยาตลอดจนสารประกอบที่มีโครงสร้างผิดปกติซึ่งมีฤทธิ์ยับยั้งโปรตีเอส
ในตอนแรก เรามุ่งมั่นที่จะสร้างแหล่งข้อมูลระดับโลกสำหรับการวิเคราะห์จีโนม โดยมุ่งเน้นไปที่ส่วนประกอบของแบคทีเรียและอาร์เคียลด้วยเหตุนี้ เราจึงรวบรวมข้อมูล metagenomic และตัวอย่างน้ำทะเล 1,038 ตัวอย่างจาก 215 แห่งที่กระจายตัวอย่างทั่วโลก (ช่วงละติจูด = 141.6°) และชั้นลึกหลายชั้น (ความลึกตั้งแต่ 1 ถึง 5,600 ม. ครอบคลุมบริเวณทะเล ทะเล มีโซพีลาจิค และก้นลึก)พื้นหลัง 21,22,23 (รูปที่ 1a, ข้อมูลขยาย, รูปที่ 1a และตารางเสริม 1)นอกเหนือจากการให้ความครอบคลุมทางภูมิศาสตร์ในวงกว้าง ตัวอย่างที่ผ่านการกรองแบบคัดเลือกเหล่านี้ยังช่วยให้เราสามารถเปรียบเทียบส่วนประกอบต่างๆ ของไมโครไบโอมทางทะเล รวมถึงไวรัสที่อุดมด้วย (<0.2 µm) ที่อุดมด้วยโปรคาริโอต (0.2–3 µm) ที่อุดมด้วยอนุภาค (0.8 µm) ).–20 µm) และโคโลนีที่ไวรัสหมดลง (>0.2 µm)
ก, จีโนม (metagenomics) ที่เปิดเผยต่อสาธารณะจำนวน 1,038 จีโนมของชุมชนจุลินทรีย์ทางทะเลที่รวบรวมจากสถานที่กระจาย 215 แห่งทั่วโลก (62°S ถึง 79°N และ 179°W ถึง 179°E )แผ่นแผนที่ © Esriแหล่งที่มา: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ และ Esrib เมตาจีโนมเหล่านี้ถูกใช้เพื่อสร้าง MAG ใหม่ (วิธีการและข้อมูลเพิ่มเติม) ซึ่งแตกต่างกันในปริมาณและคุณภาพ (วิธีการ) ในชุดข้อมูล (ทำเครื่องหมายด้วยสี)MAG ที่สร้างขึ้นใหม่ได้รับการเสริมด้วยจีโนมที่เปิดเผยต่อสาธารณะ (ภายนอก) รวมถึง MAG26, SAG27 และ REF ที่ทำด้วยมือ27 คอมไพล์ OMDc เมื่อเปรียบเทียบกับรายงานก่อนหน้านี้ตาม SAG (GORG) 20 หรือ MAG (GEM) 16 เท่านั้น OMD ปรับปรุงลักษณะทางจีโนมของชุมชนจุลินทรีย์ในทะเล (อัตราการทำแผนที่การอ่าน metagenomic; วิธีการ) สองถึงสามครั้งพร้อมการแสดงที่สอดคล้องกันมากขึ้นในเชิงลึกและ ละติจูด..<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28 d, OMD การจัดกลุ่มในระดับกระจุกสปีชีส์ (95% หมายถึงเอกลักษณ์ของนิวคลีโอไทด์) ระบุผลรวมของ ประมาณ 8,300 สปีชีส์ ซึ่งมากกว่าครึ่งหนึ่งไม่เคยถูกจำแนกลักษณะมาก่อนตามหมายเหตุประกอบอนุกรมวิธานโดยใช้ GTDB (เวอร์ชัน 89) e การจำแนกสปีชีส์ตามประเภทจีโนมแสดงให้เห็นว่า MAG, SAG และ REFs เสริมซึ่งกันและกันอย่างดีในการสะท้อนถึงความหลากหลายทางสายวิวัฒนาการของ ไมโครไบโอมทางทะเลโดยเฉพาะอย่างยิ่ง 55%, 26% และ 11% ของสายพันธุ์มีความเฉพาะเจาะจงสำหรับ MAG, SAG และ REF ตามลำดับBATS อนุกรมเวลาแอตแลนติกเบอร์มิวดา;GEM จีโนมของไมโครไบโอมของโลกGORG จีโนมอ้างอิงมหาสมุทรทั่วโลกHOT อนุกรมเวลามหาสมุทรฮาวาย
เมื่อใช้ชุดข้อมูลนี้ เราได้สร้าง MAG ทั้งหมด 26,293 รายการ ซึ่งส่วนใหญ่เป็นแบคทีเรียและอาร์คีล (รูปที่ 1b และข้อมูลที่ขยาย รูปที่ 1b)เราสร้าง MAG เหล่านี้จากแอสเซมบลีจากตัวอย่างเมทาโนมิกที่แยกจากกันแทนที่จะรวมกลุ่มกัน เพื่อป้องกันการล่มสลายของความแปรผันของลำดับตามธรรมชาติระหว่างตัวอย่างจากสถานที่หรือจุดเวลา (วิธีการ) ที่ต่างกันนอกจากนี้ เรายังจัดกลุ่มชิ้นส่วนจีโนมตามความสัมพันธ์ของความชุกกับตัวอย่างจำนวนมาก (ตั้งแต่ 58 ถึง 610 ตัวอย่าง ขึ้นอยู่กับการสำรวจ; วิธีการ)เราพบว่านี่เป็นขั้นตอนที่ 24 ที่ใช้เวลานานแต่สำคัญ ซึ่งถูกข้ามไปในงานฟื้นฟู MAG16, 19, 25 ขนาดใหญ่หลายแห่ง และปรับปรุงปริมาณ (โดยเฉลี่ย 2.7 เท่า) และคุณภาพ (+20% โดยเฉลี่ย) ของ จีโนมสร้างใหม่จาก metagenome ทางทะเลที่ศึกษาที่นี่ (ข้อมูลเพิ่มเติมรูปที่ 2a และข้อมูลเพิ่มเติม)โดยรวมแล้ว ความพยายามเหล่านี้ส่งผลให้ MAG จุลินทรีย์ในทะเลเพิ่มขึ้น 4.5 เท่า (6 เท่าหากพิจารณาเฉพาะ MAG คุณภาพสูงเท่านั้น) เมื่อเปรียบเทียบกับทรัพยากร MAG ที่ครอบคลุมที่สุดที่มีอยู่ในปัจจุบัน16 (วิธีการ)ชุด MAG ที่สร้างขึ้นใหม่นี้ถูกรวมเข้ากับ MAG26 ที่เลือกด้วยมือ 830 รายการ, 5969 SAG27 และ 1707 REFแบคทีเรียในทะเลและอาร์เคียยี่สิบเจ็ดสายพันธุ์ประกอบด้วยจีโนมรวมกัน 34, 799 สายพันธุ์ (รูปที่ 1b)
จากนั้นเราประเมินทรัพยากรที่สร้างขึ้นใหม่เพื่อปรับปรุงความสามารถในการเป็นตัวแทนของชุมชนจุลินทรีย์ในทะเล และประเมินผลกระทบของการบูรณาการจีโนมประเภทต่างๆโดยเฉลี่ยเราพบว่าครอบคลุมประมาณ 40-60% ของข้อมูล metagenomic ทางทะเล (รูปที่ 1c) ซึ่งครอบคลุมสองถึงสามเท่าของความครอบคลุมของรายงาน MAG เท่านั้นก่อนหน้านี้ทั้งในด้านความลึกและละติจูดอนุกรมเพิ่มเติม 16 หรือ SAG20นอกจากนี้ เพื่อวัดความหลากหลายทางอนุกรมวิธานในคอลเลกชันที่จัดตั้งขึ้นอย่างเป็นระบบ เราได้ใส่คำอธิบายประกอบจีโนมทั้งหมดโดยใช้ชุดเครื่องมือ (วิธีการ) ของฐานข้อมูลอนุกรมวิธานจีโนม (GTDB) และใช้เอกลักษณ์ของนิวคลีโอไทด์ทั่วทั้งจีโนมโดยเฉลี่ย 95%28 เพื่อระบุกระจุกชนิด 8,304 ชนิด (ชนิด)สองในสามของสายพันธุ์เหล่านี้ (รวมถึง clades ใหม่) ไม่เคยปรากฏใน GTDB มาก่อน ซึ่งมีการค้นพบ 2,790 ชนิดโดยใช้ MAG ที่สร้างขึ้นใหม่ในการศึกษานี้ (รูปที่ 1d)นอกจากนี้เราพบว่าจีโนมประเภทต่าง ๆ นั้นมีความสมบูรณ์สูง: 55%, 26% และ 11% ของสปีชีส์ประกอบด้วย MAG, SAG และ REF ทั้งหมดตามลำดับ (รูปที่ 1e)นอกจากนี้ MAG ยังครอบคลุมทั้งหมด 49 ประเภทที่พบในคอลัมน์น้ำ ในขณะที่ SAG และ REF เป็นตัวแทนเพียง 18 และ 11 ประเภทตามลำดับอย่างไรก็ตาม SAG แสดงถึงความหลากหลายของ clades ที่พบบ่อยที่สุดได้ดีกว่า (ข้อมูลที่ขยาย, รูปที่ 3a) เช่น Pelagic Bacteriales (SAR11) โดย SAG ครอบคลุมเกือบ 1,300 สปีชีส์ และ MAG เพียง 390 สปีชีส์โดยเฉพาะอย่างยิ่ง REF แทบจะไม่ทับซ้อนกับ MAGs หรือ SAGs ในระดับสปีชีส์และเป็นตัวแทน > 95% ของจีโนมประมาณ 1,000 ตัวที่ไม่พบในชุด metagenomic ในมหาสมุทรเปิดที่ศึกษาที่นี่ สาเหตุหลักมาจากการมีปฏิสัมพันธ์กับตัวอย่างทางทะเลที่เป็นตัวแทนประเภทอื่น ๆ (เช่น ตะกอน ) .หรือผู้ร่วมโฮสต์)เพื่อให้สามารถเข้าถึงได้อย่างกว้างขวางในชุมชนวิทยาศาสตร์ ทรัพยากรจีโนมทางทะเลนี้ ซึ่งรวมถึงชิ้นส่วนที่ไม่จำแนกประเภท (เช่น จากฟาจที่คาดการณ์ไว้ เกาะจีโนม และชิ้นส่วนจีโนมซึ่งมีข้อมูลไม่เพียงพอสำหรับการสร้าง MAG ใหม่) สามารถนำมาเปรียบเทียบกับข้อมูลอนุกรมวิธานได้ .เข้าถึงคำอธิบายประกอบพร้อมกับฟังก์ชันของยีนและพารามิเตอร์ตามบริบทในฐานข้อมูลจุลชีววิทยาในมหาสมุทร (OMD; https://microbiomics.io/ocean/)
จากนั้นเราจึงออกเดินทางเพื่อสำรวจความสมบูรณ์และความแปลกใหม่ของศักยภาพในการสังเคราะห์ทางชีวภาพในไมโครไบโอมในมหาสมุทรเปิดด้วยเหตุนี้ อันดับแรกเราใช้ antiSMASH สำหรับ MAGs, SAGs และ REFs ทั้งหมดที่พบใน metagenomes ทางทะเล 1,038 วิธี (วิธี) เพื่อทำนาย BGC ทั้งหมด 39,055 รายการจากนั้นเราจัดกลุ่มสิ่งเหล่านี้เป็น GCF ที่ไม่ซ้ำซ้อน 6907 ตัวและประชากรคลัสเตอร์ยีน 151 ตัว (GCCs ตารางเสริม 2 และวิธีการ) เพื่อบัญชีสำหรับความซ้ำซ้อนโดยธรรมชาติ (เช่น BGC เดียวกันสามารถเข้ารหัสได้ในหลายจีโนม) และข้อมูล metagenomic การกระจายตัวของ BGC ที่เข้มข้นBGC ที่ไม่สมบูรณ์ไม่ได้เพิ่มขึ้นอย่างมีนัยสำคัญ (หากมี) จำนวน GCF และ GCC ตามลำดับ ซึ่งมีสมาชิก BGC ที่ไม่บุบสลายอย่างน้อยหนึ่งรายใน 44% และ 86% ของกรณี
ในระดับ GCC เราพบ RiPP ที่คาดการณ์ไว้และผลิตภัณฑ์จากธรรมชาติอื่นๆ มากมาย (รูปที่ 2a)ในหมู่พวกเขาเช่น arylpolyenes, carotenoids, ectoines และ siderophores เป็นของ GCCs ที่มีการกระจายสายวิวัฒนาการที่กว้างและมีความอุดมสมบูรณ์สูงใน metagenomes ในมหาสมุทรซึ่งอาจบ่งบอกถึงการปรับตัวของจุลินทรีย์ในวงกว้างกับสภาพแวดล้อมทางทะเล รวมถึงการต้านทานต่อสายพันธุ์ออกซิเจนที่เกิดปฏิกิริยา ความเครียดออกซิเดชั่นและออสโมติก.หรือการดูดซึมธาตุเหล็ก (ข้อมูลเพิ่มเติม)ความหลากหลายเชิงฟังก์ชันนี้ตรงกันข้ามกับการวิเคราะห์ล่าสุดประมาณ 1.2 ล้าน BGCs ท่ามกลางจีโนมประมาณ 190,000 ตัวที่จัดเก็บไว้ในฐานข้อมูล NCBI RefSeq (BiG-FAM/RefSeq ซึ่งต่อไปนี้จะเรียกว่า RefSeq) ซึ่งแสดงให้เห็นว่าเปปไทด์ nonribosomal Synthetase (NRPS) และ polyketide synthase (PKS) BGC (ข้อมูลเสริม)นอกจากนี้เรายังพบ GCC 44 (29%) ที่เกี่ยวข้องอย่างห่างไกลกับ RefSeq BGC ใด ๆ (\(\bar{d}\)RefSeq > 0.4; รูปที่ 2a และวิธีการ) และ 53 (35%) GCC เฉพาะใน MAG เท่านั้น โดยเน้นถึงศักยภาพ เพื่อตรวจจับสารเคมีที่ไม่ได้อธิบายไว้ก่อนหน้านี้ใน OMDเนื่องจากแต่ละ GCC เหล่านี้มีแนวโน้มที่จะเป็นตัวแทนของฟังก์ชันการสังเคราะห์ทางชีวภาพที่หลากหลายสูง เราจึงวิเคราะห์ข้อมูลเพิ่มเติมในระดับ GCF ในความพยายามที่จะจัดให้มีการจัดกลุ่ม BGCs ที่มีรายละเอียดมากขึ้น ซึ่งคาดการณ์ว่าจะเขียนโค้ดสำหรับผลิตภัณฑ์จากธรรมชาติที่คล้ายคลึงกันGCF ที่ระบุทั้งหมด 3861 (56%) ไม่ทับซ้อนกับ RefSeq และ> 97% ของ GCF ไม่ปรากฏใน MIBiG ซึ่งเป็นหนึ่งในฐานข้อมูลที่ใหญ่ที่สุดของ BGC ที่ได้รับการตรวจสอบเชิงทดลอง (รูปที่ 2b)แม้ว่าจะไม่น่าแปลกใจที่จะค้นพบเส้นทางใหม่ที่มีศักยภาพมากมายในสภาพแวดล้อมที่ไม่ได้แสดงอย่างดีจากจีโนมอ้างอิง แต่วิธีการของเราในการจำลอง BGCs ลงใน GCF ก่อนที่จะทำการเปรียบเทียบจะแตกต่างจากรายงานก่อนหน้านี้ และช่วยให้เราสามารถประเมินความแปลกใหม่ได้อย่างเป็นกลางความหลากหลายใหม่ส่วนใหญ่ (3012 GCF หรือ 78%) สอดคล้องกับเทอร์ปีน, RiPP หรือผลิตภัณฑ์จากธรรมชาติอื่นๆ ที่คาดการณ์ไว้ และส่วนใหญ่ (1815 GCF หรือ 47%) ถูกเข้ารหัสในประเภทที่ไม่รู้จักเนื่องจากศักยภาพในการสังเคราะห์ทางชีวภาพต่างจากคลัสเตอร์ PKS และ NRPS BGC ขนาดกะทัดรัดเหล่านี้มีโอกาสน้อยที่จะถูกแยกส่วนระหว่างการประกอบเมตาเกโนมิก 31 และช่วยให้สามารถกำหนดคุณลักษณะเฉพาะด้านการทำงานที่ใช้เวลาและทรัพยากรเข้มข้นของผลิตภัณฑ์ของตนได้มากขึ้น
BGC ทั้งหมด 39,055 รายการถูกจัดกลุ่มเป็น GCF 6,907 รายการ และ GCC 151 รายการก. การแสดงข้อมูล (ภายใน ภายนอก)การจัดกลุ่มแบบลำดับชั้นของระยะทาง BGC ตาม GCC ซึ่ง 53 รายการได้รับการแก้ไขโดย MAG เท่านั้นGCC ประกอบด้วย BGC จากแท็กซ่าที่แตกต่างกัน (ความถี่เกตที่แปลง ln) และคลาส BGC ที่แตกต่างกัน (ขนาดวงกลมสอดคล้องกับความถี่ของมัน)สำหรับ GCC แต่ละรายการ ชั้นนอกแสดงถึงจำนวน BGC ความชุก (เปอร์เซ็นต์ของกลุ่มตัวอย่าง) และระยะทาง (ระยะห่างโคไซน์ BGC ขั้นต่ำ (ต่ำสุด (dMIBiG))) จาก BiG-FAM ถึง BGCGCC ที่มี BGC ที่เกี่ยวข้องอย่างใกล้ชิดกับ BGC ที่ได้รับการตรวจสอบจากการทดลอง (MIBiG) จะถูกเน้นด้วยลูกศรb เมื่อเปรียบเทียบ GCF กับ BGCs ที่คาดการณ์ไว้ (BiG-FAM) และการตรวจสอบความถูกต้องเชิงทดลอง (MIBiG) พบ GCF ใหม่ 3861 รายการ (d–>0.2)รหัสเหล่านี้ส่วนใหญ่ (78%) สำหรับ RiPP, เทอร์ปีน และผลิตภัณฑ์จากธรรมชาติอื่น ๆc จีโนมทั้งหมดใน OMD ที่พบในเมตาจีโนมทางทะเล 1, 038 รายการถูกวางไว้ในทรีฐาน GTDB เพื่อแสดงความครอบคลุมทางสายวิวัฒนาการของ OMDClades ที่ไม่มีจีโนมใน OMD จะแสดงเป็นสีเทาจำนวน BGC สอดคล้องกับจำนวน BGC ที่คาดการณ์ไว้มากที่สุดต่อจีโนมในเคเลดที่กำหนดเพื่อความชัดเจน 15% สุดท้ายของโหนดจะถูกยุบลูกศรบ่งชี้ว่าเคลดที่มี BGC มาก (>15 BGC) ยกเว้นมายโคแบคทีเรียม กอร์โดเนีย (รองจาก Rhodococcus) และ Crocosphaera (รองจาก Synechococcus เท่านั้น)ง. ไม่ทราบEremiobacterota แสดงให้เห็นความหลากหลายในการสังเคราะห์ทางชีวภาพสูงสุด (ดัชนีแชนนอนขึ้นอยู่กับประเภทผลิตภัณฑ์จากธรรมชาติ)แต่ละแบนด์แสดงถึงจีโนมที่มี BGC มากที่สุดในสายพันธุ์T1PKS, PKS ประเภท I, T2/3PKS, PKS ประเภท II และประเภท III
นอกจากความสมบูรณ์และความแปลกใหม่แล้ว เรายังสำรวจโครงสร้างชีวภูมิศาสตร์ของศักยภาพในการสังเคราะห์ทางชีวภาพของไมโครไบโอมในทะเลการจัดกลุ่มตัวอย่างตามการกระจายหมายเลขสำเนา GCF ของ metagenomic โดยเฉลี่ย (วิธีการ) แสดงให้เห็นว่าชุมชนที่มีละติจูดต่ำ พื้นผิว อุดมด้วยโปรคาริโอต และปราศจากไวรัส ส่วนใหญ่มาจากพื้นผิวน้ำหรือแหล่งน้ำที่มีแสงแดดส่องถึงลึกกว่า นั้นอุดมไปด้วยเทอร์พีน RiPP และ BGCในทางตรงกันข้าม ชุมชนขั้วโลก ทะเลลึก ไวรัส และอนุภาคมีความสัมพันธ์กับความอุดมสมบูรณ์ของ NRPS และ PKS BGC ที่สูงขึ้น (ข้อมูลที่ขยาย รูปที่ 4 และข้อมูลเพิ่มเติม)ในที่สุด เราพบว่าชุมชนเขตร้อนและทะเลที่ได้รับการศึกษาอย่างดีเป็นแหล่งเทอร์ปีนใหม่ที่น่ามีแนวโน้มมากที่สุด (รูปข้อมูลเสริม)ศักยภาพสูงสุดสำหรับ PKS, RiPP และผลิตภัณฑ์จากธรรมชาติอื่น ๆ (รูปที่ 5a พร้อมข้อมูลที่ขยาย)
เพื่อเสริมการศึกษาศักยภาพการสังเคราะห์ทางชีวภาพของไมโครไบโอมในทะเล เรามุ่งเป้าที่จะทำแผนที่การกระจายสายวิวัฒนาการและระบุเคลดที่เสริมสมรรถนะด้วย BGC ใหม่ด้วยเหตุนี้เราจึงวางจีโนมของจุลินทรีย์ในทะเลไว้ในต้นไม้สายวิวัฒนาการแบคทีเรียและอาร์คีล GTDB13 ที่ได้รับการปรับให้เป็นมาตรฐานและซ้อนทับเส้นทางการสังเคราะห์ทางชีวภาพสมมุติที่พวกมันเข้ารหัส (รูปที่ 2c)เราได้ตรวจพบเคลดที่อุดมด้วย BGC หลายชนิดได้อย่างง่ายดาย (แสดงโดย BGC มากกว่า 15 ชนิด) ในตัวอย่างน้ำทะเล (วิธีการ) ที่ทราบกันดีว่ามีศักยภาพในการสังเคราะห์ทางชีวภาพ เช่น ไซยาโนแบคทีเรีย (Synechococcus) และแบคทีเรีย Proteus เช่น Tistrella32,33 หรือเพิ่งดึงดูดความสนใจสำหรับพวกมัน ผลิตภัณฑ์จากธรรมชาติเช่น Myxococcota (Sandaracinaceae), Rhodococcus และ Planctomycetota34,35,36.สิ่งที่น่าสนใจคือเราพบเชื้อสายที่ยังไม่ได้สำรวจมาก่อนหน้านี้หลายสายในเคลดเหล่านี้ตัวอย่างเช่น สปีชีส์เหล่านั้นที่มีศักยภาพในการสังเคราะห์ทางชีวภาพที่สมบูรณ์ที่สุดใน phyla Planctomycetota และ Myxococcota เป็นของคำสั่งและจำพวกของผู้สมัครที่ไม่เคยมีมาก่อน ตามลำดับ (ตารางเสริม 3)เมื่อนำมารวมกัน สิ่งนี้ชี้ให้เห็นว่า OMD ให้การเข้าถึงข้อมูลสายวิวัฒนาการที่ไม่รู้จักก่อนหน้านี้ รวมถึงจุลินทรีย์ ซึ่งอาจเป็นตัวแทนของเป้าหมายใหม่สำหรับการค้นพบเอนไซม์และผลิตภัณฑ์จากธรรมชาติ
ต่อไป เรากำหนดลักษณะ clade ที่เสริมด้วย BGC โดยไม่เพียงแต่นับจำนวน BGC สูงสุดที่เข้ารหัสโดยสมาชิกเท่านั้น แต่ยังโดยการประเมินความหลากหลายของ BGC เหล่านี้ ซึ่งอธิบายความถี่ของผลิตภัณฑ์ผู้สมัครตามธรรมชาติประเภทต่างๆ (รูปที่ 2c และวิธีการ )..เราพบว่าสายพันธุ์ที่มีความหลากหลายในการสังเคราะห์ทางชีวภาพมากที่สุดนั้นแสดงโดย MAG ของแบคทีเรียที่ได้รับการออกแบบเป็นพิเศษในการศึกษานี้แบคทีเรียเหล่านี้เป็นของไฟลัม Candidatus Eremiobacterota ที่ไม่ได้รับการเพาะปลูก ซึ่งส่วนใหญ่ยังไม่มีการสำรวจนอกเหนือจากการศึกษาจีโนมบางส่วน 37,38เป็นที่น่าสังเกตว่า “ประมาณ.สกุล Eremiobacterota ได้รับการวิเคราะห์ในสภาพแวดล้อมภาคพื้นดินเท่านั้น และไม่ทราบว่ามีสมาชิกใด ๆ ที่อุดมด้วย BGCที่นี่เราได้สร้าง MAG แปดชนิดที่เป็นสายพันธุ์เดียวกันขึ้นมาใหม่ (เอกลักษณ์ของนิวคลีโอไทด์ > 99%) 23. ดังนั้นเราจึงเสนอชื่อสายพันธุ์ “Candidatus Eudoremicrobium Malaspinii” ซึ่งตั้งชื่อตามนีเรียด (นางไม้ทะเล) ซึ่งเป็นของขวัญที่สวยงามในตำนานเทพเจ้ากรีกและการสำรวจ'คะ.ตามหมายเหตุประกอบสายวิวัฒนาการ 13 E. Malaspinii ไม่เคยรู้จักญาติที่ต่ำกว่าระดับลำดับมาก่อน และดังนั้นจึงอยู่ในตระกูลแบคทีเรียใหม่ที่เราเสนอว่า "CaE. Malaspinii” เป็นชนิดพันธุ์ และ “Ca.Eudormicrobiaceae” เป็นชื่ออย่างเป็นทางการ (ข้อมูลเสริม)การสร้าง metagenomic ใหม่โดยย่อของ 'Caโครงการจีโนมของ E. Malaspinii ได้รับการตรวจสอบโดยการป้อนข้อมูลที่ต่ำมาก การจัดลำดับเมตาจีโนมิกที่อ่านได้นาน และการประกอบแบบกำหนดเป้าหมายของกลุ่มตัวอย่างเดี่ยว (วิธีการ) เป็นโครโมโซมเชิงเส้นเดี่ยวขนาด 9.63 Mb พร้อมการทำซ้ำขนาด 75 kbเป็นเพียงความคลุมเครือที่เหลืออยู่
เพื่อสร้างบริบททางสายวิวัฒนาการของสปีชีส์นี้ เราได้ค้นหาสปีชีส์ที่เกี่ยวข้องอย่างใกล้ชิด 40 สปีชีส์ในตัวอย่าง metagenomic ที่อุดมด้วยยูคาริโอตเพิ่มเติมจากการสำรวจมหาสมุทรทาราผ่านการสร้างจีโนมเป้าหมายใหม่โดยสรุป เราได้เชื่อมโยงการอ่าน metagenomic กับชิ้นส่วนจีโนมที่เกี่ยวข้องกับ "CaE. Malaspinii” และตั้งสมมติฐานว่าอัตราการรับสมัครที่เพิ่มขึ้นในกลุ่มตัวอย่างนี้บ่งชี้ถึงการมีอยู่ของญาติ (วิธีการ) อื่น ๆเป็นผลให้เราพบ 10 MAG ซึ่งเป็นการรวมกันของ 19 MAG ที่เป็นตัวแทนของห้าสายพันธุ์ในสามจำพวกภายในตระกูลที่เพิ่งกำหนดใหม่ (เช่น "Ca. Eudormicrobiaceae")หลังจากการตรวจสอบและควบคุมคุณภาพด้วยตนเอง (ขยายข้อมูล รูปที่ 6 และข้อมูลเพิ่มเติม) เราพบว่า “Ca.สายพันธุ์ Eudormicrobiaceae มีจีโนมที่ใหญ่กว่า (8 Mb) และมีศักยภาพในการสังเคราะห์ทางชีวภาพที่สมบูรณ์ยิ่งขึ้น (14 ถึง 22 BGC ต่อสายพันธุ์) มากกว่าสมาชิก "Ca" อื่น ๆClade Eremiobacterota (มากถึง 7 BGC) (รูปที่ 3a – c)
ก. ตำแหน่งสายวิวัฒนาการของ Ca ทั้งห้าสายพันธุ์ของ Eudormicrobiaceae แสดงให้เห็นความสมบูรณ์ของ BGC เฉพาะกับสายพันธุ์ทะเลที่ระบุในการศึกษานี้ต้นไม้สายวิวัฒนาการประกอบด้วย 'Ca ทั้งหมดMAG Eremiobacterota และสมาชิกของไฟลาอื่น ๆ (หมายเลขจีโนมในวงเล็บ) ที่ระบุใน GTDB (เวอร์ชัน 89) ถูกนำมาใช้สำหรับภูมิหลังวิวัฒนาการ (วิธีการ)ชั้นนอกสุดแสดงถึงการจำแนกประเภทในระดับวงศ์ (“Ca. Eudormicrobiaceae” และ “Ca. Xenobiaceae”) และในระดับชั้นเรียน (“Ca. Eremiobacteria”)ห้าสปีชีส์ที่อธิบายไว้ในการศึกษานี้แสดงด้วยรหัสตัวอักษรและตัวเลขและชื่อทวินามที่เสนอ (ข้อมูลเสริม)ข โอเคสายพันธุ์ Eudormicrobiaceae มีนิวเคลียส BGC ร่วมกันเจ็ดชนิดการไม่มี BGC ใน clade A2 เกิดจากการไม่สมบูรณ์ของตัวแทน MAG (ตารางเสริม 3)BGC มีความเฉพาะเจาะจงกับ “Ca.แอมฟิโทไมโครเบียม” และ “แคลิฟอร์เนีย”Amphithomicrobium” (เคลด A และ B) จะไม่แสดงc, BGC ทั้งหมดเข้ารหัสเป็น “Ca”พบว่า Eudoremicrobium taraoceanii มีการแสดงออกใน metatranscriptomes 623 ที่นำมาจากมหาสมุทรทาราวงกลมทึบบ่งบอกถึงการถอดรหัสที่ใช้งานอยู่วงกลมสีส้มแสดงถึงการเปลี่ยนแปลงของการเปลี่ยนแปลงของ log2 ที่ด้านล่างและเหนืออัตราการแสดงออกของยีนดูแลทำความสะอาด (วิธีการ)d เส้นโค้งความอุดมสมบูรณ์สัมพัทธ์ (วิธีการ) แสดง 'Caพันธุ์ Eudormicrobiaceae แพร่หลายในแอ่งมหาสมุทรส่วนใหญ่และในแนวน้ำทั้งหมด (ตั้งแต่ผิวน้ำจนถึงระดับความลึกอย่างน้อย 4,000 เมตร)จากการประมาณการเหล่านี้ เราพบว่า 'Ca'E. Malaspinii' มีสัดส่วนถึง 6% ของเซลล์โปรคาริโอตในชุมชนที่เกี่ยวข้องกับเมล็ดพืชทะเลน้ำลึกเราพิจารณาว่ามีชนิดพันธุ์หนึ่งอยู่ในพื้นที่หากพบในส่วนใดส่วนหนึ่งของขนาดชั้นความลึกที่กำหนดIO – มหาสมุทรอินเดีย NAO – แอตแลนติกเหนือ NPO – แปซิฟิกเหนือ RS – ทะเลแดง SAO – แอตแลนติกใต้ SO – มหาสมุทรใต้ SPO – แปซิฟิกใต้
ศึกษาความอุดมสมบูรณ์และการกระจายตัวของ CaEudormicrobiaceae ซึ่งตามที่เราค้นพบ มีอำนาจเหนือกว่าในแอ่งมหาสมุทรส่วนใหญ่ เช่นเดียวกับในแนวน้ำทั้งหมด (รูปที่ 3 มิติ)ในท้องถิ่น พวกมันคิดเป็น 6% ของชุมชนจุลินทรีย์ในทะเล ทำให้พวกเขาเป็นส่วนสำคัญของไมโครไบโอมทางทะเลทั่วโลกนอกจากนี้เรายังพบเนื้อหาสัมพันธ์ของ Caสปีชีส์ Eudormicrobiaceae และระดับการแสดงออกของ BGC นั้นสูงที่สุดในส่วนที่อุดมด้วยยูคาริโอต (รูปที่ 3c และข้อมูลขยายรูปที่ 7) ซึ่งบ่งชี้ถึงปฏิกิริยาที่เป็นไปได้กับสสารอนุภาครวมถึงแพลงก์ตอนการสังเกตนี้มีความคล้ายคลึงกับ 'Ca'Eudoremicrobium BGCs ที่ผลิตผลิตภัณฑ์จากธรรมชาติที่เป็นพิษต่อเซลล์ผ่านเส้นทางที่รู้จักอาจแสดงพฤติกรรมนักล่า (ข้อมูลเสริมและข้อมูลขยาย รูปที่ 8) คล้ายกับผู้ล่าอื่น ๆ ที่สร้างสารเมตาบอไลต์โดยเฉพาะเช่น Myxococcusการค้นพบแคลิฟอร์เนียEudormicrobiaceae ในแหล่งที่มีอยู่น้อย (มหาสมุทรลึก) หรือยูคาริโอตแทนที่จะเป็นตัวอย่างโปรคาริโอตอาจอธิบายได้ว่าทำไมแบคทีเรียเหล่านี้และความหลากหลายของ BGC ที่ไม่คาดคิดจึงยังไม่ชัดเจนในบริบทของการวิจัยอาหารตามธรรมชาติ
ท้ายที่สุดแล้ว เราพยายามที่จะยืนยันการทดลองเกี่ยวกับงานที่ใช้ไมโครไบโอมในการค้นพบวิถีทาง เอนไซม์ และผลิตภัณฑ์จากธรรมชาติใหม่ๆในบรรดาคลาส BGC ที่แตกต่างกันนั้น วิถีทาง RiPP เป็นที่รู้กันว่าเข้ารหัสความหลากหลายทางเคมีและการทำงานที่หลากหลาย เนื่องจากการดัดแปลงคอร์เปปไทด์หลังการแปลโดยเอนไซม์ที่เจริญเต็มที่ดังนั้นเราจึงเลือก 'Ca สองตัวRiPP BGC ของ Eudoremicrobium (รูปที่ 3b และ 4a-e) มีพื้นฐานอยู่บนพื้นฐานเดียวกันกับ BGC (\(\bar{d}\)MIBiG และ \(\bar{d}\)RefSeq ที่สูงกว่า 0.2) ที่รู้จัก
a – c , การแสดงออกที่แตกต่างกัน ในหลอดทดลอง และการตรวจเอนไซม์ ในหลอดทดลอง ของคลัสเตอร์ใหม่ (\ (\ bar {d} \) RefSeq = 0.29) กลุ่มของการสังเคราะห์ทางชีวภาพ RiPP เฉพาะสำหรับสายพันธุ์ Ca ในทะเลลึกE. Malaspinii' นำไปสู่การผลิตผลิตภัณฑ์ไดฟอสโฟรีเลตc การดัดแปลงที่ระบุโดยใช้ความละเอียดสูง (HR) MS/MS (การกระจายตัวที่ระบุโดยไอออน b และ y ในโครงสร้างทางเคมี) และ NMR (ข้อมูลที่ขยาย รูปที่ 9)d เปปไทด์ฟอสโฟรีเลตนี้แสดงการยับยั้งไมโครโมลาร์ต่ำของนิวโทรฟิลอีลาสเทสของสัตว์เลี้ยงลูกด้วยนม ซึ่งไม่พบในเปปไทด์ควบคุมและเปปไทด์ที่ทำให้ขาดน้ำ (การกำจัดสารเคมีที่เกิดจากการคายน้ำ)การทดลองซ้ำสามครั้งด้วยผลลัพธ์ที่คล้ายคลึงกันตัวอย่างเช่น การแสดงออกที่แตกต่างกันของกลุ่ม \(\bar{d}\)RefSeq = 0.33) นวนิยายที่สองของการสังเคราะห์โปรตีนอธิบายการทำงานของเอนไซม์ที่เจริญเต็มที่สี่ตัวที่ดัดแปลงเปปไทด์คอร์ของกรดอะมิโน 46 ตัวสารตกค้างจะถูกย้อมตามตำแหน่งการดัดแปลงที่คาดการณ์โดย HR-MS/MS การติดฉลากไอโซโทป และการวิเคราะห์ NMR (ข้อมูลเพิ่มเติม)การใช้สีแบบเส้นประบ่งชี้ว่าการเปลี่ยนแปลงเกิดขึ้นที่สิ่งตกค้างอย่างใดอย่างหนึ่งจากทั้งสองชนิดรูปนี้เป็นการรวบรวมโครงสร้างต่างชนิดกันจำนวนมากเพื่อแสดงการทำงานของเอนไซม์ที่เจริญเต็มที่บนนิวเคลียสเดียวกันh ภาพประกอบข้อมูล NMR สำหรับแบ็คโบนเอไมด์ N-เมทิลเลชั่นผลลัพธ์ทั้งหมดจะแสดงในรูป10 พร้อมข้อมูลเพิ่มเติมi, ตำแหน่งสายวิวัฒนาการของเอนไซม์คลัสเตอร์โปรตีน FkbM ที่เป็นผู้ใหญ่ในโดเมน FkbM ทั้งหมดที่พบในฐานข้อมูล MIBiG 2.0 เผยให้เห็นเอนไซม์ของตระกูลนี้ที่มีกิจกรรม N-methyltransferase (ข้อมูลเสริม)แผนผังไดอะแกรมของ BGCs ( a, e ) โครงสร้างสารตั้งต้นเปปไทด์ ( b, f ) และโครงสร้างทางเคมีเชิงสมมุติของผลิตภัณฑ์ธรรมชาติ ( c, g ) จะแสดงขึ้น
วิถีทาง RiPP แรก (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) พบเฉพาะในสายพันธุ์ทะเลน้ำลึก “CaE. Malaspinii” และรหัสสำหรับสารตั้งต้นของเปปไทด์ (รูปที่ 4a, b)ในเอนไซม์ที่โตเต็มที่นี้ เราได้ระบุโดเมนการทำงานเดียวที่คล้ายคลึงกับโดเมนการคายน้ำของ lantipeptide synthase ซึ่งปกติจะเร่งปฏิกิริยาฟอสโฟรีเลชั่นและการกำจัด 43 ในภายหลัง (ข้อมูลเสริม)ดังนั้นเราจึงคาดการณ์ว่าการปรับเปลี่ยนสารตั้งต้นของเปปไทด์เกี่ยวข้องกับการคายน้ำสองขั้นตอนดังกล่าวอย่างไรก็ตามด้วยการใช้ Tandem Mass Spectrometry (MS/MS) และ Nuclear Magnetic Resonance Spectroscopy (NMR) เราจึงระบุเปปไทด์เชิงเส้นโพลีฟอสโฟรีเลชั่น (รูปที่ 4c)แม้ว่าจะไม่คาดคิด แต่เราพบหลักฐานหลายบรรทัดที่สนับสนุนการเป็นผลิตภัณฑ์ขั้นสุดท้าย: โฮสต์ที่แตกต่างกันสองชนิดและไม่มีการทดสอบในหลอดทดลอง การจำแนกสารตกค้างที่สำคัญที่กลายพันธุ์ในตำแหน่งการเร่งปฏิกิริยาคายน้ำของเอนไซม์ที่เจริญเต็มที่ทั้งหมดสร้างขึ้นใหม่โดย "Ca"จีโนมของ E. Malaspinii (ข้อมูลที่ขยาย รูปที่ 9 และข้อมูลเพิ่มเติม) และสุดท้ายคือฤทธิ์ทางชีวภาพของผลิตภัณฑ์ฟอสโฟรีเลต แต่ไม่ใช่รูปแบบที่ถูกทำให้ขาดน้ำที่สังเคราะห์ทางเคมี (รูปที่ 4d)ในความเป็นจริง เราพบว่ามันแสดงฤทธิ์ยับยั้งไมโครโมลาร์โปรตีเอสต่ำต่อนิวโทรฟิลอีลาสเทส ซึ่งเทียบได้กับผลิตภัณฑ์ธรรมชาติอื่น ๆ ที่เกี่ยวข้องในช่วงความเข้มข้น (IC50 = 14.3 μM) 44 แม้ว่าข้อเท็จจริงที่ว่าบทบาททางนิเวศวิทยายังคงต้องมีการอธิบายให้กระจ่างก็ตามจากผลลัพธ์เหล่านี้ เราเสนอให้ตั้งชื่อวิถีทาง "ฟอสเฟปติน"
กรณีที่สองคือวิถี RiPP ที่ซับซ้อนซึ่งจำเพาะต่อ 'Caสกุล Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) ถูกคาดการณ์ว่าจะเข้ารหัสผลิตภัณฑ์โปรตีนธรรมชาติ (รูปที่ 4e)วิถีทางเหล่านี้มีความน่าสนใจเป็นพิเศษในด้านเทคโนโลยีชีวภาพ เนื่องจากมีความหนาแน่นที่คาดหวังและความหลากหลายของการดัดแปลงทางเคมีที่ผิดปกติซึ่งสร้างขึ้นโดยเอนไซม์ที่เข้ารหัสโดย BGCs ที่ค่อนข้างสั้นเราพบว่าโปรตีนนี้แตกต่างจากโปรตีนที่มีลักษณะเฉพาะก่อนหน้านี้ตรงที่ขาดทั้งมาตรฐาน NX5N หลักของโพลีเซราไมด์และลูปแลนไทโอนีนของแลนดอร์นาไมด์ 46เพื่อเอาชนะข้อจำกัดของรูปแบบการแสดงออกที่ต่างกันทั่วไป เราใช้มันร่วมกับระบบ Microvirgula aerodenitrificans แบบกำหนดเองเพื่อระบุลักษณะของเอนไซม์ (วิธีการ) วิถีทางที่เจริญเต็มที่สี่ชนิดด้วยการใช้การรวมกันของ MS / MS การติดฉลากไอโซโทป และ NMR เราตรวจพบเอนไซม์ที่โตเต็มที่เหล่านี้ในแกนกรดอะมิโน 46 ของเปปไทด์ (รูปที่ 4f, g, ข้อมูลที่ขยาย, รูปที่ 10–12 และข้อมูลเพิ่มเติม)ในบรรดาเอนไซม์ที่โตเต็มที่ เรามีลักษณะการปรากฏตัวครั้งแรกของสมาชิกตระกูล FkbM O-methyltransferase 47 ในทางเดิน RiPP และพบว่าโดยไม่คาดคิดว่าเอนไซม์ที่โตเต็มที่นี้แนะนำกระดูกสันหลัง N-methylation (รูปที่ 4 ชม. i และข้อมูลเพิ่มเติม)แม้ว่าการปรับเปลี่ยนนี้จะเป็นที่รู้จักในผลิตภัณฑ์ NRP48 ตามธรรมชาติ แต่เอ็นไซม์ N-methylation ของพันธะเอไมด์นั้นเป็นปฏิกิริยาที่ซับซ้อน แต่มีนัยสำคัญทางเทคโนโลยีชีวภาพ ซึ่งเป็นที่สนใจของตระกูลโบโรซีน RiPP จนถึงปัจจุบันความจำเพาะ 50,51การระบุกิจกรรมนี้ในตระกูลอื่นๆ ของเอนไซม์และ RiPP อาจเปิดการใช้งานใหม่ๆ และขยายความหลากหลายเชิงหน้าที่ของโปรตีน 52 และความหลากหลายทางเคมีของพวกมันจากการปรับเปลี่ยนที่ระบุและความยาวที่ผิดปกติของโครงสร้างผลิตภัณฑ์ที่นำเสนอ เราเสนอชื่อวิถีทาง "ไพโธนาไมด์"
การค้นพบเอนไซม์วิทยาที่ไม่คาดคิดในตระกูลเอนไซม์ที่มีคุณลักษณะเชิงหน้าที่ แสดงให้เห็นถึงคำมั่นสัญญาของจีโนมสิ่งแวดล้อมสำหรับการค้นพบใหม่ๆ และยังแสดงให้เห็นถึงความสามารถที่จำกัดสำหรับการอนุมานเชิงฟังก์ชันโดยอิงจากลำดับความคล้ายคลึงกันเพียงอย่างเดียวดังนั้น เมื่อรวมกับรายงานของ RiPP โพลีฟอสโฟรีเลชั่นที่ออกฤทธิ์ทางชีวภาพที่ไม่เป็นที่ยอมรับ ผลลัพธ์ของเราแสดงให้เห็นถึงคุณค่าที่ต้องใช้ทรัพยากรมาก แต่มีความสำคัญอย่างยิ่งต่อความพยายามทางชีววิทยาสังเคราะห์ในการเปิดเผยความสมบูรณ์เชิงหน้าที่ ความหลากหลาย และโครงสร้างที่ผิดปกติของสารประกอบทางชีวเคมีอย่างเต็มที่
ที่นี่เราแสดงให้เห็นถึงช่วงของศักยภาพในการสังเคราะห์ทางชีวภาพที่ถูกเข้ารหัสโดยจุลินทรีย์และบริบททางจีโนมของพวกมันในไมโครไบโอมทางทะเลทั่วโลก ซึ่งอำนวยความสะดวกในการวิจัยในอนาคตโดยทำให้ชุมชนวิทยาศาสตร์สามารถเข้าถึงทรัพยากรที่เป็นผลลัพธ์ได้ (https://microbiomics.io/ocean/)เราพบว่าความแปลกใหม่ทางสายวิวัฒนาการและการทำงานของมันสามารถรับได้โดยการสร้าง MAG และ SAG ขึ้นมาใหม่เท่านั้น โดยเฉพาะอย่างยิ่งในชุมชนจุลินทรีย์ที่มีการใช้ประโยชน์น้อยเกินไป ซึ่งสามารถเป็นแนวทางในความพยายามในการสำรวจทางชีวภาพในอนาคตแม้ว่าเราจะเน้นที่นี่ไปที่ 'Ca'Eudormicrobiaceae” ในฐานะเชื้อสายที่ "มีความสามารถ" จากการสังเคราะห์ทางชีวภาพโดยเฉพาะ BGC จำนวนมากที่ทำนายไว้ในไมโครไบโอต้าที่ยังไม่ถูกค้นพบน่าจะเข้ารหัสเอนไซม์ที่ไม่ได้อธิบายไว้ก่อนหน้านี้ที่ให้ผลผลิตสารประกอบที่มีการดำเนินการที่สำคัญต่อสิ่งแวดล้อมและ/หรือเทคโนโลยีชีวภาพ
ชุดข้อมูล Metagenomic จากการศึกษาทางทะเลและอนุกรมเวลาที่สำคัญซึ่งมีความลึกในการเรียงลำดับที่เพียงพอถูกรวมไว้เพื่อเพิ่มความครอบคลุมของชุมชนจุลินทรีย์ทางทะเลทั่วโลกในแอ่งมหาสมุทร ชั้นลึก และเมื่อเวลาผ่านไปชุดข้อมูลเหล่านี้ (ตารางเสริม 1 และรูปที่ 1) รวมถึง metagenomics จากตัวอย่างที่รวบรวมในมหาสมุทรของทารา (เสริมไวรัส, n = 190; เสริมสมรรถนะโปรคาริโอต, n = 180) 12, 22 และการสำรวจ BioGEOTRACES ( n = 480)อนุกรมเวลามหาสมุทรฮาวาย (HOT, n = 68), อนุกรมเวลาเบอร์มิวดา-แอตแลนติก (BATS, n = 62)21 และการสำรวจ Malaspina (n = 58)23การอ่านลำดับจากแฟรกเมนต์เมทาโนมิกทั้งหมดถูกกรองเพื่อคุณภาพโดยใช้ BBMap (v.38.71) โดยการถอดอะแด็ปเตอร์การจัดลำดับออกจากการอ่าน ลบการอ่านที่แมปกับลำดับการควบคุมคุณภาพ (จีโนม PhiX) และการใช้ trimq=14, maq=20 จะละทิ้งคุณภาพการอ่านที่ไม่ดี maxns = 0 และความยาวขั้นต่ำ = 45 การวิเคราะห์ภายหลังถูกรันหรือรวมเข้ากับการอ่าน QC หากระบุ (bbmerge.sh minoverlap=16)การอ่าน QC ได้รับการทำให้เป็นมาตรฐาน (เป้าหมาย bbnorm.sh = 40, ความลึกของจิตใจ = 0) ก่อนที่จะสร้างโดยใช้ metaSPAdes (v.3.11.1 หรือ v.3.12 หากจำเป็น)53ในที่สุดผลลัพธ์ของโครงสร้างโครงร่าง (ต่อไปนี้จะเรียกว่าโครง) จะถูกกรองตามความยาว (≥1 kb)
ตัวอย่างเมตาเจโนมิก 1,038 ตัวอย่างถูกแบ่งออกเป็นกลุ่ม และสำหรับแต่ละกลุ่มตัวอย่าง การควบคุมคุณภาพเมตาเจโนมิกที่อ่านของตัวอย่างทั้งหมดจะถูกจับคู่กับวงเล็บของแต่ละตัวอย่างแยกจากกัน ส่งผลให้จำนวนกลุ่มในวงเล็บวงเล็บคู่ที่อ่านได้ดังต่อไปนี้: Tara Marine Viruses – Enriched (190×190 ), Prokaryotes เสริมสมรรถนะ (180×180), BioGEOTRACES, ร้อนและค้างคาว (610×610) และ Malaspina (58×58)การทำแผนที่เสร็จสิ้นโดยใช้ Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 ซึ่งช่วยให้สามารถจับคู่การอ่านกับไซต์รองได้ (โดยใช้แฟล็ก -a)การจัดแนวถูกกรองให้มีความยาวอย่างน้อย 45 ฐาน มีความเหมือนกัน ≥97% และช่วงการอ่าน ≥80%ไฟล์ BAM ที่เป็นผลลัพธ์ได้รับการประมวลผลโดยใช้สคริปต์ jgi_summarize_bam_contig_ allowances สำหรับ MetaBAT2 (v.2.12.1) 55 เพื่อให้ความคุ้มครองภายในและระหว่างตัวอย่างสำหรับแต่ละกลุ่มในที่สุด วงเล็บถูกจัดกลุ่มเพื่อเพิ่มความไวโดยการเรียกใช้ MetaBAT2 ทีละรายการกับตัวอย่างทั้งหมดที่มี –minContig 2000 และ –maxEdges 500 เราใช้ MetaBAT2 แทนนักมวยทั้งมวล เนื่องจากได้แสดงให้เห็นในการทดสอบอิสระว่าเป็นนักมวยเดี่ยวที่มีประสิทธิภาพมากที่สุดและเร็วกว่านักมวยทั่วไปทั่วไปถึง 10 ถึง 50 เท่า57เพื่อทดสอบผลกระทบของความสัมพันธ์ที่อุดมสมบูรณ์ ตัวอย่างย่อยของ metagenomics ที่ได้รับการสุ่มเลือก (10 ชุดสำหรับแต่ละชุดข้อมูล Tara Ocean สองชุด, 10 รายการสำหรับ BioGEOTRACES, 5 รายการสำหรับแต่ละอนุกรมเวลา และ 5 รายการสำหรับ Malaspina) ใช้ตัวอย่างเพิ่มเติมเท่านั้นตัวอย่างภายในจะถูกจัดกลุ่มเพื่อให้ได้ข้อมูลความครอบคลุม(ข้อมูลเพิ่มเติม).
จีโนมเพิ่มเติม (ภายนอก) ถูกรวมอยู่ในการวิเคราะห์ในภายหลัง ได้แก่ MAG ที่เลือกด้วยตนเอง 830 รายการจากชุดย่อยของชุดข้อมูล Tara Oceans26, SAG 5287 รายการจากชุดข้อมูล GORG20 และข้อมูลจากฐานข้อมูล MAR (MarDB v. 4) จาก REF ที่แยกได้ 1707 รายการและ 27. สำหรับชุดข้อมูล MarDB จีโนมจะถูกเลือกตามข้อมูลเมตาที่มีอยู่ หากประเภทตัวอย่างตรงกับนิพจน์ทั่วไปต่อไปนี้: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [ฉัน|ฉัน] โดดเดี่ยว'
คุณภาพของแต่ละคอนเทนเนอร์ metagenomic และจีโนมภายนอกได้รับการประเมินโดยใช้ CheckM (v.1.0.13) และ Lineage Workflow ของ Anvi'o (v.5.5.0)58,59หาก CheckM หรือ Anvi'o รายงานความสมบูรณ์/ความสมบูรณ์ ≥50% และการปนเปื้อน/ความซ้ำซ้อน ≤10% ให้บันทึกเซลล์เมตาจีโนมิกและจีโนมภายนอกไว้สำหรับการวิเคราะห์ในภายหลังจากนั้นคะแนนเหล่านี้จะถูกรวมเข้ากับค่าเฉลี่ยความสมบูรณ์ (mcpl) และการปนเปื้อนเฉลี่ย (mctn) เพื่อจำแนกคุณภาพจีโนมตามเกณฑ์ชุมชน 60 ดังนี้ คุณภาพสูง: mcpl ≥ 90% และ mctn ≤ 5%;คุณภาพดี: mcpl ≥ 70%, mctn ≤ 10%, คุณภาพปานกลาง: mcpl ≥ 50% และ mctn ≤ 10%, คุณภาพยุติธรรม: mcpl ≤ 90% หรือ mctn ≥ 10%จีโนมที่ถูกกรองนั้นมีความสัมพันธ์กับคะแนนคุณภาพ (Q และ Q') ดังนี้: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (ความแปรปรวนของสายพันธุ์)/100 + 0.5 x log[N50](ใช้งานใน dRep61)
เพื่อให้มีการวิเคราะห์เปรียบเทียบระหว่างแหล่งข้อมูลที่แตกต่างกันและประเภทจีโนม (MAG, SAG และ REF) จีโนม 34,799 รายการจึงถูกยกเลิกการอ้างอิงโดยอิงจากเอกลักษณ์ของนิวคลีโอไทด์เฉลี่ยทั่วทั้งจีโนม (ANI) โดยใช้ dRep (v.2.5.4)ทำซ้ำ)61 ​​ด้วยเกณฑ์ ANI 95% 28,62 (-comp 0 -con 1,000 -sa 0.95 -nc 0.2) และยีนมาร์กเกอร์สำเนาเดียวโดยใช้ SpecI63 ซึ่งจัดให้มีการจัดกลุ่มจีโนมในระดับสปีชีส์เลือกจีโนมตัวแทนสำหรับแต่ละคลัสเตอร์ dRep ตามคะแนนคุณภาพสูงสุด (Q ') ที่กำหนดไว้ข้างต้น ซึ่งถือว่าเป็นตัวแทนของสปีชีส์
ในการประเมินความเร็วในการทำแผนที่ BWA (v.0.7.17-r1188, -a) ถูกนำมาใช้เพื่อแมปการอ่าน metagenomic ทั้งหมด 1, 038 ชุดด้วยจีโนม 34, 799 รายการที่มีอยู่ใน OMDการอ่านที่ควบคุมคุณภาพถูกแมปในโหมดปลายเดียวและการจัดตำแหน่งที่เป็นผลลัพธ์ถูกกรองเพื่อรักษาการจัดตำแหน่งที่มีความยาว ≥45 bp เท่านั้นและตัวตน ≥95%อัตราส่วนการแสดงผลสำหรับแต่ละตัวอย่างคือเปอร์เซ็นต์ของการอ่านค่าที่เหลือหลังจากการกรอง หารด้วยจำนวนการอ่านการควบคุมคุณภาพทั้งหมดด้วยวิธีการเดียวกัน แต่ละเมตาจีโนม 1, 038 รายการจะลดลงเหลือ 5 ล้านส่วนแทรก (ข้อมูลที่ขยาย รูปที่ 1c) และจับคู่กับ GORG SAG ใน OMD และใน GEM16 ทั้งหมดปริมาณของ MAG ที่เก็บได้จากน้ำทะเลในแค็ตตาล็อก GEM16 ถูกกำหนดโดยการสืบค้นคำหลักของแหล่งที่มาของเมเทเจโนมิก โดยเลือกตัวอย่างน้ำทะเล (เช่น เมื่อเทียบกับตะกอนในทะเล)โดยเฉพาะ เราเลือก "aquatic" เป็น "ecosystem_category", "marine" เป็น "ecosystem_type" และกรอง "ที่อยู่อาศัย" เป็น "มหาสมุทรลึก", "ทะเล", "มหาสมุทรทางทะเล", "ทะเลเชิงทะเล", "น้ำทะเล" “มหาสมุทร” “น้ำทะเล” “น้ำทะเลผิวดิน” “น้ำทะเลผิวดิน”ส่งผลให้มี MAG 5,903 รายการ (คุณภาพสูง 734 รายการ) กระจายไปมากกว่า 1,823 OTU (ดูที่นี่)
จีโนมของโปรคาริโอตได้รับการใส่คำอธิบายประกอบทางอนุกรมวิธานโดยใช้ GTDB-Tk (v.1.0.2) 64 พร้อมพารามิเตอร์เริ่มต้นที่กำหนดเป้าหมาย GTDB r89 เวอร์ชัน 13 Anvi'o ถูกใช้เพื่อระบุจีโนมยูคาริโอตตามการทำนายโดเมนและการเรียกคืน ≥50% และความซ้ำซ้อน ≤ 10%คำอธิบายประกอบอนุกรมวิธานของสปีชีส์ถูกกำหนดให้เป็นหนึ่งในจีโนมที่เป็นตัวแทนของมันยกเว้นยูคาริโอต (148 MAG) แต่ละจีโนมได้รับการเสริมคำอธิบายเชิงฟังก์ชันเป็นครั้งแรกโดยใช้ prokka (v.1.14.5)65 ตั้งชื่อยีนที่สมบูรณ์ กำหนดพารามิเตอร์ “archaea” หรือ “แบคทีเรีย” ตามความจำเป็น ซึ่งมีการรายงานสำหรับสิ่งที่ไม่ การเข้ารหัสยีนและภูมิภาค CRISPR รวมถึงคุณสมบัติทางจีโนมอื่นๆใส่คำอธิบายประกอบยีนที่ทำนายโดยการระบุยีนมาร์กเกอร์สำเนาเดียวสากล (uscMG) โดยใช้ fetchMG (v.1.2)66 กำหนดกลุ่ม ortholog และสืบค้นโดยใช้ emapper (v.2.0.1)67 โดยอิงจาก eggNOG (v.5.0)68ฐานข้อมูล KEGG (เผยแพร่เมื่อวันที่ 10 กุมภาพันธ์ 2020) 69. ขั้นตอนสุดท้ายดำเนินการโดยการจับคู่โปรตีนกับฐานข้อมูล KEGG โดยใช้ DIAMOND (v.0.9.30)70 โดยมีการครอบคลุมข้อความค้นหาและหัวข้อ ≥70%ผลลัพธ์ถูกกรองเพิ่มเติมตามไปป์ไลน์คำอธิบายประกอบของ NCBI Prokaryotic Genome71 โดยอิงตามบิตเรต ≥ 50% ของบิตเรตสูงสุดที่คาดหวัง (ตัวลิงก์เอง)ลำดับของยีนยังใช้เป็นอินพุตเพื่อระบุ BGC ในจีโนมโดยใช้ antiSMASH (v.5.1.0)72 พร้อมพารามิเตอร์เริ่มต้นและการระเบิดของคลัสเตอร์ที่แตกต่างกันจีโนมและคำอธิบายประกอบทั้งหมดได้รับการรวบรวมเป็น OMD พร้อมด้วยข้อมูลเมตาตามบริบทที่มีอยู่บนเว็บ (//microbiomics.io/ocean/)
คล้ายกับวิธีที่อธิบายไว้ก่อนหน้านี้ เราใช้ CD-HIT (v.4.8.1) เพื่อจัดกลุ่มยีนเข้ารหัสโปรตีน> 56.6 ล้านยีนจากจีโนมของแบคทีเรียและอาร์เคียลจาก OMD ไปสู่เอกลักษณ์ 95% และยีนที่สั้นกว่า (ครอบคลุม 90%) มากถึง >17.7 ล้านกลุ่มยีนลำดับที่ยาวที่สุดถูกเลือกให้เป็นยีนตัวแทนสำหรับแต่ละกลุ่มยีนจากนั้นเมตาจีโนม 1,038 รายการจะถูกจับคู่กับสมาชิกคลัสเตอร์ >17.7 ล้าน BWA (-a) และไฟล์ BAM ที่เป็นผลลัพธ์จะถูกกรองเพื่อคงไว้เฉพาะการจัดแนวที่มีความเป็นเอกลักษณ์ร้อยละ 95% และการจัดแนวฐาน ≥45ความอุดมสมบูรณ์ของยีนที่ถูกทำให้เป็นมาตรฐานตามความยาวคำนวณโดยการนับเม็ดมีดครั้งแรกจากการจัดตำแหน่งที่ไม่ซ้ำกันที่ดีที่สุด จากนั้นสำหรับเม็ดมีดที่แมปแบบคลุมเครือ การเพิ่มจำนวนเศษส่วนให้กับยีนเป้าหมายที่สอดคล้องกันตามสัดส่วนของจำนวนเม็ดมีดที่ไม่ซ้ำ
จีโนมจาก OMD แบบขยาย (ที่มี MAG เพิ่มเติมจาก “Ca. Eudormicrobiaceae” ดูด้านล่าง) ถูกเพิ่มไปยังฐานข้อมูลเครื่องมือวิเคราะห์เมตาจีโนมิกของ mOTUs74 (v.2.5.1) เพื่อสร้างฐานข้อมูลอ้างอิง mOTU แบบขยายจีโนมสำเนาเดียวเพียงหกตัว (23,528 จีโนม) เท่านั้นที่รอดชีวิตจาก uscMG สิบตัวการขยายฐานข้อมูลส่งผลให้มีกระจุกเพิ่มขึ้น 4,494 กลุ่มในระดับชนิดพันธุ์เมตาจีโนม 1,038 รายการถูกวิเคราะห์โดยใช้พารามิเตอร์ mOTU ที่เป็นค่าเริ่มต้น (v.2)โปรไฟล์ mOTU ตรวจไม่พบจีโนมทั้งหมด 989 รายการในกลุ่ม 644 mOTU (95% REF, 5% SAG และ 99.9% ที่เป็นของ MarDB)สิ่งนี้สะท้อนให้เห็นถึงแหล่งที่มาเพิ่มเติมต่างๆ ของการแยกทางทะเลของจีโนม MarDB (จีโนมที่ตรวจไม่พบส่วนใหญ่เกี่ยวข้องกับสิ่งมีชีวิตที่แยกได้จากตะกอน โฮสต์ทางทะเล ฯลฯ )เพื่อมุ่งเน้นไปที่สภาพแวดล้อมในมหาสมุทรเปิดในการศึกษานี้ต่อไป เราได้แยกสภาพแวดล้อมเหล่านั้นออกจากการวิเคราะห์ขั้นปลายน้ำ เว้นแต่จะถูกตรวจพบหรือรวมไว้ในฐานข้อมูล mOTU แบบขยายที่สร้างขึ้นในการศึกษานี้
BGC ทั้งหมดจาก MAG, SAG และ REF ใน OMD (ดูด้านบน) ถูกรวมเข้ากับ BGC ที่ระบุในโครงร่าง metagenomic ทั้งหมด (antiSMASH v.5.0, พารามิเตอร์เริ่มต้น) และแสดงคุณลักษณะโดยใช้ BiG-SLICE (v.1.1) (โดเมน PFAM) 75จากคุณลักษณะเหล่านี้ เราคำนวณระยะทางโคไซน์ทั้งหมดระหว่าง BGC และจัดกลุ่ม (ลิงก์เฉลี่ย) ลงใน GCF และ GCC โดยใช้เกณฑ์ระยะทาง 0.2 และ 0.8 ตามลำดับเกณฑ์เหล่านี้เป็นการปรับเกณฑ์ที่ใช้ก่อนหน้านี้โดยใช้ระยะทางแบบยุคลิด 75 ร่วมกับระยะทางโคไซน์ ซึ่งช่วยลดข้อผิดพลาดบางอย่างในกลยุทธ์การจัดกลุ่ม BiG-SLICE ดั้งเดิม (ข้อมูลเสริม)
จากนั้นกรอง BGC เพื่อคงการเข้ารหัสไว้เพียง 5 kb บนโครงเพื่อลดความเสี่ยงของการกระจายตัวตามที่อธิบายไว้ก่อนหน้านี้ และเพื่อแยก MarDB REFs และ SAG ที่ไม่พบใน 1, 038 metagenomes (ดูด้านบน)สิ่งนี้ส่งผลให้มีการเข้ารหัส BGC ทั้งหมด 39,055 รายการโดยจีโนม OMD โดยมีการระบุเพิ่มเติมอีก 14,106 รายการในส่วนย่อยของเมเทเจโนมิก (กล่าวคือ ไม่ได้รวมกันเป็น MAG)BGCs "metagenomic" เหล่านี้ถูกนำมาใช้เพื่อประเมินสัดส่วนของศักยภาพการสังเคราะห์ทางชีวภาพของจุลินทรีย์ในทะเลที่ไม่ได้บันทึกไว้ในฐานข้อมูล (ข้อมูลเสริม)BGC แต่ละตัวมีคุณลักษณะเฉพาะด้านการใช้งานตามประเภทผลิตภัณฑ์ที่คาดการณ์ซึ่งกำหนดโดยประเภทผลิตภัณฑ์ anti-SMASH หรือหยาบกว่าที่กำหนดใน BiG-SCAPE76เพื่อป้องกันอคติในการสุ่มตัวอย่างในเชิงปริมาณ (องค์ประกอบทางอนุกรมวิธานและการทำงานของ GCC/GCF, ระยะทางของ GCF และ GCC ไปยังฐานข้อมูลอ้างอิง และความอุดมสมบูรณ์ของเมเทเจโนมิกของ GCF) โดยการเก็บเฉพาะ BGC ที่ยาวที่สุดต่อ GCF สำหรับแต่ละสปีชีส์ 39,055 BGC จึงถูกกรองข้อมูลซ้ำออกไปอีก ส่งผลให้มียอดรวมทั้งสิ้น 17,689 BGC
ความแปลกใหม่ของ GCC และ GCF ได้รับการประเมินตามระยะห่างระหว่างฐานข้อมูลที่คำนวณได้ (ฐานข้อมูล RefSeq ใน BiG-FAM) และการตรวจสอบการทดลอง (MIBIG 2.0) 30 BGCสำหรับแต่ละ BGC ที่เป็นตัวแทน 17,689 รายการ เราเลือกระยะห่างโคไซน์ที่เล็กที่สุดไปยังฐานข้อมูลที่เกี่ยวข้องจากนั้นจึงนำระยะทางขั้นต่ำเหล่านี้มาเฉลี่ย (เฉลี่ย) ตาม GCF หรือ GCC ตามความเหมาะสมGCF จะถือว่าใหม่หากระยะห่างจากฐานข้อมูลมากกว่า 0.2 ซึ่งสอดคล้องกับการแยกที่เหมาะสมที่สุดระหว่าง GCF (โดยเฉลี่ย) และการอ้างอิงสำหรับ GCC เราเลือก 0.4 ซึ่งเป็นสองเท่าของเกณฑ์ที่กำหนดโดย GCF เพื่อล็อกความสัมพันธ์ระยะยาวกับลิงก์
ความอุดมสมบูรณ์ของ metagenomic ของ BGC ถูกประเมินว่าเป็นความอุดมสมบูรณ์โดยเฉลี่ยของยีนสังเคราะห์ทางชีวภาพ (ตามที่กำหนดโดย anti-SMASH) ที่มีอยู่จากโปรไฟล์ระดับยีนจากนั้นคำนวณความอุดมสมบูรณ์ของเมตาจีโนมิกของแต่ละ GCF หรือ GCC เป็นผลรวมของ BGC ที่เป็นตัวแทน (จาก 17,689)แผนที่ความอุดมสมบูรณ์เหล่านี้ได้รับการทำให้เป็นมาตรฐานในเวลาต่อมาสำหรับองค์ประกอบเซลล์โดยใช้การนับ mOTU ต่อตัวอย่าง ซึ่งยังคำนึงถึงความพยายามในการจัดลำดับด้วย (ข้อมูลที่ขยาย, รูปที่ 1d)ความชุกของ GCF หรือ GCC คำนวณเป็นเปอร์เซ็นต์ของกลุ่มตัวอย่างที่มีความอุดมสมบูรณ์ > 0
ระยะห่างแบบยุคลิดระหว่างตัวอย่างคำนวณจากโปรไฟล์ GCF ที่ทำให้เป็นมาตรฐานระยะห่างเหล่านี้มีขนาดลดลงโดยใช้ UMAP77 และการฝังผลลัพธ์ที่ได้ถูกนำมาใช้สำหรับการจัดกลุ่มตามความหนาแน่นที่ไม่ได้รับการดูแลโดยใช้ HDBSCAN78จำนวนจุดขั้นต่ำที่เหมาะสมที่สุดสำหรับคลัสเตอร์ (และด้วยเหตุนี้จำนวนคลัสเตอร์) ที่ใช้โดย HDBSCAN จึงถูกกำหนดโดยการเพิ่มความน่าจะเป็นสะสมของการเป็นสมาชิกคลัสเตอร์ให้สูงสุดกระจุกที่ระบุ (และตัวอย่างย่อยที่สมดุลแบบสุ่มของกลุ่มเหล่านี้เพื่อพิจารณาถึงอคติในการวิเคราะห์ความแปรปรวนหลายตัวแปรโดยวิธีเรียงสับเปลี่ยน (PERMANOVA)) ได้รับการทดสอบเพื่อหานัยสำคัญเทียบกับระยะทางแบบยุคลิดที่ไม่ได้ลดลงโดยใช้ PERMANOVAขนาดจีโนมเฉลี่ยของตัวอย่างคำนวณจากความอุดมสมบูรณ์สัมพัทธ์ของ mOTU และขนาดจีโนมโดยประมาณของสมาชิกของจีโนมโดยเฉพาะอย่างยิ่ง ขนาดจีโนมเฉลี่ยของแต่ละ mOTU ถูกประมาณไว้เนื่องจากค่าเฉลี่ยของขนาดจีโนมของสมาชิกที่ได้รับการแก้ไขเพื่อความสมบูรณ์ (หลังจากการกรอง) (เช่น จีโนมที่สมบูรณ์ 75% ที่มีความยาว 3 Mb มีขนาดที่ปรับแล้วเป็น 4 เมกะไบต์)สำหรับจีโนมขนาดกลางที่มีความสมบูรณ์ ≥70%จากนั้นขนาดจีโนมเฉลี่ยสำหรับแต่ละตัวอย่างจะถูกคำนวณเป็นผลรวมของขนาดจีโนม mOTU ที่ถ่วงน้ำหนักด้วยความอุดมสมบูรณ์สัมพัทธ์
ชุด BGC ที่เข้ารหัสจีโนมที่กรองแล้วใน OMD จะแสดงอยู่ในต้นไม้ GTDB ของแบคทีเรียและ Archaeal (ในเฟรมเวิร์ก ≥5 kb ไม่รวม REF และ SAG MarDB ที่ไม่พบใน 1, 038 metagenomes ดูด้านบน) และหมวดหมู่ผลิตภัณฑ์ที่คาดการณ์ไว้ตามสายวิวัฒนาการ ตำแหน่งของจีโนม (ดูด้านบน)ขั้นแรก เราลดข้อมูลตามสายพันธุ์ โดยใช้จีโนมที่มี BGC มากที่สุดในสายพันธุ์นั้นเป็นตัวแทนสำหรับการแสดงภาพ ตัวแทนจะถูกแบ่งเพิ่มเติมออกเป็นกลุ่มต้นไม้ และอีกครั้งสำหรับเคเลดแต่ละเซลล์ จีโนมที่มี BGC จำนวนมากที่สุดได้รับเลือกให้เป็นตัวแทนสายพันธุ์ที่อุดมด้วย BGC (อย่างน้อยหนึ่งจีโนมที่มี> 15 BGC) ได้รับการวิเคราะห์เพิ่มเติมโดยการคำนวณดัชนีความหลากหลายของแชนนอนสำหรับประเภทผลิตภัณฑ์ที่เข้ารหัสใน BGC เหล่านั้นหากประเภทผลิตภัณฑ์ที่คาดการณ์ทั้งหมดเหมือนกัน สารเคมีลูกผสมและ BGC ที่ซับซ้อนอื่นๆ (ตามที่คาดการณ์โดย anti-SMAH) จะถือว่าเป็นผลิตภัณฑ์ประเภทเดียวกัน โดยไม่คำนึงถึงลำดับในคลัสเตอร์ (เช่น โปรตีน-แบคเทอริโอซิน และแบคเทอริโอซิน-โปรตีโอโปรตีนฟิวชั่น ร่างกาย).ไฮบริด)
DNA ที่เหลือ (ประมาณ 6 ng) จากตัวอย่าง Malaspina MP1648 ซึ่งสอดคล้องกับตัวอย่างทางชีวภาพ SAMN05421555 และจับคู่กับชุดการอ่าน metagenomic ของ Illumina SRR3962772 สำหรับการอ่านแบบสั้น ประมวลผลตามโปรโตคอลการจัดลำดับ PacBio พร้อมอินพุตต่ำมากเพื่อใช้ชุด PacBio การขยายตัวอย่าง SMRTbell gDNA ชุดอุปกรณ์ (100-980-000) และชุดเตรียมเทมเพลต SMRTbell Express 2.0 (100-938-900)โดยสรุป DNA ที่เหลือถูกตัด ซ่อมแซม และทำให้บริสุทธิ์ (เม็ดบีด ProNex) โดยใช้ Covaris (g-TUBE, 52104)จากนั้น DNA ที่ถูกทำให้บริสุทธิ์จะต้องผ่านการเตรียมห้องสมุด การขยาย การทำให้บริสุทธิ์ (เม็ดบีด ProNex) และการเลือกขนาด (>6 kb, Blue Pippin) ก่อนขั้นตอนการทำให้บริสุทธิ์ขั้นสุดท้าย (เม็ดบีด ProNex) และการจัดลำดับบนแพลตฟอร์ม Sequel II
การบูรณะสองช่วงแรกประมาณค.ศ.สำหรับ MAG Eremiobacterota เราระบุ ANI เพิ่มเติมอีกหกรายการ> 99% (ซึ่งรวมอยู่ในรูปที่ 3) ซึ่งเริ่มแรกถูกกรองตามคะแนนการปนเปื้อน (ภายหลังระบุว่าเป็นการทำซ้ำของยีนดูด้านล่าง)นอกจากนี้เรายังพบถาดที่มีข้อความว่า "Ca"Eremiobacterota” จากการศึกษาต่างๆ23 และใช้พวกมันร่วมกับ MAG แปดตัวจากการศึกษาของเราเพื่อเป็นข้อมูลอ้างอิงสำหรับการอ่านเมทาโนมิกจากตัวอย่างที่ได้รับการเสริมสมรรถนะด้วยยูคาริโอต 633 ตัวอย่าง (>0.8 µm) โดยใช้ BWA (v.0.7.17) Ref -r1188, – a flag) สำหรับการลดขนาดตัวอย่าง การทำแผนที่ (อ่าน 5 ล้านครั้ง)จากแผนที่เฉพาะของการเสริมสมรรถนะ (กรองโดยเอกลักษณ์การจัดตำแหน่ง 95% และความครอบคลุมการอ่าน 80%) มีการเลือก 10 metagenomes (ความครอบคลุมที่คาดหวัง ≥5×) สำหรับการประกอบและอีก 49 metagenomes เพิ่มเติม (ความครอบคลุมที่คาดหวัง ≥1×) สำหรับความสัมพันธ์ของเนื้อหาโดยใช้พารามิเตอร์เดียวกันกับข้างต้น ตัวอย่างเหล่านี้ถูกรวมเข้าด้วยกันและ 'Ca' เพิ่มเติมอีก 10 ตัวถูกเติมMAG Eremiobacterota ได้รับการฟื้นฟูแล้วMAG 16 รายการเหล่านี้ (ไม่นับสองรายการที่มีอยู่ในฐานข้อมูล) ทำให้จำนวนจีโนมทั้งหมดใน OMD ที่ขยายเพิ่มเป็น 34,815MAG ได้รับการจัดลำดับอนุกรมวิธานตามความคล้ายคลึงกันของจีโนมและตำแหน่งใน GTDBMAG 18 รายการถูกจำลองซ้ำโดยใช้ dRep เป็น 5 สปีชีส์ (ANI เฉพาะเจาะจง > 99%) และ 3 สกุล (ANI ภายในทั่วไป 85% ถึง 94%) ภายในตระกูลเดียวกันตัวแทนสายพันธุ์ได้รับการคัดเลือกด้วยตนเองโดยพิจารณาจากความสมบูรณ์ การปนเปื้อน และ N50ระบบการตั้งชื่อที่แนะนำมีอยู่ในข้อมูลเสริม
ประเมินความสมบูรณ์และการปนเปื้อนของ 'Ca'MAG Eremiobacterota เราประเมินการมีอยู่ของ uscMG เช่นเดียวกับชุดยีนมาร์กเกอร์สำเนาเดียวเฉพาะสายเลือดและโดเมนที่ใช้โดย CheckM และ Anvi'oการระบุ 2 รายการซ้ำจาก 40 uscMGs ได้รับการยืนยันโดยการสร้างสายวิวัฒนาการใหม่ (ดูด้านล่าง) เพื่อแยกแยะการปนเปื้อนที่อาจเกิดขึ้น (ซึ่งสอดคล้องกับ 5% ตามยีนเครื่องหมาย 40 เหล่านี้)การศึกษาเพิ่มเติมของตัวแทน MAGs 'Ca ห้ารายสารปนเปื้อนในระดับต่ำในจีโนมที่สร้างขึ้นใหม่เหล่านี้ได้รับการยืนยันสำหรับสายพันธุ์ Eremiobacterota โดยใช้อินเทอร์เฟซ Anvi'o แบบโต้ตอบโดยอิงตามความสัมพันธ์ขององค์ประกอบความอุดมสมบูรณ์และลำดับ (ข้อมูลเสริม)
สำหรับการวิเคราะห์สายวิวัฒนาการ เราเลือก MAG ตัวแทน "Ca" ห้ารายการEudormicrobiaceae” ทุกชนิด “Ca.จีโนมของ Eremiobacterota และสมาชิกของไฟลาอื่น ๆ (รวมถึง UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria และ Planctomycetota) มีให้จาก GTDB (r89)จีโนมเหล่านี้ทั้งหมดได้รับการใส่คำอธิบายประกอบตามที่อธิบายไว้ก่อนหน้านี้ สำหรับการสกัดยีนมาร์กเกอร์สำเนาเดียวและคำอธิบายประกอบ BGCจีโนม GTDB ได้รับการอนุรักษ์ตามเกณฑ์ความสมบูรณ์และการปนเปื้อนข้างต้นการวิเคราะห์สายวิวัฒนาการดำเนินการโดยใช้เวิร์กโฟลว์ Anvi'o Phylogenetics59ต้นไม้ถูกสร้างขึ้นโดยใช้ IQTREE (v.2.0.3) (ตัวเลือกเริ่มต้นและ -bb 1000)80 บนการจัดตำแหน่งของโปรตีนไรโบโซมตามกัน 39 ตัวที่ระบุโดย Anvi'o (MUSCLE, v.3.8.1551)81ตำแหน่งของเขาลดลงเพื่อให้ครอบคลุมอย่างน้อย 50% ของจีโนม และ Planctomycecota ถูกใช้เป็นกลุ่มนอกตามโทโพโลยีต้นไม้ GTDBต้นไม้หนึ่งต้นจาก 40 uscMG ถูกสร้างขึ้นโดยใช้เครื่องมือและพารามิเตอร์เดียวกัน
เราใช้ Traitar (v.1.1.2) พร้อมพารามิเตอร์เริ่มต้น (ฟีโนไทป์จากนิวคลีโอไทด์) เพื่อทำนายลักษณะทั่วไปของจุลินทรีย์เราสำรวจวิถีชีวิตนักล่าที่มีศักยภาพโดยอิงจากดัชนีนักล่าที่พัฒนาก่อนหน้านี้ ซึ่งขึ้นอยู่กับเนื้อหาของยีนเข้ารหัสโปรตีนในจีโนมโดยเฉพาะ เราใช้ DIAMOND เพื่อเปรียบเทียบโปรตีนในจีโนมกับฐานข้อมูล OrthoMCL (v.4)85 โดยใช้ตัวเลือก –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 และนับยีนที่สอดคล้องกับ ยีนเครื่องหมายสำหรับผู้ล่าและผู้ไม่ล่าดัชนีคือความแตกต่างระหว่างจำนวนเครื่องหมายที่กินสัตว์อื่นและไม่กินสัตว์อื่นเพื่อเป็นการควบคุมเพิ่มเติม เรายังวิเคราะห์จีโนม "Ca" ด้วยปัจจัย Entotheonella TSY118 ขึ้นอยู่กับการเชื่อมโยงกับ CaEudoremicrobium (ขนาดจีโนมขนาดใหญ่และมีศักยภาพในการสังเคราะห์ทางชีวภาพ)ต่อไป เราได้ทดสอบการเชื่อมโยงที่เป็นไปได้ระหว่างยีนของนักล่าและยีนที่ไม่ใช่นักล่า และศักยภาพในการสังเคราะห์ทางชีวภาพของ CaEudormicrobiaceae” และพบว่ามียีนไม่เกิน 1 ยีน (จากยีนมาร์กเกอร์ประเภทใดก็ตาม เช่น ยีนนักล่า/ไม่ใช่สัตว์นักล่า) ซ้อนทับกับ BGC ซึ่งบ่งชี้ว่า BGC จะไม่รบกวนสัญญาณการปล้นสะดมคำอธิบายประกอบจีโนมเพิ่มเติมของแบบจำลองที่มีสัญญาณรบกวนดำเนินการโดยใช้ TXSSCAN (v.1.0.2) เพื่อตรวจสอบระบบการคัดหลั่ง พิลี และแฟลเจลลา86 โดยเฉพาะ
ตัวแทน 'Ca's ห้ารายถูกแมปโดยการทำแผนที่เมตาทรานสคริปต์โตม 623 ตัวจากเศษส่วนเสริมสมรรถนะโปรคาริโอตและยูคาริโอตของมหาสมุทรทารา 22,40,87 (โดยใช้ BWA, v.0.7.17-r1188, -a flag)จีโนม Eudormicrobiaceaeไฟล์ BAM ได้รับการประมวลผลด้วย FeatureCounts (v.2.0.1)88 หลังจากการครอบคลุมการอ่าน 80% และการกรองข้อมูลประจำตัว 95% (พร้อมตัวเลือก FeatureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) นับ จำนวนส่วนแทรกต่อยีนแผนที่ที่สร้างขึ้นถูกทำให้เป็นมาตรฐานสำหรับความยาวของยีนและความอุดมสมบูรณ์ของยีนมาร์กเกอร์ mOTU (จำนวนการแทรกเฉลี่ยที่ปรับความยาวให้เป็นมาตรฐานสำหรับยีนที่มีการนับการแทรก> 0) และบันทึกการแปลงเป็น 22.74 เพื่อให้ได้การแสดงออกสัมพัทธ์ต่อเซลล์ของแต่ละระดับยีน ซึ่งยังอธิบายด้วย ความแปรปรวนจากตัวอย่างไปยังตัวอย่างระหว่างการจัดลำดับอัตราส่วนดังกล่าวช่วยให้สามารถวิเคราะห์เปรียบเทียบได้ ซึ่งช่วยบรรเทาปัญหาองค์ประกอบเมื่อใช้ข้อมูลความอุดมสมบูรณ์สัมพัทธ์เฉพาะตัวอย่างที่มียีนมาร์กเกอร์ >5 จาก 10 mOTU เท่านั้นที่ได้รับการพิจารณาสำหรับการวิเคราะห์เพิ่มเติมเพื่อให้ตรวจพบจีโนมส่วนใหญ่เพียงพอ
โปรไฟล์การถอดเสียงแบบปกติของ 'CaE. taraoceanii ได้รับการลดขนาดโดยใช้ UMAP และผลลัพธ์ที่ได้ถูกนำมาใช้สำหรับการจัดกลุ่มแบบไม่ได้รับการดูแลโดยใช้ HDBSCAN (ดูด้านบน) เพื่อกำหนดสถานะการแสดงออกPERMANOVA ทดสอบความสำคัญของความแตกต่างระหว่างกระจุกที่ระบุในพื้นที่ระยะทางเดิม (ไม่ลดลง)การแสดงออกที่แตกต่างระหว่างเงื่อนไขเหล่านี้ได้รับการทดสอบทั่วทั้งจีโนม (ดูด้านบน) และวิถีทาง KEGG 201 รายการถูกระบุในกลุ่มการทำงาน 6 กลุ่ม ได้แก่: BGC ระบบการหลั่งและยีนแฟลเจลลาร์จาก TXSSCAN เอนไซม์การย่อยสลาย (โปรตีเอสและเปปทิเดส) และสัตว์นักล่าและไม่ใช่ ยีนนักล่าเครื่องหมายดัชนีนักล่าสำหรับแต่ละตัวอย่าง เราคำนวณค่ามัธยฐานของนิพจน์มาตรฐานสำหรับแต่ละคลาส (โปรดทราบว่าการแสดงออกของ BGC นั้นถูกคำนวณเป็นค่ามัธยฐานของการแสดงออกของยีนสังเคราะห์ทางชีวภาพสำหรับ BGC นั้น) และทดสอบความสำคัญข้ามรัฐ (การทดสอบ Kruskal-Wallis ปรับสำหรับ FDR)
ซื้อยีนสังเคราะห์จาก GenScript และไพรเมอร์ PCR ซื้อจาก MicrosynthPhusion polymerase จาก Thermo Fisher Scientific ใช้สำหรับการขยาย DNAพลาสมิดของ NucleoSpin, เจล NucleoSpin และชุดการทำให้บริสุทธิ์ PCR จาก Macherey-Nagel ถูกนำมาใช้ในการทำให้ DNA บริสุทธิ์ซื้อเอนไซม์จำกัดและ T4 DNA ligase จาก New England Biolabsสารเคมีอื่นที่ไม่ใช่ isopropyl-β-d-1-thiogalactopyranoside (IPTG) (Biosynth) และ 1,4-dithiothreitol (DTT, AppliChem) ซื้อจาก Sigma-Aldrich และใช้โดยไม่ต้องทำให้บริสุทธิ์เพิ่มเติมยาปฏิชีวนะ คลอแรมเฟนิคอล (Cm), สเปคติโนมัยซิน ไดไฮโดรคลอไรด์ (Sm), แอมพิซิลลิน (Amp), เจนตามิซิน (Gt) และคาร์เบนิซิลลิน (Cbn) ถูกซื้อจาก AppliChemส่วนประกอบของสื่อ Bacto Tryptone และ Bacto Yeast Extract ถูกซื้อจาก BD Biosciencesทริปซินสำหรับการเรียงลำดับถูกซื้อจาก Promega
ลำดับของยีนถูกสกัดจาก BGC 75.1 ที่คาดการณ์ไว้ของ anti-SMASHE. Malaspinii (ข้อมูลเพิ่มเติม)
ยีน embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4) และ embAM (รวมถึงขอบเขตระหว่างยีน) ถูกจัดลำดับเป็นโครงสร้างสังเคราะห์ใน pUC57 (AmpR) โดยมีและไม่มี codons ที่ปรับให้เหมาะสมสำหรับการแสดงออกใน E เมื่อไร.ยีน embA ถูกทำโคลนย่อยเข้าไปในตำแหน่งการโคลนนิ่งหลายตำแหน่ง (MCS1) แรกของ pACYCDuet-1(CmR) และ pCDFDuet-1(SmR) โดยมีตำแหน่งแตกแยก BamHI และ HindIIIยีน embM และ embMopt (ปรับให้เหมาะสมด้วย codon) ถูก subcloned เป็น MCS1 pCDFDuet-1 (SmR) ด้วย BamHI และ HindIII และวางไว้ในตำแหน่งการโคลนหลายตัวที่สองของ pCDFDuet-1 (SmR) และ pRSFDuet-1 (KanR) (MCS2) ด้วย NdeI/ชอย.คาสเซ็ต embAM ถูกซับโคลนเข้าไปใน pCDFDuet1(SmR) โดยมีตำแหน่งการตัดแยก BamHI และ HindIIIยีน orf3 / embI (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) ถูกสร้างขึ้นโดย PCR ส่วนขยายที่ทับซ้อนกันโดยใช้ไพรเมอร์ EmbI_OE_F_NdeI และ EmbI_OE_R_XhoI ย่อยด้วย NdeI / XhoI และ ligated เป็น pCDFDuet-1-EmbM (MCS1) โดยใช้เอนไซม์ จำกัด เดียวกัน (เสริม โต๊ะ).6).การจำกัดการย่อยและการรวมตัวของเอ็นไซม์ดำเนินการตามระเบียบการของผู้ผลิต (New England Biolabs)

 


เวลาโพสต์: 14 มี.ค. 2023