304 لوله مارپیچ جوش داده شده از جنس استنلس استیل / لوله زومپوننت شیمیایی، پتانسیل بیوسنتزی میکروبیوم جهانی دریایی

از بازدید شما از Nature.com سپاسگزاریم.شما از یک نسخه مرورگر با پشتیبانی محدود CSS استفاده می کنید.برای بهترین تجربه، توصیه می کنیم از یک مرورگر به روز شده استفاده کنید (یا حالت سازگاری را در اینترنت اکسپلورر غیرفعال کنید).علاوه بر این، برای اطمینان از پشتیبانی مداوم، سایت را بدون استایل و جاوا اسکریپت نشان می‌دهیم.
اسلایدرهایی که سه مقاله را در هر اسلاید نشان می دهند.برای حرکت در اسلایدها از دکمه های پشت و بعدی استفاده کنید یا از دکمه های کنترلر اسلاید در انتها برای حرکت در هر اسلاید استفاده کنید.

توضیحات کامل محصول

304 لوله / لوله سیم پیچ فولادی ضد زنگ
1. مشخصات: لوله سیم پیچ فولادی ضد زنگ / لوله
2. نوع: جوش داده شده یا بدون درز
3. استاندارد: ASTM A269، ASTM A249
4. لوله سیم پیچ فولادی ضد زنگ OD: 6 میلی متر تا 25.4 میلی متر
5. طول: 600-3500MM یا طبق نیاز مشتری.
6. ضخامت دیوار: 0.2mm تا 2.0mm.

7. تحمل: OD: +/-0.01mm;ضخامت: +/-0.01٪.

8. اندازه سوراخ داخلی کویل: 500MM-1500MM (با توجه به نیاز مشتری قابل تنظیم است)

9. ارتفاع سیم پیچ: 200MM-400MM (با توجه به نیاز مشتری قابل تنظیم است)

10. سطح: روشن یا بازپخت
11. مواد: 304، 304L، 316L، 321، 301، 201، 202، 409، 430، 410، آلیاژ 625، 825، 2205، 2507، و غیره.
12. بسته بندی: کیسه های بافته شده در جعبه چوبی، پالت چوبی، شفت چوبی یا مطابق با نیاز مشتری
13. تست: جزء شیمیایی، استحکام تسلیم، استحکام کششی، اندازه گیری سختی
14. گارانتی: بازرسی شخص ثالث (به عنوان مثال :SGS TV ) و غیره.
15. کاربرد: دکوراسیون، مبلمان، حمل و نقل روغن، مبدل حرارتی، ساخت نرده، ساخت کاغذ، خودرو، پردازش مواد غذایی، پزشکی و غیره.

تمام ترکیبات شیمیایی و خواص فیزیکی فولاد ضد زنگ به شرح زیر:

مواد ASTM A269 ترکیب شیمیایی % حداکثر
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0.08 2.00 0.045 0.030 1.00 18.0-20.0 8.0-11.0 ^ ^ ^ . ^
TP304L 0.035 2.00 0.045 0.030 1.00 18.0-20.0 8.0-12.0 ^ ^ ^ ^
TP316 0.08 2.00 0.045 0.030 1.00 16.0-18.0 10.0-14.0 2.00-3.00 ^ ^ ^
TP316L 0.035 D 2.00 0.045 0.030 1.00 16.0-18.0 10.0-15.0 2.00-3.00 ^ ^ ^
TP321 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 ^ ^ ^ 5C -0.70
TP347 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 10C -1.10 ^

 

مواد حرارت درمانی دمای F (C) حداقل. سختی
برینل راکول
TP304 راه حل 1900 (1040) 192HBW/200HV 90HRB
TP304L راه حل 1900 (1040) 192HBW/200HV 90HRB
TP316 راه حل 1900 (1040) 192HBW/200HV 90HRB
TP316L راه حل 1900 (1040) 192HBW/200HV 90HRB
TP321 راه حل 1900 (1040) F 192HBW/200HV 90HRB
TP347 راه حل 1900 (1040) 192HBW/200HV 90HRB

 

OD، اینچ اینچ تحمل OD (mm) % تحمل WT تحمل طول اینچ (میلی متر)
+ -
≤ 1/2 0.005 ± (0.13) ± 15 1/8 ( 3.2 ) 0
> 1/2 ~ 1 1/2 0.005 ± (0.13) ± 10 1/8 (3.2) 0
> 1 1/2 ~< 3 1/2 0.010 ± (0.25) ± 10 3 / 16 (4.8) 0
> 3 1/2 ~< 5 1/2 0.015 ± (0.38) ± 10 3 / 16 (4.8) 0
> 5 1/2 ~< 8 0.030 ± (0.76) ± 10 3 / 16 (4.8) 0
8 ~ < 12 0.040 ± (1.01) ± 10 3 / 16 (4.8) 0
12 ~ < 14 0.050 ± (1.26) ± 10 3 / 16 (4.8) 0

جوامع میکروبی طبیعی از نظر فیلوژنتیکی و متابولیکی متنوع هستند.این تنوع علاوه بر گروه‌های موجودات که کمتر مورد مطالعه قرار گرفته‌اند، پتانسیل غنی برای کشف آنزیم‌ها و ترکیبات بیوشیمیایی مهم از نظر زیست‌محیطی و بیوتکنولوژیکی دارد.با این حال، مطالعه این تنوع برای تعیین مسیرهای ژنومی که چنین ترکیباتی را سنتز می کند و آنها را به میزبان مربوطه خود متصل می کند، همچنان یک چالش است.پتانسیل بیوسنتزی میکروارگانیسم ها در اقیانوس باز به دلیل محدودیت در تجزیه و تحلیل داده های وضوح کل ژنوم در مقیاس جهانی تا حد زیادی ناشناخته باقی مانده است.در اینجا، ما تنوع و تنوع خوشه‌های ژن بیوسنتزی در اقیانوس را با ادغام حدود 10000 ژنوم میکروبی از سلول‌های کشت‌شده و سلول‌های منفرد با بیش از 25000 ژنوم پیش‌نویس تازه بازسازی‌شده از بیش از 1000 نمونه آب دریا بررسی می‌کنیم.این تلاش‌ها حدود 40000 خوشه‌ی ژن بیوسنتزی جدید را شناسایی کرده‌اند که برخی از آنها در گروه‌های فیلوژنتیکی که قبلاً مشکوک نبودند، یافت شده‌اند.در این جمعیت‌ها، ما یک دودمان غنی‌شده در خوشه‌های ژن بیوسنتزی ("Candidatus Eudormicrobiaceae") را شناسایی کردیم که به یک دسته باکتریایی کشت‌نشده تعلق داشت و شامل برخی از متنوع‌ترین میکروارگانیسم‌های بیوسنتزی در این محیط بود.از این موارد، ما مسیرهای فسفاتاز-پپتید و پیتونامید را مشخص کرده‌ایم، به ترتیب نمونه‌هایی از ساختار ترکیب فعال زیست فعال غیرمعمول و آنزیم‌شناسی را شناسایی می‌کنیم.در نتیجه، این مطالعه نشان می‌دهد که چگونه استراتژی‌های مبتنی بر میکروبیوم می‌توانند اکتشاف آنزیم‌های توصیف‌نشده قبلی و غذاهای طبیعی را در یک میکروبیوتا و محیطی که درک نادرست دارند، فعال کند.
میکروب ها چرخه های بیوژئوشیمیایی جهانی را هدایت می کنند، شبکه های غذایی را حفظ می کنند و گیاهان و حیوانات را سالم نگه می دارند.تنوع فیلوژنتیکی، متابولیکی و عملکردی آن ها نشان دهنده پتانسیل غنی برای کشف گونه های جدید، آنزیم ها و ترکیبات بیوشیمیایی، از جمله محصولات طبیعی است.در جوامع بوم شناختی، این مولکول ها میکروارگانیسم ها را با انواع عملکردهای فیزیولوژیکی و اکولوژیکی، از ارتباطات گرفته تا رقابت، ارائه می کنند.علاوه بر عملکرد اصلی خود، این محصولات طبیعی و مسیرهای تولید کد ژنتیکی آنها نمونه هایی برای کاربردهای بیوتکنولوژیکی و درمانی ارائه می کنند.شناسایی چنین مسیرها و اتصالاتی با مطالعه میکروب های کشت شده بسیار تسهیل شده است.با این حال، مطالعات طبقه بندی محیط های طبیعی نشان داده است که اکثریت قریب به اتفاق میکروارگانیسم ها کشت نشده اند.این تعصب فرهنگی توانایی ما را برای بهره برداری از تنوع عملکردی کدگذاری شده توسط بسیاری از میکروب ها محدود می کند.
برای غلبه بر این محدودیت‌ها، پیشرفت‌های فناوری در دهه گذشته به محققان این امکان را داده است که به طور مستقیم (یعنی بدون کشت قبلی) قطعات DNA میکروبی را از کل جوامع (متاژنومیک) یا تک سلولی توالی‌یابی کنند.توانایی جمع آوری این قطعات در قطعات ژنومی بزرگتر و بازسازی ژنوم های چندگانه مونتاژ شده متاژنومیک (MAGs) یا ژنوم های تکثیر شده (SAGs)، به ترتیب، فرصت مهمی را برای مطالعات طبقه بندی میکروبیوم (یعنی جوامع میکروبی و میکروبیوم) باز می کند.مسیرهای جدید را هموار کنیدماده ژنتیکی خود در یک محیط معین) 10،11،12.در واقع، مطالعات اخیر به میزان زیادی نمایش فیلوژنتیکی تنوع میکروبی را بر روی زمین گسترش داده است و بسیاری از تنوع عملکردی را در جوامع میکروبی فردی که قبلاً توسط توالی‌های ژنوم مرجع میکروارگانیسم‌های کشت‌شده (REFs) پوشش داده نشده‌اند، نشان داده‌اند.توانایی قرار دادن تنوع عملکردی کشف نشده در زمینه ژنوم میزبان (یعنی تفکیک ژنوم) برای پیش‌بینی خطوط میکروبی هنوز مشخص نشده که احتمالاً محصولات طبیعی جدید را رمزگذاری می‌کنند یا برای ردیابی چنین ترکیباتی به تولیدکننده اصلی‌شان حیاتی است.به عنوان مثال، یک رویکرد تجزیه و تحلیل ژنومیک متاژنومی و تک سلولی ترکیبی منجر به شناسایی Candidatus Entotheonella، گروهی از باکتری‌های مرتبط با اسفنج غنی از متابولیسم، به عنوان تولیدکنندگان انواع پتانسیل‌های دارویی شده است.با این حال، علی‌رغم تلاش‌های اخیر برای اکتشاف ژنومی جوامع مختلف میکروبی، 16،19 بیش از دو سوم داده‌های فراژنومیک جهانی برای بزرگترین اقیانوس اکوسیستم‌های زمین هنوز وجود ندارد.بنابراین، به طور کلی، پتانسیل بیوسنتزی میکروبیوم دریایی و پتانسیل آن به عنوان مخزن محصولات آنزیمی و طبیعی جدید تا حد زیادی مورد مطالعه قرار نگرفته است.
برای کشف پتانسیل بیوسنتزی میکروبیوم‌های دریایی در مقیاس جهانی، ابتدا ژنوم‌های میکروبی دریایی را که با استفاده از روش‌های وابسته به فرهنگ و غیرکشت به دست آمده‌اند، جمع‌آوری کردیم تا یک پایگاه داده گسترده از فیلوژنتیک و عملکرد ژن ایجاد کنیم.بررسی این پایگاه داده طیف گسترده‌ای از خوشه‌های ژن بیوسنتزی (BGCs) را نشان داد که بیشتر آن‌ها به خانواده‌های خوشه ژنی هنوز مشخص نشده (GCF) تعلق دارند.علاوه بر این، ما یک خانواده باکتریایی ناشناخته را شناسایی کردیم که تا به امروز بیشترین تنوع شناخته شده از BGCها را در اقیانوس های باز نشان می دهد.ما دو مسیر سنتز ریبوزومی و پپتید اصلاح‌شده پس از ترجمه (RiPP) را برای اعتبارسنجی تجربی بر اساس تفاوت‌های ژنتیکی آنها از مسیرهای شناخته‌شده فعلی انتخاب کردیم.خصوصیات عملکردی این مسیرها نمونه های غیرمنتظره ای از آنزیم شناسی و همچنین ترکیبات ساختاری غیرعادی با فعالیت مهاری پروتئاز را نشان داده است.
در ابتدا، هدف ما ایجاد یک منبع داده جهانی برای تجزیه و تحلیل ژنوم، با تمرکز بر اجزای باکتریایی و باستانی آن بود.برای این منظور، ما داده‌های متاژنومی و 1038 نمونه آب دریا را از 215 محل نمونه‌برداری توزیع شده در سطح جهانی (محدوده عرض جغرافیایی = 141.6 درجه) و چندین لایه عمیق (از 1 تا 5600 متر در عمق، که مناطق دریایی، مزوپلاژیک و ابیسال را پوشش می‌دهند) گردآوری کردیم.پس زمینه21،22،23 (شکل 1a، داده های توسعه یافته، شکل 1a و جدول تکمیلی 1).علاوه بر ارائه یک پوشش جغرافیایی گسترده، این نمونه‌های فیلتر شده انتخابی به ما امکان مقایسه اجزای مختلف میکروبیوم دریایی، از جمله غنی از ویروس (<0.2 میکرومتر)، غنی از پروکاریوت (0.2-3 میکرومتر)، غنی از ذرات (0.8 میکرومتر) را می‌دهد. ).-20 میکرومتر) و مستعمرات فاقد ویروس (بیش از 0.2 میکرومتر).
a، در مجموع 1038 ژنوم در دسترس عموم (متاژنومیک) جوامع میکروبی دریایی از 215 مکان توزیع شده در سطح جهانی (62 درجه جنوبی تا 79 درجه شمالی و 179 درجه غربی تا 179 درجه شرقی .) جمع آوری شده است.کاشی های نقشه © Esri.منابع: GEBCO، NOAA، CHS، OSU، UNH، CSUMB، National Geographic، DeLorme، NAVTEQ و Esri.ب، این متاژنوم ها برای بازسازی MAG ها (روش ها و اطلاعات اضافی)، که از نظر کمیت و کیفیت (روش ها) در مجموعه داده ها (با رنگ مشخص شده) متفاوت هستند، استفاده شد.MAG های بازسازی شده با ژنوم های (خارجی) در دسترس عموم، از جمله MAG26، SAG27 و REF دست ساز تکمیل شدند.27 OMD را کامپایل کنید.ج، در مقایسه با گزارش‌های قبلی که فقط بر اساس SAG (GORG) 20 یا MAG (GEM) 16 بود، OMD خصوصیات ژنومی جوامع میکروبی دریایی (نرخ نقشه‌برداری متاژنومی، روش) را دو تا سه برابر با بازنمایی منسجم‌تر در عمق و بهبود می‌بخشد. عرض جغرافیایی..<0.2، n=151، 0.2-0.8، n=67، 0.2-3، n=180، 0.8-20، n=30، >0.2، n=610، <30 درجه، n = 132، 30-60 درجه ، n = 73، > 60 درجه، n = 42، EPI، n = 174، MES، n = 45، BAT، n = 28. تقریباً 8300 گونه، که بیش از نیمی از آنها قبلاً با استفاده از GTDB (نسخه 89) e شناسایی نشده اند، طبقه بندی گونه ها بر اساس نوع ژنوم نشان داد که MAG، SAG و REFs به خوبی یکدیگر را در انعکاس تنوع فیلوژنتیکی تکمیل می کنند. میکروبیوم دریاییبه طور خاص، 55%، 26% و 11% از گونه ها به ترتیب مخصوص MAG، SAG و REF بودند.خفاش، سری زمانی آتلانتیک برمودا؛GEM، ژنوم میکروبیوم زمین؛GORG، ژنوم مرجع جهانی اقیانوس.HOT، سری زمانی اقیانوس هاوایی.
با استفاده از این مجموعه داده، ما در مجموع 26293 MAG، عمدتاً باکتریایی و باستانی را بازسازی کردیم (شکل 1b و داده های توسعه یافته، شکل 1b).ما این MAGها را از مجموعه‌هایی از نمونه‌های متاژنومی جداگانه و نه ادغام شده ایجاد کردیم تا از فروپاشی تغییرات توالی طبیعی بین نمونه‌ها از مکان‌ها یا نقاط زمانی مختلف (روش‌ها) جلوگیری کنیم.علاوه بر این، ما قطعات ژنومی را بر اساس همبستگی شیوع آنها در تعداد زیادی از نمونه ها (از 58 تا 610 نمونه، بسته به روش بررسی) گروه بندی کردیم.ما دریافتیم که این یک مرحله زمان‌بر اما مهم است 24 که در چندین کار بازسازی MAG16، 19، 25 در مقیاس بزرگ نادیده گرفته شد و به طور قابل‌توجهی کمیت (به طور متوسط ​​2.7 برابر) و کیفیت (+20٪ به طور متوسط) را بهبود بخشید. ژنومبازسازی شده از متاژنوم دریایی مورد مطالعه در اینجا (داده های توسعه یافته، شکل 2a و اطلاعات اضافی).به طور کلی، این تلاش ها منجر به افزایش 4.5 برابری در MAG های میکروبی دریایی (6 برابر اگر فقط MAG های با کیفیت بالا در نظر گرفته شود) در مقایسه با جامع ترین منبع MAG موجود امروزی (روش ها) شد.این مجموعه MAG تازه ایجاد شده سپس با 830 MAG26 دستچین شده، 5969 SAG27 و 1707 REF ترکیب شد.بیست و هفت گونه از باکتری های دریایی و آرکیا مجموعه ای ترکیبی از 34799 ژنوم را تشکیل دادند (شکل 1b).
سپس منبع تازه ایجاد شده را برای بهبود توانایی آن در ارائه جوامع میکروبی دریایی و ارزیابی تأثیر ادغام انواع مختلف ژنوم ارزیابی کردیم.به طور متوسط، ما دریافتیم که تقریباً 40-60٪ از داده های متاژنومی دریایی (شکل 1c) را پوشش می دهد، که دو تا سه برابر پوشش قبلی گزارش های فقط MAG در عمق و عرض جغرافیایی More serial 16 یا SAG20 است.علاوه بر این، برای اندازه‌گیری نظام‌مند تنوع طبقه‌بندی در مجموعه‌های تاسیس شده، همه ژنوم‌ها را با استفاده از ابزار (روش‌ها) پایگاه داده‌های طبقه‌بندی ژنوم (GTDB) حاشیه‌نویسی کردیم و از یک هویت نوکلئوتیدی متوسط ​​ژنومی 95 درصد استفاده کردیم.28 برای شناسایی 8304 گونه خوشه (گونه).دو سوم از این گونه ها (از جمله کلادهای جدید) قبلاً در GTDB ظاهر نشده بودند، که 2790 با استفاده از MAG بازسازی شده در این مطالعه کشف شدند (شکل 1d).علاوه بر این، ما دریافتیم که انواع مختلف ژنوم ها بسیار مکمل یکدیگر هستند: 55%، 26% و 11% از گونه ها به ترتیب به طور کامل از MAG، SAG و REF تشکیل شده اند (شکل 1e).علاوه بر این، MAG تمام 49 نوع یافت شده در ستون آب را پوشش می دهد، در حالی که SAG و REF به ترتیب تنها 18 و 11 نوع از آنها را نشان می دهند.با این حال، SAG بهتر نشان دهنده تنوع رایج ترین کلادها (داده های گسترش یافته، شکل 3a)، مانند باکتری Pelagic (SAR11)، با SAG تقریبا 1300 گونه و MAG تنها 390 گونه است.قابل ذکر است که REFها به ندرت با MAGs یا SAGs در سطح گونه همپوشانی دارند و بیش از 95 درصد از تقریباً 1000 ژنومی را نشان می‌دهند که در مجموعه‌های متاژنومیکی اقیانوس‌های باز که در اینجا مورد مطالعه قرار گرفته‌اند، یافت نمی‌شوند، عمدتاً به دلیل تعامل با سایر انواع نمونه‌های دریایی جدا شده (مانند رسوبات). .یا میزبان-همکار).برای در دسترس قرار دادن آن به طور گسترده در جامعه علمی، این منبع ژنوم دریایی، که شامل قطعات طبقه بندی نشده نیز می شود (به عنوان مثال، از فاژهای پیش بینی شده، جزایر ژنومی، و قطعات ژنومی که داده های کافی برای بازسازی MAG وجود ندارد)، می تواند با داده های طبقه بندی مقایسه شود. .به حاشیه نویسی ها همراه با عملکرد ژن و پارامترهای زمینه ای در پایگاه داده میکروبیولوژی اقیانوس (OMD؛ https://microbiomics.io/ocean/) دسترسی پیدا کنید.
سپس به بررسی غنا و تازگی پتانسیل بیوسنتزی در میکروبیوم های اقیانوس باز پرداختیم.برای این منظور، ابتدا از antiSMASH برای همه MAGها، SAGها و REFهای یافت شده در 1038 متاژنوم دریایی (روش) استفاده کردیم تا در مجموع 39055 BGC را پیش‌بینی کنیم.سپس اینها را به 6907 GCF غیر زائد و 151 جمعیت خوشه ژنی (GCCs؛ جدول تکمیلی 2 و روش‌ها) گروه‌بندی کردیم تا افزونگی ذاتی (یعنی همان BGC را می‌توان در ژنوم‌های متعدد کدگذاری کرد) و داده‌های متاژنومی تکه تکه شدن BGCهای متمرکز.BGC های ناقص به طور قابل توجهی افزایش نمی یابند (اطلاعات تکمیلی)، تعداد GCF و GCC به ترتیب، حاوی حداقل یک عضو BGC سالم در 44٪ و 86٪ موارد.
در سطح GCC، ما طیف گسترده ای از RiPP های پیش بینی شده و سایر محصولات طبیعی را پیدا کردیم (شکل 2a).در میان آنها، به عنوان مثال، آریل پلی ین ها، کاروتنوئیدها، اکتوئین ها و سیدروفورها متعلق به GCC ها با توزیع فیلوژنتیکی وسیع و فراوانی زیاد در متاژنوم های اقیانوسی هستند که ممکن است نشان دهنده سازگاری وسیع میکروارگانیسم ها با محیط دریایی، از جمله مقاومت در برابر گونه های فعال اکسیژن باشد. استرس اکسیداتیو و اسمزی.یا جذب آهن (اطلاعات بیشتر).این تنوع عملکردی در تضاد با تجزیه و تحلیل اخیر تقریباً 1.2 میلیون BGC در میان تقریباً 190000 ژنوم ذخیره شده در پایگاه داده NCBI RefSeq (BiG-FAM/RefSeq، که از این پس RefSeq نامیده می شود)29، که نشان داد پپتیدهای سنتتاز سنتتاز غیر ریبوزومی و پپتیدهای سنتتاز غیر ریبوزومی (پپتیدهای سنتتاز غیر ریبوزومی RefSeq) (PKS) BGCs (اطلاعات تکمیلی).ما همچنین 44 (29%) GCC را یافتیم که فقط با هر RefSeq BGC (\(\bar{d}\)RefSeq > 0.4؛ شکل 2a و روش‌ها) و 53 (35%) GCC فقط در MAG مرتبط بودند که پتانسیل را برجسته می‌کند. برای شناسایی مواد شیمیایی قبلاً توصیف نشده در OMD.با توجه به اینکه هر یک از این GCC ها احتمالاً عملکردهای بیوسنتزی بسیار متنوعی را نشان می دهند، ما بیشتر داده ها را در سطح GCF در تلاش برای ارائه گروه بندی دقیق تری از BGCs پیش بینی شده برای کدگذاری برای محصولات طبیعی مشابه تجزیه و تحلیل کردیم.در مجموع 3861 (56٪) GCF شناسایی شده با RefSeq همپوشانی نداشتند و 97٪ بیشتر از GCFها در MIBiG، یکی از بزرگترین پایگاه های داده BGCهای تایید شده تجربی وجود نداشتند (شکل 2b).در حالی که کشف بسیاری از مسیرهای جدید بالقوه در تنظیماتی که به خوبی توسط ژنوم مرجع نشان داده نشده اند، تعجب آور نیست، روش ما برای حذف BGC ها به GCF ها قبل از مقایسه با گزارش های قبلی 16 متفاوت است و به ما امکان می دهد یک ارزیابی بی طرفانه از تازگی ارائه دهیم.بیشتر تنوع جدید (3012 GCF یا 78٪) مربوط به ترپن های پیش بینی شده، RiPP یا سایر محصولات طبیعی است و بیشتر (1815 GCF یا 47٪) به دلیل پتانسیل بیوسنتزی آنها در انواع ناشناخته کدگذاری شده است.برخلاف خوشه‌های PKS و NRPS، این BGCهای فشرده احتمال کمتری دارد که در طول مونتاژ متاژنومیک 31 تکه تکه شوند و خصوصیات عملکردی با زمان و منابع فشرده‌تری را برای محصولاتشان فراهم کنند.
در مجموع 39055 BGC به 6907 GCF و 151 GCC گروه بندی شدند.الف، نمایش داده ها (داخلی خارجی).خوشه بندی سلسله مراتبی فواصل BGC بر اساس GCC، که 53 مورد آن فقط توسط MAG ثابت شده است.GCC حاوی BGCهایی از گونه‌های مختلف (فرکانس گیت تبدیل‌شده با ln) و کلاس‌های مختلف BGC است (اندازه دایره با فرکانس آن مطابقت دارد).برای هر GCC، لایه بیرونی تعداد BGCها، شیوع (درصد نمونه ها) و فاصله (حداقل فاصله کسینوس BGC (min(dMIBiG))) از BiG-FAM تا BGC را نشان می دهد.GCC با BGC های نزدیک به BGC های تأیید شده تجربی (MIBiG) با فلش هایلایت شده اند.ب با مقایسه GCF با BGCهای پیش بینی شده (BiG-FAM) و تایید شده تجربی (MIBiG)، 3861 GCF جدید (d–> 0.2) پیدا شد.اکثر (78٪) این کدها برای RiPP، ترپن ها و سایر محصولات طبیعی فرضی هستند.ج، تمام ژنوم‌های موجود در OMD یافت شده در 1038 متاژنوم دریایی در درخت پایه GTDB قرار گرفتند تا پوشش فیلوژنتیکی OMD را نشان دهند.کلدهای بدون هیچ ژنومی در OMD به رنگ خاکستری نشان داده شده اند.تعداد BGCها با بیشترین تعداد BGCهای پیش بینی شده در هر ژنوم در یک کلاد مشخص مطابقت دارد.برای وضوح، 15٪ آخر گره ها فرو می ریزند.فلش‌ها کلادهای غنی از BGC (بیش از 15 BGC) را نشان می‌دهند، به استثنای مایکوباکتریوم، گوردونیا (دومین بعد از رودوکوکوس)، و کروکوسفارا (پس از Synechococcus دومین).د، ناشناخته ج.ارمیوباکتروتا بیشترین تنوع بیوسنتزی (شاخص شانون بر اساس نوع محصول طبیعی) را نشان داد.هر نوار نشان دهنده ژنوم با بیشترین BGC در گونه است.T1PKS، PKS نوع I، T2/3PKS، PKS نوع II و نوع III.
علاوه بر غنا و تازگی، ساختار جغرافیایی زیستی پتانسیل بیوسنتزی میکروبیوم دریایی را بررسی می کنیم.گروه‌بندی نمونه‌ها بر اساس میانگین توزیع تعداد کپی متاژنومی GCF (روش‌ها) نشان داد که جوامع با عرض جغرافیایی پایین، سطح، غنی از پروکاریوت و فقیر از ویروس، عمدتاً از آب‌های سطحی یا عمیق‌تر با نور خورشید، غنی از ترپن‌های RiPP و BGC بودند.در مقابل، جوامع قطبی، اعماق دریا، ویروس و ذرات با فراوانی بالاتر NRPS و PKS BGC مرتبط بودند (داده‌های گسترده، شکل 4 و اطلاعات اضافی).در نهایت، ما دریافتیم که جوامع استوایی و دریایی که به خوبی مطالعه شده‌اند، امیدوارکننده‌ترین منابع ترپن‌های جدید هستند (شکل داده‌های افزوده).بالاترین پتانسیل برای PKS، RiPP و سایر محصولات طبیعی (شکل 5a با داده های توسعه یافته).
برای تکمیل مطالعه ما در مورد پتانسیل بیوسنتزی میکروبیوم‌های دریایی، هدف ما نقشه‌برداری از توزیع فیلوژنتیکی آنها و شناسایی کلادهای جدید غنی‌شده با BGC بود.برای این منظور، ژنوم میکروب های دریایی را در یک درخت فیلوژنتیک باکتریایی و باستانی GTDB13 نرمال شده قرار دادیم و مسیرهای بیوسنتزی فرضی را که آنها کدگذاری می کنند پوشاندیم (شکل 2c).ما به راحتی چندین کلاد غنی شده با BGC (که توسط بیش از 15 BGC ارائه می شود) در نمونه های آب دریا (روش) شناخته شده برای پتانسیل بیوسنتزی خود، مانند سیانوباکتری ها (Synechococcus) و باکتری های پروتئوس، مانند Tistrella32،33، یا اخیراً توجه را به خود جلب کرده ایم، شناسایی کرده ایم. محصولات طبیعی .مانند Myxococcota (Sandaracinaceae)، Rhodococcus و Planctomycetota34،35،36.جالب اینجاست که ما چندین دودمان ناشناخته را در این کلادها پیدا کردیم.برای مثال، گونه‌هایی که غنی‌ترین پتانسیل بیوسنتزی را در فیلا Planctomycetota و Myxococcota داشتند، به ترتیب متعلق به راسته‌ها و جنس‌های نامزد نامشخص بودند (جدول تکمیلی 3).روی هم رفته، این نشان می‌دهد که OMD دسترسی به اطلاعات فیلوژنتیکی ناشناخته قبلی، از جمله میکروارگانیسم‌ها را فراهم می‌کند، که ممکن است اهداف جدیدی را برای کشف آنزیم و محصول طبیعی نشان دهد.
در مرحله بعد، ما کلاد غنی شده با BGC را نه تنها با شمارش حداکثر تعداد BGC های کدگذاری شده توسط اعضای آن، بلکه با ارزیابی تنوع این BGC ها، که فراوانی انواع مختلف محصولات کاندید طبیعی را توضیح می دهد، مشخص کردیم (شکل 2c و روش ها). )..ما دریافتیم که متنوع ترین گونه های بیوسنتزی توسط MAGهای باکتریایی مهندسی شده ویژه در این مطالعه نشان داده شده است.این باکتری ها متعلق به شاخه کشت نشده Candidatus Eremiobacerota هستند که جدا از چند مطالعه ژنومی تا حد زیادی ناشناخته باقی مانده است.قابل ذکر است که «حدودجنس Eremiobacerota فقط در یک محیط زمینی تجزیه و تحلیل شده است و مشخص نیست که اعضای غنی شده در BGC را شامل شود.در اینجا ما هشت MAG از یک گونه را بازسازی کرده‌ایم (هویت نوکلئوتیدی > 99%) 23. بنابراین نام گونه "Candidatus Eudoremicrobium malaspinii" را پیشنهاد می‌کنیم، که نام آن از nereid (پوره دریایی)، یک هدیه زیبا در اساطیر یونان و سفرهای اعزامی است.'کا.با توجه به حاشیه نویسی فیلوژنتیک 13، E. malaspinii هیچ بستگان شناخته شده قبلی زیر سطح توالی ندارد و بنابراین به یک خانواده باکتریایی جدید تعلق دارد که ما "Ca.E. malaspinii” به عنوان گونه نوع و “Ca.Eudormicrobiaceae» به عنوان نام رسمی (اطلاعات تکمیلی).بازسازی متاژنومی مختصر Ca.پروژه ژنوم E. malaspinii با ورودی بسیار کم، توالی‌یابی متاژنومی طولانی خوانده شده و مونتاژ هدفمند یک نمونه واحد (روش‌ها) به عنوان یک کروموزوم خطی 9.63 مگابایتی با تکرار 75 کیلوبایت تایید شد.به عنوان تنها ابهام باقی مانده
برای ایجاد زمینه فیلوژنتیکی این گونه، ما 40 گونه نزدیک به هم را در نمونه‌های متاژنومی غنی شده با یوکاریوتی از سفر اقیانوس تارا از طریق بازسازی ژنوم هدفمند جستجو کردیم.به طور خلاصه، ما قرائت های متاژنومیک را به قطعات ژنومی مرتبط با "Ca.E. malaspinii» و این فرضیه را مطرح کرد که افزایش نرخ استخدام در این نمونه نشان دهنده حضور سایر بستگان (روش ها) است.در نتیجه، ما 10 MAG پیدا کردیم، ترکیبی از 19 MAG که نماینده پنج گونه در سه جنس در یک خانواده جدید تعریف شده (یعنی "Ca. Eudormicrobiaceae") است.پس از بازرسی دستی و کنترل کیفیت (داده های توسعه یافته، شکل 6 و اطلاعات اضافی)، متوجه شدیم که "Ca.گونه‌های Eudormicrobiaceae ژنوم‌های بزرگ‌تر (8 مگابایت) و پتانسیل بیوسنتزی غنی‌تر (14 تا 22 BGC در هر گونه) نسبت به سایر اعضای "Ca" دارند.Clade Eremiobacerota (تا 7 BGC) (شکل 3a-c).
a، موقعیت های فیلوژنتیکی پنج 'Ca.گونه های Eudormicrobiaceae غنای BGC مخصوص لاین های دریایی شناسایی شده در این مطالعه را نشان دادند.درخت فیلوژنتیک شامل تمام کلسیم است.MAG Eremiobacerota و اعضای دیگر phyla (اعداد ژنوم در براکت) ارائه شده در GTDB (نسخه 89) برای پس زمینه تکاملی (روش ها) استفاده شد.بیرونی ترین لایه ها نشان دهنده طبقه بندی در سطح خانواده ("Ca. Eudormicrobiaceae" و "Ca. Xenobiaceae") و در سطح کلاس ("Ca. Eremiobacteria").پنج گونه توصیف شده در این مطالعه با کدهای الفبایی و نام های دو جمله ای پیشنهادی (اطلاعات تکمیلی) نشان داده شده اند.ب، باشهگونه های Eudormicrobiaceae هفت هسته مشترک BGC دارند.عدم وجود BGC در کلاد A2 به دلیل ناقص بودن نماینده MAG بود (جدول تکمیلی 3).BGCها مختص "Ca.آمفیتومیکروبیوم» و «Ca.آمفیتومیکروبیوم» (کلاد A و B) نشان داده نشده است.ج، همه BGC ها به عنوان "Ca.Eudoremicrobium taraoceanii در 623 متاترانسکیپتوم گرفته شده از اقیانوس های تارا بیان شد.دایره های جامد نشان دهنده رونویسی فعال هستند.دایره‌های نارنجی نشان‌دهنده تغییرات چینی تغییر شکل log2 در زیر و بالاتر از نرخ بیان ژن خانه‌داری (روش‌ها) هستند.d، منحنی‌های فراوانی نسبی (روش‌ها) که «Ca» را نشان می‌دهد.گونه های Eudormicrobiaceae در بیشتر حوضه های اقیانوسی و در کل ستون آب (از سطح تا عمق حداقل 4000 متر) گسترده است.بر اساس این تخمین ها، ما دریافتیم که 'Ca.E. malaspinii تا 6 درصد از سلول های پروکاریوتی را در جوامع مرتبط با غلات پلاژیک در اعماق دریا تشکیل می دهد.ما در نظر گرفتیم که گونه‌ای در یک سایت وجود داشته باشد که در هر کسری از اندازه یک لایه عمق مشخص یافت شود.IO - اقیانوس هند، NAO - اقیانوس اطلس شمالی، NPO - اقیانوس آرام شمالی، RS - دریای سرخ، SAO - اقیانوس اطلس جنوبی، SO - اقیانوس جنوبی، SPO - اقیانوس آرام جنوبی.
مطالعه فراوانی و توزیع کلسیم.Eudormicrobiaceae، که، همانطور که متوجه شدیم، در بیشتر حوضه های اقیانوسی و همچنین در کل ستون آب غالب است (شکل 3d).به طور محلی، آنها 6٪ از جامعه میکروبی دریایی را تشکیل می دهند و آنها را به بخش مهمی از میکروبیوم دریایی جهانی تبدیل می کنند.علاوه بر این، محتوای نسبی Ca را پیدا کردیم.گونه‌های Eudormicrobiaceae و سطوح بیان BGC آن‌ها در بخش غنی‌شده یوکاریوتی بالاترین میزان بود (شکل 3c و داده‌های توسعه‌یافته، شکل 7)، که نشان‌دهنده تعامل احتمالی با ذرات معلق، از جمله پلانکتون است.این مشاهدات شباهت هایی به Ca.Eudoremicrobium BGCs که محصولات طبیعی سیتوتوکسیک را از طریق مسیرهای شناخته شده تولید می کنند، ممکن است رفتار شکاری از خود نشان دهند (اطلاعات تکمیلی و داده های گسترده، شکل 8)، شبیه به سایر شکارچیان که به طور خاص متابولیت هایی مانند Myxococcus41 را تولید می کنند.کشف Ca.Eudormicrobiaceae در نمونه‌های کمتر موجود (اعماق اقیانوس) یا یوکاریوتی به جای پروکاریوتی ممکن است توضیح دهد که چرا این باکتری‌ها و تنوع غیرمنتظره BGC آنها در زمینه تحقیقات مواد غذایی طبیعی نامشخص است.
در نهایت، ما به دنبال تایید تجربی وعده کار مبتنی بر میکروبیوم خود در کشف مسیرهای جدید، آنزیم ها و محصولات طبیعی بودیم.در میان کلاس‌های مختلف BGCها، مسیر RiPP به دلیل تغییرات مختلف پس از ترجمه پپتید هسته توسط آنزیم‌های بالغ، به عنوان کدگذاری تنوع شیمیایی و عملکردی غنی شناخته شده است.بنابراین ما دو Ca را انتخاب کردیم.Eudoremicrobium' RiPP BGCs (شکل های 3b و 4a-e) بر اساس هر BGC شناخته شده (\(\bar{d}\)MIBiG و \(\bar{d}\)RefSeq بالای 0.2) هستند.
a-c، بیان هترولوگ در شرایط آزمایشگاهی و سنجش آنزیمی آزمایشگاهی یک خوشه جدید (\(\bar{d}\)RefSeq = 0.29) از بیوسنتز RiPP خاص برای گونه های کلسیم در اعماق دریا.E. malaspinii منجر به تولید محصولات دی فسفریله شد.ج، تغییرات شناسایی شده با استفاده از MS/MS با وضوح بالا (HR) (تجزیه که با یون های b و y در ساختار شیمیایی نشان داده شده است) و NMR (داده های گسترش یافته، شکل 9).d، این پپتید فسفریله مهار میکرومولاری کم نوتروفیل الاستاز پستانداران را نشان می‌دهد، که در پپتید کنترل و پپتید آب‌گیری یافت نمی‌شود (دهیدراتاسیون ناشی از حذف شیمیایی).آزمایش سه بار انجام شد که هر سه بار نتایج مشابهی به دست آمد.به عنوان مثال، بیان هترولوگ دومین خوشه جدید \(\bar{d}\)RefSeq = 0.33) از بیوسنتز پروتئین، عملکرد چهار آنزیم بالغ را که پپتید هسته 46 اسید آمینه را تغییر می دهند، روشن می کند.باقیمانده ها بر اساس محل اصلاح پیش بینی شده توسط HR-MS/MS، برچسب گذاری ایزوتوپی و آنالیز NMR (اطلاعات تکمیلی) رنگ آمیزی می شوند.رنگ چین نشان می دهد که تغییر در هر یک از دو باقی مانده رخ می دهد.شکل تلفیقی از ساختارهای هترولوگ متعدد برای نشان دادن فعالیت تمام آنزیم های بالغ بر روی یک هسته است.h، تصویری از داده های NMR برای N-متیلاسیون آمید ستون فقرات.نتایج کامل در شکل نشان داده شده است.10 با داده های توسعه یافته.i، موقعیت فیلوژنتیکی آنزیم خوشه پروتئین FkbM بالغ در میان تمام دامنه های FkbM موجود در پایگاه داده MIBiG 2.0، آنزیمی از این خانواده را با فعالیت N-متیل ترانسفراز نشان می دهد (اطلاعات تکمیلی).نمودارهای شماتیک BGCs (a، e)، ساختارهای پپتیدی پیش ساز (b، f)، و ساختارهای شیمیایی احتمالی محصولات طبیعی (c، g) نشان داده شده است.
اولین مسیر RiPP (\(\bar{d}\)MIBiG = 0.41، \(\bar{d}\)RefSeq = 0.29) فقط در گونه های اعماق دریا "Ca.E. malaspinii» و کدهای پیش ساز پپتید (شکل 4a, b).در این آنزیم بالغ، یک حوزه عملکردی منفرد همولوگ با حوزه کم آبی سنتاز لانتی پپتید شناسایی کرده‌ایم که به طور معمول فسفوریلاسیون و حذف بعدی 43 را کاتالیز می‌کند (اطلاعات تکمیلی).بنابراین، ما پیش‌بینی می‌کنیم که اصلاح پپتید پیش‌ساز شامل چنین کم‌آبی دو مرحله‌ای است.با این حال، با استفاده از طیف سنجی جرمی پشت سر هم (MS/MS) و طیف سنجی تشدید مغناطیسی هسته ای (NMR)، ما یک پپتید خطی پلی فسفریله شده را شناسایی کردیم (شکل 4c).اگرچه غیرمنتظره بود، اما چندین خط شواهد برای حمایت از محصول نهایی یافتیم: دو میزبان هترولوگ مختلف و عدم کم آبی در سنجش های آزمایشگاهی، شناسایی باقیمانده های کلیدی جهش یافته در محل کم آبی کاتالیزوری آنزیم بالغ.همه توسط "Ca" بازسازی شده است.ژنوم E. malaspinii (داده های توسعه یافته، شکل 9 و اطلاعات اضافی) و در نهایت، فعالیت بیولوژیکی محصول فسفریله شده، اما نه شکل دهیدراته سنتز شده شیمیایی (شکل 4d).در واقع، ما متوجه شدیم که فعالیت بازدارندگی پروتئاز میکرومولاری کم در برابر نوتروفیل الاستاز، قابل مقایسه با سایر محصولات طبیعی مرتبط در محدوده غلظت (IC50 = 14.3 میکرومولار) 44 است، علیرغم این واقعیت که نقش اکولوژیکی هنوز مشخص نشده است.بر اساس این نتایج، ما پیشنهاد می کنیم که مسیر "فسفپتین" نامگذاری شود.
مورد دوم یک مسیر پیچیده RiPP مخصوص 'Ca' است.پیش‌بینی شد که جنس Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46، \(\bar{d}\)RefSeq = 0.33) محصولات پروتئین طبیعی را رمزگذاری می‌کند (شکل 4e).این مسیرها به دلیل چگالی مورد انتظار و تنوع تغییرات شیمیایی غیرعادی ایجاد شده توسط آنزیم‌های کدگذاری شده توسط BGCs45 نسبتاً کوتاه، از اهمیت بیوتکنولوژیکی خاصی برخوردار هستند.ما دریافتیم که این پروتئین با پروتئین‌هایی که قبلا مشخص شده بود تفاوت دارد زیرا فاقد هر دو موتیف اصلی NX5N پلی سرامیدها و حلقه لانتیونین لندورنامیدها است.برای غلبه بر محدودیت‌های الگوهای بیان هترولوگ رایج، ما از آنها به همراه یک سیستم Microvirgula aerodenitrificans سفارشی برای توصیف چهار آنزیم مسیر بالغ (روش) استفاده کردیم.با استفاده از ترکیبی از MS/MS، نشان‌گذاری ایزوتوپی و NMR، ما این آنزیم‌های بالغ را در هسته اسید آمینه 46 پپتید شناسایی کردیم (شکل 4f،g، داده‌های گسترده، شکل‌های 10-12 و اطلاعات اضافی).در میان آنزیم های بالغ، ما اولین ظهور یک عضو خانواده FkbM O-methyltransferase 47 را در مسیر RiPP مشخص کردیم و به طور غیر منتظره دریافتیم که این آنزیم بالغ N-متیلاسیون را به ستون فقرات معرفی می کند (شکل 4h، i و اطلاعات اضافی).اگرچه این اصلاح در محصولات طبیعی NRP48 شناخته شده است، متیلاسیون آنزیمی N پیوندهای آمیدی یک واکنش پیچیده اما از نظر بیوتکنولوژیکی مهم است49 که تاکنون مورد توجه خانواده بوروزین‌های RiPP بوده است.ویژگی 50،51.شناسایی این فعالیت در سایر خانواده‌های آنزیم‌ها و RiPP ممکن است کاربردهای جدیدی را باز کند و تنوع عملکردی پروتئین‌ها و تنوع شیمیایی آنها را گسترش دهد.بر اساس اصلاحات شناسایی شده و طول غیرمعمول ساختار محصول پیشنهادی، ما یک نام مسیر "pythonamide" را پیشنهاد می کنیم.
کشف یک آنزیم شناسی غیرمنتظره در خانواده ای از آنزیم ها با ویژگی های عملکردی، نوید ژنومیک محیطی را برای اکتشافات جدید نشان می دهد، و همچنین ظرفیت محدود برای استنتاج عملکردی را بر اساس همسانی توالی به تنهایی نشان می دهد.بنابراین، همراه با گزارش‌های پلی‌فسفریله‌شده بیواکتیو غیر متعارف، نتایج ما ارزش منابع فشرده اما حیاتی را برای تلاش‌های زیست‌شناسی مصنوعی برای کشف کامل غنای عملکردی، تنوع، و ساختارهای غیرمعمول ترکیبات بیوشیمیایی نشان می‌دهد.
در اینجا ما طیف پتانسیل بیوسنتزی کدگذاری شده توسط میکروب‌ها و زمینه ژنومی آنها را در میکروبیوم دریایی جهانی نشان می‌دهیم، و با در دسترس قرار دادن منبع حاصل برای جامعه علمی (https://microbiomics.io/ocean/) تحقیقات آینده را تسهیل می‌کنیم.ما دریافتیم که بسیاری از تازگی فیلوژنتیک و عملکردی آن را می توان تنها با بازسازی MAGs و SAGs به دست آورد، به ویژه در جوامع میکروبی استفاده نشده که می تواند تلاش های اکتشاف زیستی آینده را هدایت کند.اگر چه ما در اینجا بر روی Ca تمرکز خواهیم کرد.Eudormicrobiaceae به‌عنوان یک دودمان به‌ویژه از نظر بیوسنتزی «استعداد»، بسیاری از BGC‌های پیش‌بینی‌شده در میکروبیوتای کشف‌نشده، احتمالاً آنزیم‌شناسی‌های توصیف‌نشده قبلی را رمزگذاری می‌کنند که ترکیباتی با عملکردهای مهم زیست‌محیطی و/یا بیوتکنولوژیکی تولید می‌کنند.
مجموعه داده‌های متاژنومی از مطالعات عمده اقیانوس‌شناسی و سری‌های زمانی با عمق توالی کافی برای به حداکثر رساندن پوشش جوامع میکروبی دریایی جهانی در حوضه‌های اقیانوس، لایه‌های عمیق و در طول زمان گنجانده شدند.این مجموعه داده‌ها (جدول تکمیلی 1 و شکل 1) شامل متاژنومیکس از نمونه‌های جمع‌آوری‌شده در اقیانوس‌های تارا (غنی‌شده با ویروس، n=190؛ غنی‌شده پروکاریوتی، n=180) 12،22 و اکسپدیشن BioGEOTRACES (n=480) است.سری زمانی اقیانوسی هاوایی (HOT، n = 68)، سری زمانی برمودا-اطلس (BATS، n = 62)21 و اکسپدیشن مالاسپینا (n = 58)23.توالی‌خوانی‌ها از تمام قطعات متاژنومی برای کیفیت با استفاده از BBMap (نسخه 38.71) با حذف آداپتورهای توالی‌یابی از خوانده‌ها، حذف خواندن‌های نگاشت شده به توالی‌های کنترل کیفیت (ژنوم‌های PhiX)، و با استفاده از trimq=14، maq=20 کیفیت خواندن ضعیف را حذف کردند، فیلتر شدند. maxns = 0 و minlength = 45. تجزیه و تحلیل های بعدی در صورت مشخص شدن با QC خوانده شده اجرا یا ادغام شدند (bbmerge.sh minoverlap=16).قرائت‌های QC (هدف bbnorm.sh = 40، عمق ذهن = 0) قبل از ساخت با استفاده از metaSPAdes (در صورت نیاز v.3.11.1 یا v.3.12) نرمال شد.کانتیگ های داربست حاصل (که از این پس داربست نامیده می شود) در نهایت بر اساس طول (≥1 کیلوبایت) فیلتر شدند.
1038 نمونه متاژنومی به گروه‌ها تقسیم شدند و برای هر گروه از نمونه‌ها، قرائت‌های کنترل کیفیت متاژنومی تمام نمونه‌ها با براکت‌های هر نمونه به طور جداگانه تطبیق داده شد و در نتیجه تعداد گروه‌های براکت‌شده به صورت زوجی به‌دست آمد: ویروس‌های دریایی تارا – غنی‌شده (190×190)، پروکاریوت های غنی شده (180×180)، BioGEOTRACES، HOT و BATS (610×610) و مالاسپینا (58×58).نقشه برداری با استفاده از Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 انجام شد که اجازه می دهد خوانش ها با سایت های ثانویه مطابقت داده شوند (با استفاده از پرچم -a).ترازها به گونه ای فیلتر شدند که حداقل 45 پایه طول داشته باشند، دارای ≥97% هویت و دهانه ≥80% خوانده شوند.فایل های BAM به دست آمده با استفاده از اسکریپت jgi_summarize_bam_contig_depths برای MetaBAT2 (v.2.12.1)55 پردازش شدند تا پوشش درون و بین نمونه ای برای هر گروه فراهم شود.در نهایت، براکت‌ها برای افزایش حساسیت با اجرای جداگانه MetaBAT2 روی همه نمونه‌ها با –minContig 2000 و –maxEdges 500 گروه‌بندی شدند.و 10 تا 50 برابر سریعتر از سایر بوکسورهای رایج 57.برای آزمایش تأثیر همبستگی‌های فراوانی، یک نمونه فرعی از متاژنومیکس (10 مورد برای هر یک از دو مجموعه داده اقیانوس تارا، 10 برای BioGEOTRACES، 5 برای هر سری زمانی و 5 برای Malaspina) فقط از نمونه‌ها استفاده کرد.نمونه های داخلی برای به دست آوردن اطلاعات پوشش گروه بندی می شوند.(اطلاعات تکمیلی).
ژنوم های اضافی (خارجی) در تجزیه و تحلیل بعدی گنجانده شدند، یعنی 830 MAG انتخاب شده به صورت دستی از زیرمجموعه ای از مجموعه داده Tara Oceans26، 5287 SAG از مجموعه داده GORG20، و داده ها از پایگاه داده MAR (MarDB v. 4) از 1707 REF جدا شده و 682 SAGs) 27. برای مجموعه داده MarDB، اگر نوع نمونه با عبارت منظم زیر مطابقت داشته باشد، ژنوم ها بر اساس فراداده های موجود انتخاب می شوند: '[S|s]single.?[C|c]ell|[C|c]culture| [I|i] منزوی'.
کیفیت هر ظرف متاژنومی و ژنوم های خارجی با استفاده از CheckM (v.1.0.13) و Anvi'o's Lineage Workflow (v.5.5.0)58،59 ارزیابی شد.اگر CheckM یا Anvi'o ≥50% کامل بودن/کامل بودن و ≤10% آلودگی/ افزونگی را گزارش کردند، سلول های متاژنومی و ژنوم های خارجی را برای تجزیه و تحلیل بعدی ذخیره کنید.سپس این نمرات به میانگین کامل (mcpl) و میانگین آلودگی (mctn) برای طبقه‌بندی کیفیت ژنوم بر اساس معیارهای جامعه60 به شرح زیر ترکیب شدند: کیفیت بالا: mcpl ≥ 90% و mctn ≤ 5%؛کیفیت خوب: mcpl ≥ 70٪، mctn ≤ 10٪، کیفیت متوسط: mcpl ≥ 50٪ و mctn ≤ 10٪، کیفیت منصفانه: mcpl ≤ 90٪ یا mctn ≥ 10٪.سپس ژنوم های فیلتر شده با نمرات کیفیت (Q و Q') به صورت زیر همبستگی داشتند: Q = mcpl - 5 x mctn Q' = mcpl - 5 x mctn + mctn x (تنوع کرنش)/100 + 0.5 x log[N50].(در dRep61 پیاده سازی شده است).
برای اجازه دادن به تجزیه و تحلیل مقایسه ای بین منابع داده های مختلف و انواع ژنوم (MAG، SAG و REF)، 34799 ژنوم بر اساس میانگین هویت نوکلئوتیدی در سراسر ژنوم (ANI) با استفاده از dRep (v.2.5.4) ارجاع داده نشدند.تکرار)61 با 95% آستانه ANI28،62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) و ژن‌های نشانگر تک نسخه‌ای با استفاده از SpecI63 که خوشه‌بندی ژنوم را در سطح گونه ارائه می‌کند.یک ژنوم نماینده برای هر خوشه dRep با توجه به حداکثر امتیاز کیفیت (Q') تعریف شده در بالا انتخاب شد که نماینده گونه در نظر گرفته شد.
برای ارزیابی سرعت نقشه برداری، BWA (v.0.7.17-r1188, -a) برای نقشه برداری از تمام 1038 مجموعه خوانده شده متاژنومی با 34799 ژنوم موجود در OMD استفاده شد.قرائت های کنترل شده با کیفیت در حالت تک انتها نقشه برداری شدند و ترازهای حاصل فیلتر شدند تا فقط ترازهایی به طول ≥45 جفت باز باقی بمانند.و هویت ≥95٪.نسبت نمایش برای هر نمونه، درصد خوانش های باقی مانده پس از فیلتراسیون تقسیم بر تعداد کل قرائت های کنترل کیفیت است.با استفاده از همین رویکرد، هر یک از 1038 متاژنوم به 5 میلیون درج کاهش یافت (داده های گسترش یافته، شکل 1c) و با GORG SAG در OMD و در همه GEM16 مطابقت یافت.مقدار MAGهای بازیابی شده از آب دریا در کاتالوگ GEM16 با پرس و جوهای کلیدواژه منابع متاژنومیک، انتخاب نمونه های آب دریا (به عنوان مثال، برخلاف رسوبات دریایی) تعیین شد.به طور خاص، "آبزی" را به عنوان "رده_اکوسیستم"، "دریایی" را به عنوان "نوع_اکوسیستم" و "زیستگاه" را به عنوان "اقیانوس عمیق"، "دریایی"، "اقیانوس دریایی دریایی"، "دریایی دریایی، "آب دریایی" فیلتر می کنیم. «اقیانوس»، «آب دریا»، «آب دریای سطحی»، «آب دریای سطحی».این منجر به 5903 MAG (734 با کیفیت بالا) شد که در 1823 OTU توزیع شد (اینجا مشاهده کنید).
ژنوم‌های پروکاریوتی با استفاده از GTDB-Tk (v.1.0.2)64 با پارامترهای پیش‌فرض که GTDB r89 نسخه 13 را هدف قرار می‌دهند به صورت طبقه‌بندی مشروح شدند. Anvi'o برای شناسایی ژنوم‌های یوکاریوتی بر اساس پیش‌بینی دامنه و فراخوانی ≥50% و افزونگی ≤ استفاده شد.حاشیه نویسی طبقه بندی یک گونه به عنوان یکی از ژنوم های نماینده آن تعریف می شود.به استثنای یوکاریوت‌ها (148 MAG)، هر ژنوم ابتدا با استفاده از prokka (v.1.14.5)65، نام‌گذاری ژن‌های کامل، تعریف پارامترهای «archaea» یا «باکتری‌ها» در صورت نیاز، که برای غیر غیرمجاز نیز گزارش شده است، از نظر عملکردی حاشیه‌نویسی شد. ژن های کد کنندهو مناطق CRISPR، در میان سایر ویژگی های ژنومی.ژن‌های پیش‌بینی‌شده را با شناسایی ژن‌های نشانگر تک‌کپی جهانی (uscMG) با استفاده از fetchMG (v.1.2)66، اختصاص گروه‌های ارتولوگ و پرس و جو با استفاده از emapper (v.2.0.1)67 بر اساس eggNOG (v.5.0)68 حاشیه‌نویسی کنید.پایگاه داده KEGG (منتشر شده در 10 فوریه 2020) 69. آخرین مرحله با تطبیق پروتئین ها با پایگاه داده KEGG با استفاده از DIAMOND (v.0.9.30)70 با پرس و جو و پوشش موضوعی ≥70% انجام شد.نتایج بیشتر بر اساس NCBI Prokaryotic Genome Annotation Pipeline71 بر اساس میزان بیت ≥ 50 درصد حداکثر میزان بیت مورد انتظار (خود پیوند) فیلتر شدند.توالی‌های ژنی نیز به عنوان ورودی برای شناسایی BGCها در ژنوم با استفاده از antiSMASH (v.5.1.0)72 با پارامترهای پیش‌فرض و انفجارهای خوشه‌ای مختلف استفاده شد.همه ژنوم ها و حاشیه نویسی ها به همراه ابرداده های متنی موجود در وب (https://microbiomics.io/ocean/) در OMD گردآوری شده اند.
مشابه روش‌های توصیف‌شده قبلی12،22، ما از CD-HIT (v.4.8.1) برای خوشه‌بندی بیش از 56.6 میلیون ژن کدکننده پروتئین از ژنوم‌های باکتریایی و باستانی از OMD به 95 درصد هویت و ژن‌های کوتاه‌تر (90 درصد پوشش) استفاده کردیم. بیش از 17.7 میلیون خوشه ژنیطولانی ترین توالی به عنوان ژن نماینده برای هر خوشه ژن انتخاب شد.سپس 1038 متاژنوم با بیش از 17.7 میلیون عضو خوشه BWA (-a) مطابقت داده شد و فایل‌های BAM حاصل فیلتر شدند تا فقط ترازهایی با 95% هویت و ≥45 تراز پایه را حفظ کنند.فراوانی ژن نرمال شده با طول ابتدا با شمارش درج‌ها از بهترین هم‌ترازی منحصربه‌فرد و سپس برای درج‌های نقشه‌برداری فازی، با اضافه کردن تعداد کسری به ژن‌های هدف مربوطه متناسب با تعداد درج‌های منحصربه‌فرد، محاسبه شد.
ژنوم های OMD گسترش یافته (با MAG های اضافی از "Ca. Eudormicrobiaceae"، در زیر ببینید) به پایگاه داده ابزار تجزیه و تحلیل متاژنومی mOTUs74 (نسخه 2.5.1) اضافه شد تا یک پایگاه داده مرجع mOTU توسعه یافته ایجاد شود.تنها شش ژنوم تک کپی (23528 ژنوم) از ده uscMG زنده ماندند.گسترش پایگاه داده منجر به 4494 خوشه اضافی در سطح گونه شد.1038 متاژنوم با استفاده از پارامترهای پیش‌فرض mOTU (v.2) آنالیز شدند.در مجموع 989 ژنوم موجود در 644 خوشه mOTU (95٪ REF، 5٪ SAG و 99.9٪ متعلق به MarDB) توسط پروفایل mOTU شناسایی نشدند.این منعکس کننده منابع اضافی مختلف جداسازی دریایی ژنوم های MarDB است (بیشتر ژنوم های کشف نشده با ارگانیسم های جدا شده از رسوبات، میزبان های دریایی و غیره مرتبط هستند).برای ادامه تمرکز بر محیط اقیانوس باز در این مطالعه، آنها را از تجزیه و تحلیل پایین دست حذف کردیم، مگر اینکه در پایگاه داده توسعه یافته mOTU ایجاد شده در این مطالعه شناسایی یا گنجانده شوند.
همه BGCها از MAG، SAG و REF در OMD (نگاه کنید به بالا) با BGCهای شناسایی شده در همه داربست های متاژنومی (antiSMASH v.5.0، پارامترهای پیش فرض) ترکیب شدند و با استفاده از BiG-SLICE (v.1.1) (دامنه PFAM )75 مشخص شدند.بر اساس این ویژگی‌ها، ما تمام فاصله‌های کسینوس بین BGCها را محاسبه کرده و آنها را (پیوندهای میانگین) به ترتیب با استفاده از آستانه‌های فاصله 0.2 و 0.8 به GCF و GCC گروه‌بندی کردیم.این آستانه‌ها انطباق آستانه‌هایی هستند که قبلاً با استفاده از فاصله اقلیدسی ۷۵ همراه با فاصله کسینوس استفاده می‌شدند، که برخی از خطاها را در استراتژی اصلی خوشه‌بندی BiG-SLICE (اطلاعات تکمیلی) کاهش می‌دهد.
سپس BGCها فیلتر شدند تا فقط ≥5 کیلوبایت کدگذاری شده روی داربست ها را حفظ کنند تا خطر تکه تکه شدن همانطور که قبلاً توضیح داده شد کاهش یابد (16).این باعث شد که در مجموع 39055 BGC توسط ژنوم OMD کدگذاری شوند و 14106 اضافی روی قطعات متاژنومی شناسایی شدند (یعنی در MAGها ترکیب نشده اند).این BGCهای "متاژنومیک" برای تخمین نسبت پتانسیل بیوسنتز میکروبیوم دریایی که در پایگاه داده (اطلاعات تکمیلی) ثبت نشده استفاده شد.هر BGC از نظر عملکردی با توجه به انواع محصول پیش‌بینی شده توسط دسته‌های محصول ضد SMASH یا درشت‌تر تعریف شده در BiG-SCAPE76 مشخص شد.برای جلوگیری از سوگیری نمونه‌گیری در کمی‌سازی (ترکیب طبقه‌بندی و عملکردی GCC/GCF، فاصله GCF و GCC تا پایگاه‌های داده مرجع، و فراوانی متاژنومی GCF)، با نگه داشتن تنها طولانی‌ترین BGC در هر GCF برای هر گونه، 39055 BGC بیشتر حذف شد. در مجموع 17689 BGC به دست آمد.
جدید بودن GCC و GCF بر اساس فاصله بین پایگاه داده محاسبه شده (پایگاه داده RefSeq در BiG-FAM)29 و تأیید تجربی (MIBIG 2.0) 30 BGC ارزیابی شد.برای هر یک از 17689 BGC نماینده، ما کوچکترین فاصله کسینوس تا پایگاه داده مربوطه را انتخاب کردیم.سپس این حداقل فاصله ها بر اساس GCF یا GCC، در صورت لزوم، میانگین (میانگین) می شوند.یک GCF جدید در نظر گرفته می شود اگر فاصله تا پایگاه داده بزرگتر از 0.2 باشد که مربوط به جدایی ایده آل بین GCF (متوسط) و مرجع است.برای GCC، ما 0.4 را انتخاب می کنیم که دو برابر آستانه تعریف شده توسط GCF است تا در یک رابطه طولانی مدت با پیوندها قفل شود.
فراوانی متاژنومی BGC به‌عنوان میانگین فراوانی ژن‌های بیوسنتزی آن (همانطور که توسط anti-SMASH تعیین می‌شود) در دسترس از پروفایل‌های سطح ژن برآورد شد.سپس فراوانی متاژنومی هر GCF یا GCC به عنوان مجموع BGCهای نماینده (از 17689) محاسبه شد.این نقشه‌های فراوانی متعاقباً برای ترکیب سلولی با استفاده از تعداد mOTU در هر نمونه نرمال‌سازی شدند، که تلاش‌های توالی‌یابی را نیز به حساب می‌آورد (داده‌های گسترده، شکل 1d).شیوع GCF یا GCC به عنوان درصد نمونه‌های با فراوانی > 0 محاسبه شد.
فاصله اقلیدسی بین نمونه ها از پروفایل نرمال شده GCF محاسبه شد.اندازه این فواصل با استفاده از UMAP77 کاهش یافت و تعبیه‌های حاصل برای خوشه‌بندی مبتنی بر چگالی بدون نظارت با استفاده از HDBSCAN78 استفاده شد.حداقل تعداد نقاط بهینه برای یک خوشه (و در نتیجه تعداد خوشه ها) مورد استفاده توسط HDBSCAN با به حداکثر رساندن احتمال تجمعی عضویت در خوشه تعیین می شود.خوشه‌های شناسایی‌شده (و یک نمونه فرعی متوازن تصادفی از این خوشه‌ها برای در نظر گرفتن سوگیری در تحلیل واریانس چند متغیره جایگشتی (PERMANOVA)) برای اهمیت در برابر فواصل اقلیدسی کاهش‌یافته با استفاده از PERMANOVA مورد آزمایش قرار گرفتند.میانگین اندازه ژنوم نمونه ها بر اساس فراوانی نسبی mOTU و اندازه ژنوم تخمینی اعضای ژنوم ها محاسبه شد.به طور خاص، میانگین اندازه ژنوم هر MOTU به عنوان میانگین اندازه ژنوم اعضای آن که برای کامل بودن تصحیح شد (پس از فیلتر کردن) برآورد شد (به عنوان مثال، یک ژنوم کامل 75 درصد با طول 3 مگابایت دارای اندازه تنظیم شده 4 است. MB).برای ژنوم های متوسط ​​با یکپارچگی ≥70٪.سپس میانگین اندازه ژنوم برای هر نمونه به عنوان مجموع اندازه‌های ژنوم mOTU با وزن فراوانی نسبی محاسبه شد.
مجموعه ای فیلتر شده از BGC های کدگذاری شده با ژنوم در OMD در درختان GTDB باکتریایی و باستانی (در چارچوب های ۵ کیلوبایتی، به استثنای REF و SAG MarDB که در ۱۰۳۸ متاژنوم یافت نشد، در بالا مشاهده نمی شود) و دسته های محصول پیش بینی شده آنها بر اساس فیلوژنتیک نشان داده شده است. موقعیت ژنوم (به بالا مراجعه کنید).ما ابتدا داده ها را بر اساس گونه کاهش دادیم، با استفاده از ژنوم با بیشترین BGC در آن گونه به عنوان نماینده.برای تجسم، نمایندگان بیشتر به گروه‌های درختی تقسیم شدند و دوباره برای هر کلاد سلولی، ژنوم حاوی بیشترین تعداد BGC به عنوان نماینده انتخاب شد.گونه های غنی شده با BGC (حداقل یک ژنوم با بیش از 15 BGCs) با محاسبه شاخص تنوع شانون برای انواع محصول کدگذاری شده در آن BGCها بیشتر مورد تجزیه و تحلیل قرار گرفتند.اگر همه انواع محصولات پیش‌بینی‌شده یکسان باشند، هیبریدهای شیمیایی و سایر BGCهای پیچیده (که توسط anti-SMAH پیش‌بینی می‌شود) صرف نظر از ترتیب آنها در خوشه (مثلاً همجوشی پروتئین-باکتریوسین و باکتریوسین-پروتئوپروتئین) متعلق به یک نوع محصول در نظر گرفته می‌شوند. بدن).ترکیبی).
DNA باقیمانده (تخمین زده شده 6 نانوگرم) از نمونه Malaspina MP1648، مربوط به نمونه بیولوژیکی SAMN05421555 و مطابق با مجموعه خواندن متاژنومیک Illumina SRR3962772 برای خواندن کوتاه، پردازش شده بر اساس پروتکل توالی یابی PacBio با ورودی بسیار کم kmplit، یک نمونه ورودی PacBibeo برای استفاده از PacNARTD کیت (100-980-000) و کیت آماده سازی قالب SMRTbell Express 2.0 (900-938-100).به طور خلاصه، DNA باقیمانده با استفاده از کوواریس (g-TUBE، 52104) بریده، ترمیم و خالص شد (دانه‌های ProNex).سپس DNA خالص شده در معرض آماده سازی کتابخانه، تقویت، خالص سازی (دانه های ProNex) و انتخاب اندازه (> 6 کیلوبایت، آبی پیپین) قبل از مرحله خالص سازی نهایی (دانه های ProNex) و تعیین توالی بر روی پلت فرم Sequel II قرار می گیرد.
بازسازی دو حدود اول.برای MAG Eremiobacerota، ما شش ANI اضافی بیش از 99% شناسایی کردیم (اینها در شکل 3 آمده است)، که در ابتدا بر اساس نمرات آلودگی فیلتر شدند (بعدها به عنوان تکرار ژن شناسایی شدند، به زیر مراجعه کنید).ما همچنین یک سینی با برچسب "Ca" پیدا کردیم.Eremiobacerota» از مطالعات مختلف23 و آنها را همراه با هشت MAG از مطالعه ما به عنوان مرجعی برای خواندن متاژنومی از 633 نمونه غنی شده با یوکاریوت (> 0.8 میکرومتر) با استفاده از BWA (v.0.7.17) Ref -r1188، - یک پرچم) برای نمونه برداری استفاده کردیم. نقشه برداری (5 میلیون خوانده شده).بر اساس نقشه‌های خاص غنی‌سازی (فیلتر شده با ۹۵٪ هویت تراز و ۸۰٪ پوشش خواندن)، ۱۰ متاژنوم (پوشش مورد انتظار ≥۵×) برای مونتاژ و ۴۹ متاژنوم اضافی (پوشش مورد انتظار ≥1×) برای همبستگی محتوا انتخاب شدند.با استفاده از پارامترهای مشابه بالا، این نمونه‌ها جمع شدند و 10 کلسیم اضافی اضافه شد.MAG Eremiobacerota بازسازی شده است.این 16 MAG (بدون احتساب دو مورد از قبل در پایگاه داده) تعداد کل ژنوم ها را در OMD گسترش یافته به 34815 می رساند.MAGها بر اساس شباهت ژنومی و موقعیت آنها در GTDB رتبه های طبقه بندی می شوند.18 MAG با استفاده از dRep به 5 گونه (ANI درون گونه ای > 99٪) و 3 جنس (ANI درون ژنی 85٪ تا 94٪) در همان خانواده حذف شدند.نمایندگان گونه ها به صورت دستی بر اساس یکپارچگی، آلودگی و N50 انتخاب شدند.نامگذاری پیشنهادی در اطلاعات تکمیلی ارائه شده است.
یکپارچگی و آلودگی 'Ca' را ارزیابی کنید.MAG Eremiobacerota، ما حضور uscMG و همچنین مجموعه‌های ژن نشانگر تک‌نسخه‌ای اختصاصی و دامنه‌ای را که توسط CheckM و Anvi'o استفاده می‌شوند، ارزیابی کردیم.شناسایی 2 تکرار از 40 uscMG با بازسازی فیلوژنتیک (به زیر مراجعه کنید) برای رد هرگونه آلودگی بالقوه تأیید شد (این معادل 5٪ بر اساس این 40 ژن نشانگر است).یک مطالعه اضافی از پنج نماینده MAGs 'Ca.سطح پایین آلاینده‌ها در این ژنوم‌های بازسازی‌شده برای گونه‌های Eremiobacerota با استفاده از رابط تعاملی Anvi'o بر اساس فراوانی و همبستگی‌های ترکیب توالی (اطلاعات تکمیلی) تأیید شد.
برای تجزیه و تحلیل فیلوژنومیک، ما پنج MAG نماینده "Ca" را انتخاب کردیم.Eudormicrobiaceae، همه گونه های "Ca.ژنوم ارمیوباکتروتا و اعضای دیگر شاخه ها (از جمله UBP13، Armatimonadota، Patescibacteria، Dormibbacerota، Chloroflexota، Cyanobacteria، Actinobacteria و Planctomycetota) از GTDB (r89)13 در دسترس است.همه این ژنوم ها همانطور که قبلا برای استخراج ژن نشانگر تک نسخه ای و حاشیه نویسی BGC شرح داده شد، حاشیه نویسی شدند.ژنوم های GTDB با توجه به یکپارچگی و معیارهای آلودگی فوق حفظ شدند.تجزیه و تحلیل فیلوژنتیک با استفاده از گردش کار Anvi'o Phylogenetics59 انجام شد.درخت با استفاده از IQTREE (v.2.0.3) (گزینه‌های پیش‌فرض و -bb 1000)80 روی هم‌ترازی 39 پروتئین ریبوزومی پشت سر هم که توسط Anvi'o (MUSCLE, v.3.8.1551) شناسایی شده‌اند، ساخته شد.موقعیت های او کاهش یافت.برای پوشش حداقل 50 درصد از ژنوم 82 و Planctomycecota به عنوان یک گروه برون بر اساس توپولوژی درخت GTDB استفاده شد.یک درخت از 40 uscMG با استفاده از ابزارها و پارامترهای مشابه ساخته شد.
ما از Traitar (v.1.1.2) با پارامترهای پیش‌فرض (فنوتیپ، از نوکلئوتیدها)83 برای پیش‌بینی صفات میکروبی رایج استفاده کردیم.ما یک سبک زندگی شکارچی بالقوه را بر اساس یک شاخص شکارچی که قبلا توسعه یافته بود بررسی کردیم که به محتوای یک ژن کد کننده پروتئین در ژنوم بستگی دارد.به طور خاص، ما از DIAMOND برای مقایسه پروتئین‌های موجود در ژنوم در مقابل پایگاه داده OrthoMCL (v.4)85 با استفاده از گزینه‌های –حساس‌تر –id 25 –query-cover 70 –subject-cover 70 –top 20 و شمارش ژن‌های مربوط به ژن های نشانگر برای شکارچیان و غیر شکارچیان.شاخص تفاوت بین تعداد نشانه های شکاری و غیر شکارچی است.به عنوان یک کنترل اضافی، ما همچنین ژنوم "Ca" را تجزیه و تحلیل کردیم.عامل Entotheonella TSY118 بر اساس ارتباط آن با Ca است.Eudoremicrobium (اندازه ژنوم بزرگ و پتانسیل بیوسنتزی).در مرحله بعد، ما پیوندهای بالقوه بین ژن های نشانگر شکارچی و غیر شکارچی و پتانسیل بیوسنتزی کلسیم را آزمایش کردیم.Eudormicrobiaceae» و دریافتند که بیش از یک ژن (از هر نوع ژن نشانگر، یعنی ژن شکارگر/غیر شکارگر) با BGC همپوشانی ندارد، که نشان می‌دهد BGC سیگنال‌های شکار را مخدوش نمی‌کند.حاشیه نویسی ژنومی اضافی از replicon های درهم با استفاده از TXSSCAN (v.1.0.2) برای بررسی خاص سیستم ترشح، pili و flagella86 انجام شد.
پنج نماینده Ca با نقشه برداری از 623 متاترانسکریپتوم از بخش های غنی سازی پروکاریوتی و یوکاریوتی اقیانوس های تارا 22،40،87 (با استفاده از BWA، v.0.7.17-r1188، -a flag) نقشه برداری شدند.ژنوم Eudormicrobiaceae.فایل‌های BAM با FeatureCounts (v.2.0.1)88 پس از 80% پوشش خواندن و 95% فیلتر هویت پردازش شدند (با ویژگی گزینه‌های Counts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) شمارش می‌کند تعداد درج در هر ژننقشه های تولید شده برای طول ژن و فراوانی ژن نشانگر mOTU نرمال سازی شدند (متوسط ​​تعداد درج با طول نرمال شده برای ژن هایی با تعداد درج > 0) و به 74/22 تبدیل شدند تا بیان نسبی در هر سلول از هر سطح ژن به دست آید، که همچنین توضیح می دهد تنوع از نمونه به نمونه در طول توالی یابیچنین نسبت‌هایی امکان تجزیه و تحلیل مقایسه‌ای را فراهم می‌کند و مشکلات ترکیب را هنگام استفاده از داده‌های فراوانی نسبی کاهش می‌دهد.فقط نمونه هایی با بیش از 5 ژن از 10 ژن نشانگر mOTU برای تجزیه و تحلیل بیشتر در نظر گرفته شدند تا بتوان بخش بزرگی از ژنوم را تشخیص داد.
نمایه رونوشت نرمال شده Ca.E. taraoceanii در معرض کاهش ابعاد با استفاده از UMAP قرار گرفت و نمایش حاصل برای خوشه‌بندی بدون نظارت با استفاده از HDBSCAN (به بالا مراجعه کنید) برای تعیین وضعیت بیان استفاده شد.PERMANOVA اهمیت تفاوت بین خوشه های شناسایی شده را در فضای فاصله اصلی (نه کاهش یافته) آزمایش می کند.بیان تفاوت بین این شرایط در سراسر ژنوم مورد آزمایش قرار گرفت (به بالا مراجعه کنید) و 201 مسیر KEGG در 6 گروه عملکردی شناسایی شد، به نام‌های: BGC، سیستم ترشحی و ژن‌های تاژکدار از TXSSCAN، آنزیم‌های تخریب (پروتئاز و پپتیدازها)، و شکارچی و غیر شکاری ژن های شکارچینشانگرهای شاخص شکارچیبرای هر نمونه، میانگین بیان نرمال شده را برای هر کلاس محاسبه کردیم (توجه داشته باشید که خود بیان BGC به عنوان میانگین بیان ژن های بیوسنتزی برای آن BGC محاسبه می شود) و برای اهمیت در بین حالت ها آزمایش شد (تست Kruskal-Wallis تنظیم شده برای FDR).
ژن های مصنوعی از GenScript و پرایمرهای PCR از Microsynth خریداری شدند.پلیمراز فوژن از Thermo Fisher Scientific برای تکثیر DNA استفاده شد.برای خالص سازی DNA از پلاسمیدهای NucleoSpin، ژل NucleoSpin و کیت خالص سازی PCR از Macherey-Nagel استفاده شد.آنزیم های محدود کننده و T4 DNA لیگاز از New England Biolabs خریداری شد.مواد شیمیایی به غیر از ایزوپروپیل-β-d-1-تیوگالاکتوپیرانوسید (IPTG) (Biosynth) و 1،4-دی تیوتریتول (DTT، AppliChem) از Sigma-Aldrich خریداری شدند و بدون خالص سازی بیشتر مورد استفاده قرار گرفتند.آنتی بیوتیک های کلرامفنیکل (Cm)، اسپکتینومایسین دی هیدروکلراید (Sm)، آمپی سیلین (Amp)، جنتامایسین (Gt) و کاربنی سیلین (Cbn) از AppliChem خریداری شدند.اجزای رسانه ای Bacto Tryptone و Bacto Yeast Extract از BD Biosciences خریداری شدند.تریپسین برای توالی یابی از پرومگا خریداری شد.
توالی های ژنی از BGC 75.1 ضد SMASH استخراج شد.E. malaspinii (اطلاعات تکمیلی).
ژن‌های embA (منبع، MALA_SAMN05422137_METAG-framework_127-gene_5)، embM (منبع، MALA_SAMN05422137_METAG-framework_127-gene_4)، و embAM (شامل نواحی بین‌ژنی) بدون هم‌سازه‌ها (شامل نواحی بین‌ژنی) با همگام‌سازی‌شده و نواحی بین‌ژنی به‌عنوان ترکیب‌بندی شدند. برای بیان در E چه زمانی.ژن embA در اولین سایت شبیه‌سازی چندگانه (MCS1) pACYCDuet-1 (CmR) و pCDFDuet-1 (SmR) با سایت‌های برش BamHI و HindIII سابکلون شد.ژن‌های embM و embMopt (بهینه‌سازی شده با کدون) در MCS1 pCDFDuet-1 (SmR) با BamHI و HindIII ساب کلون شدند و در دومین سایت شبیه‌سازی چندگانه pCDFDuet-1 (SmR) و pRSFDuet-1 (KanR) (MCS2) قرار گرفتند. NdeI/ChoI.کاست embAM در pCDFDuet1 (SmR) با سایت‌های برش BamHI و HindIII سابکلون شد.ژن orf3/embI (موقعیت، MALA_SAMN05422137_METAG-scaffold_127-gene_3) با استفاده از PCR پسوند همپوشانی با استفاده از پرایمرهای EmbI_OE_F_NdeI و EmbI_OE_R_XhoI، هضم شده با NdeI و با استفاده از NdeI/Dliget به p همان آنزیم های محدود کننده (مکمل جدول).6).هضم و بستن آنزیم محدود طبق پروتکل سازنده (New England Biolabs) انجام شد.

 


زمان ارسال: مارس-14-2023