از بازدید شما از Nature.com سپاسگزاریم.شما از یک نسخه مرورگر با پشتیبانی محدود CSS استفاده می کنید.برای بهترین تجربه، توصیه می کنیم از یک مرورگر به روز شده استفاده کنید (یا حالت سازگاری را در اینترنت اکسپلورر غیرفعال کنید).علاوه بر این، برای اطمینان از پشتیبانی مداوم، سایت را بدون استایل و جاوا اسکریپت نشان میدهیم.
اسلایدرهایی که سه مقاله را در هر اسلاید نشان می دهند.برای حرکت در اسلایدها از دکمه های پشت و بعدی استفاده کنید یا از دکمه های کنترلر اسلاید در انتها برای حرکت در هر اسلاید استفاده کنید.
توضیحات کامل محصول
304 لوله / لوله سیم پیچ فولادی ضد زنگ
1. مشخصات: لوله سیم پیچ فولادی ضد زنگ / لوله
2. نوع: جوش داده شده یا بدون درز
3. استاندارد: ASTM A269، ASTM A249
4. لوله سیم پیچ فولادی ضد زنگ OD: 6 میلی متر تا 25.4 میلی متر
5. طول: 600-3500MM یا طبق نیاز مشتری.
6. ضخامت دیوار: 0.2mm تا 2.0mm.
7. تحمل: OD: +/-0.01mm;ضخامت: +/-0.01٪.
8. اندازه سوراخ داخلی کویل: 500MM-1500MM (با توجه به نیاز مشتری قابل تنظیم است)
9. ارتفاع سیم پیچ: 200MM-400MM (با توجه به نیاز مشتری قابل تنظیم است)
10. سطح: روشن یا بازپخت
11. مواد: 304، 304L، 316L، 321، 301، 201، 202، 409، 430، 410، آلیاژ 625، 825، 2205، 2507، و غیره.
12. بسته بندی: کیسه های بافته شده در جعبه چوبی، پالت چوبی، شفت چوبی یا مطابق با نیاز مشتری
13. تست: جزء شیمیایی، استحکام تسلیم، استحکام کششی، اندازه گیری سختی
14. گارانتی: بازرسی شخص ثالث (به عنوان مثال :SGS TV ) و غیره.
15. کاربرد: دکوراسیون، مبلمان، حمل و نقل روغن، مبدل حرارتی، ساخت نرده، ساخت کاغذ، خودرو، پردازش مواد غذایی، پزشکی و غیره.
تمام ترکیبات شیمیایی و خواص فیزیکی فولاد ضد زنگ به شرح زیر:
مواد | ASTM A269 ترکیب شیمیایی % حداکثر | ||||||||||
C | Mn | P | S | Si | Cr | Ni | Mo | NB | Nb | Ti | |
TP304 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 18.0-20.0 | 8.0-11.0 | ^ | ^ | ^ . | ^ |
TP304L | 0.035 | 2.00 | 0.045 | 0.030 | 1.00 | 18.0-20.0 | 8.0-12.0 | ^ | ^ | ^ | ^ |
TP316 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 16.0-18.0 | 10.0-14.0 | 2.00-3.00 | ^ | ^ | ^ |
TP316L | 0.035 D | 2.00 | 0.045 | 0.030 | 1.00 | 16.0-18.0 | 10.0-15.0 | 2.00-3.00 | ^ | ^ | ^ |
TP321 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 17.0-19.0 | 9.0-12.0 | ^ | ^ | ^ | 5C -0.70 |
TP347 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 17.0-19.0 | 9.0-12.0 | 10C -1.10 | ^ |
مواد | حرارت درمانی | دمای F (C) حداقل. | سختی | |
برینل | راکول | |||
TP304 | راه حل | 1900 (1040) | 192HBW/200HV | 90HRB |
TP304L | راه حل | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316 | راه حل | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316L | راه حل | 1900 (1040) | 192HBW/200HV | 90HRB |
TP321 | راه حل | 1900 (1040) F | 192HBW/200HV | 90HRB |
TP347 | راه حل | 1900 (1040) | 192HBW/200HV | 90HRB |
OD، اینچ | اینچ تحمل OD (mm) | % تحمل WT | تحمل طول اینچ (میلی متر) | |
+ | - | |||
≤ 1/2 | 0.005 ± (0.13) | ± 15 | 1/8 ( 3.2 ) | 0 |
> 1/2 ~ 1 1/2 | 0.005 ± (0.13) | ± 10 | 1/8 (3.2) | 0 |
> 1 1/2 ~< 3 1/2 | 0.010 ± (0.25) | ± 10 | 3 / 16 (4.8) | 0 |
> 3 1/2 ~< 5 1/2 | 0.015 ± (0.38) | ± 10 | 3 / 16 (4.8) | 0 |
> 5 1/2 ~< 8 | 0.030 ± (0.76) | ± 10 | 3 / 16 (4.8) | 0 |
8 ~ < 12 | 0.040 ± (1.01) | ± 10 | 3 / 16 (4.8) | 0 |
12 ~ < 14 | 0.050 ± (1.26) | ± 10 | 3 / 16 (4.8) | 0 |
جوامع میکروبی طبیعی از نظر فیلوژنتیکی و متابولیکی متنوع هستند.این تنوع علاوه بر گروههای موجودات که کمتر مورد مطالعه قرار گرفتهاند، پتانسیل غنی برای کشف آنزیمها و ترکیبات بیوشیمیایی مهم از نظر زیستمحیطی و بیوتکنولوژیکی دارد.با این حال، مطالعه این تنوع برای تعیین مسیرهای ژنومی که چنین ترکیباتی را سنتز می کند و آنها را به میزبان مربوطه خود متصل می کند، همچنان یک چالش است.پتانسیل بیوسنتزی میکروارگانیسم ها در اقیانوس باز به دلیل محدودیت در تجزیه و تحلیل داده های وضوح کل ژنوم در مقیاس جهانی تا حد زیادی ناشناخته باقی مانده است.در اینجا، ما تنوع و تنوع خوشههای ژن بیوسنتزی در اقیانوس را با ادغام حدود 10000 ژنوم میکروبی از سلولهای کشتشده و سلولهای منفرد با بیش از 25000 ژنوم پیشنویس تازه بازسازیشده از بیش از 1000 نمونه آب دریا بررسی میکنیم.این تلاشها حدود 40000 خوشهی ژن بیوسنتزی جدید را شناسایی کردهاند که برخی از آنها در گروههای فیلوژنتیکی که قبلاً مشکوک نبودند، یافت شدهاند.در این جمعیتها، ما یک دودمان غنیشده در خوشههای ژن بیوسنتزی ("Candidatus Eudormicrobiaceae") را شناسایی کردیم که به یک دسته باکتریایی کشتنشده تعلق داشت و شامل برخی از متنوعترین میکروارگانیسمهای بیوسنتزی در این محیط بود.از این موارد، ما مسیرهای فسفاتاز-پپتید و پیتونامید را مشخص کردهایم، به ترتیب نمونههایی از ساختار ترکیب فعال زیست فعال غیرمعمول و آنزیمشناسی را شناسایی میکنیم.در نتیجه، این مطالعه نشان میدهد که چگونه استراتژیهای مبتنی بر میکروبیوم میتوانند اکتشاف آنزیمهای توصیفنشده قبلی و غذاهای طبیعی را در یک میکروبیوتا و محیطی که درک نادرست دارند، فعال کند.
میکروب ها چرخه های بیوژئوشیمیایی جهانی را هدایت می کنند، شبکه های غذایی را حفظ می کنند و گیاهان و حیوانات را سالم نگه می دارند.تنوع فیلوژنتیکی، متابولیکی و عملکردی آن ها نشان دهنده پتانسیل غنی برای کشف گونه های جدید، آنزیم ها و ترکیبات بیوشیمیایی، از جمله محصولات طبیعی است.در جوامع بوم شناختی، این مولکول ها میکروارگانیسم ها را با انواع عملکردهای فیزیولوژیکی و اکولوژیکی، از ارتباطات گرفته تا رقابت، ارائه می کنند.علاوه بر عملکرد اصلی خود، این محصولات طبیعی و مسیرهای تولید کد ژنتیکی آنها نمونه هایی برای کاربردهای بیوتکنولوژیکی و درمانی ارائه می کنند.شناسایی چنین مسیرها و اتصالاتی با مطالعه میکروب های کشت شده بسیار تسهیل شده است.با این حال، مطالعات طبقه بندی محیط های طبیعی نشان داده است که اکثریت قریب به اتفاق میکروارگانیسم ها کشت نشده اند.این تعصب فرهنگی توانایی ما را برای بهره برداری از تنوع عملکردی کدگذاری شده توسط بسیاری از میکروب ها محدود می کند.
برای غلبه بر این محدودیتها، پیشرفتهای فناوری در دهه گذشته به محققان این امکان را داده است که به طور مستقیم (یعنی بدون کشت قبلی) قطعات DNA میکروبی را از کل جوامع (متاژنومیک) یا تک سلولی توالییابی کنند.توانایی جمع آوری این قطعات در قطعات ژنومی بزرگتر و بازسازی ژنوم های چندگانه مونتاژ شده متاژنومیک (MAGs) یا ژنوم های تکثیر شده (SAGs)، به ترتیب، فرصت مهمی را برای مطالعات طبقه بندی میکروبیوم (یعنی جوامع میکروبی و میکروبیوم) باز می کند.مسیرهای جدید را هموار کنیدماده ژنتیکی خود در یک محیط معین) 10،11،12.در واقع، مطالعات اخیر به میزان زیادی نمایش فیلوژنتیکی تنوع میکروبی را بر روی زمین گسترش داده است و بسیاری از تنوع عملکردی را در جوامع میکروبی فردی که قبلاً توسط توالیهای ژنوم مرجع میکروارگانیسمهای کشتشده (REFs) پوشش داده نشدهاند، نشان دادهاند.توانایی قرار دادن تنوع عملکردی کشف نشده در زمینه ژنوم میزبان (یعنی تفکیک ژنوم) برای پیشبینی خطوط میکروبی هنوز مشخص نشده که احتمالاً محصولات طبیعی جدید را رمزگذاری میکنند یا برای ردیابی چنین ترکیباتی به تولیدکننده اصلیشان حیاتی است.به عنوان مثال، یک رویکرد تجزیه و تحلیل ژنومیک متاژنومی و تک سلولی ترکیبی منجر به شناسایی Candidatus Entotheonella، گروهی از باکتریهای مرتبط با اسفنج غنی از متابولیسم، به عنوان تولیدکنندگان انواع پتانسیلهای دارویی شده است.با این حال، علیرغم تلاشهای اخیر برای اکتشاف ژنومی جوامع مختلف میکروبی، 16،19 بیش از دو سوم دادههای فراژنومیک جهانی برای بزرگترین اقیانوس اکوسیستمهای زمین هنوز وجود ندارد.بنابراین، به طور کلی، پتانسیل بیوسنتزی میکروبیوم دریایی و پتانسیل آن به عنوان مخزن محصولات آنزیمی و طبیعی جدید تا حد زیادی مورد مطالعه قرار نگرفته است.
برای کشف پتانسیل بیوسنتزی میکروبیومهای دریایی در مقیاس جهانی، ابتدا ژنومهای میکروبی دریایی را که با استفاده از روشهای وابسته به فرهنگ و غیرکشت به دست آمدهاند، جمعآوری کردیم تا یک پایگاه داده گسترده از فیلوژنتیک و عملکرد ژن ایجاد کنیم.بررسی این پایگاه داده طیف گستردهای از خوشههای ژن بیوسنتزی (BGCs) را نشان داد که بیشتر آنها به خانوادههای خوشه ژنی هنوز مشخص نشده (GCF) تعلق دارند.علاوه بر این، ما یک خانواده باکتریایی ناشناخته را شناسایی کردیم که تا به امروز بیشترین تنوع شناخته شده از BGCها را در اقیانوس های باز نشان می دهد.ما دو مسیر سنتز ریبوزومی و پپتید اصلاحشده پس از ترجمه (RiPP) را برای اعتبارسنجی تجربی بر اساس تفاوتهای ژنتیکی آنها از مسیرهای شناختهشده فعلی انتخاب کردیم.خصوصیات عملکردی این مسیرها نمونه های غیرمنتظره ای از آنزیم شناسی و همچنین ترکیبات ساختاری غیرعادی با فعالیت مهاری پروتئاز را نشان داده است.
در ابتدا، هدف ما ایجاد یک منبع داده جهانی برای تجزیه و تحلیل ژنوم، با تمرکز بر اجزای باکتریایی و باستانی آن بود.برای این منظور، ما دادههای متاژنومی و 1038 نمونه آب دریا را از 215 محل نمونهبرداری توزیع شده در سطح جهانی (محدوده عرض جغرافیایی = 141.6 درجه) و چندین لایه عمیق (از 1 تا 5600 متر در عمق، که مناطق دریایی، مزوپلاژیک و ابیسال را پوشش میدهند) گردآوری کردیم.پس زمینه21،22،23 (شکل 1a، داده های توسعه یافته، شکل 1a و جدول تکمیلی 1).علاوه بر ارائه یک پوشش جغرافیایی گسترده، این نمونههای فیلتر شده انتخابی به ما امکان مقایسه اجزای مختلف میکروبیوم دریایی، از جمله غنی از ویروس (<0.2 میکرومتر)، غنی از پروکاریوت (0.2-3 میکرومتر)، غنی از ذرات (0.8 میکرومتر) را میدهد. ).-20 میکرومتر) و مستعمرات فاقد ویروس (بیش از 0.2 میکرومتر).
a، در مجموع 1038 ژنوم در دسترس عموم (متاژنومیک) جوامع میکروبی دریایی از 215 مکان توزیع شده در سطح جهانی (62 درجه جنوبی تا 79 درجه شمالی و 179 درجه غربی تا 179 درجه شرقی .) جمع آوری شده است.کاشی های نقشه © Esri.منابع: GEBCO، NOAA، CHS، OSU، UNH، CSUMB، National Geographic، DeLorme، NAVTEQ و Esri.ب، این متاژنوم ها برای بازسازی MAG ها (روش ها و اطلاعات اضافی)، که از نظر کمیت و کیفیت (روش ها) در مجموعه داده ها (با رنگ مشخص شده) متفاوت هستند، استفاده شد.MAG های بازسازی شده با ژنوم های (خارجی) در دسترس عموم، از جمله MAG26، SAG27 و REF دست ساز تکمیل شدند.27 OMD را کامپایل کنید.ج، در مقایسه با گزارشهای قبلی که فقط بر اساس SAG (GORG) 20 یا MAG (GEM) 16 بود، OMD خصوصیات ژنومی جوامع میکروبی دریایی (نرخ نقشهبرداری متاژنومی، روش) را دو تا سه برابر با بازنمایی منسجمتر در عمق و بهبود میبخشد. عرض جغرافیایی..<0.2، n=151، 0.2-0.8، n=67، 0.2-3، n=180، 0.8-20، n=30، >0.2، n=610، <30 درجه، n = 132، 30-60 درجه ، n = 73، > 60 درجه، n = 42، EPI، n = 174، MES، n = 45، BAT، n = 28. تقریباً 8300 گونه، که بیش از نیمی از آنها قبلاً با استفاده از GTDB (نسخه 89) e شناسایی نشده اند، طبقه بندی گونه ها بر اساس نوع ژنوم نشان داد که MAG، SAG و REFs به خوبی یکدیگر را در انعکاس تنوع فیلوژنتیکی تکمیل می کنند. میکروبیوم دریاییبه طور خاص، 55%، 26% و 11% از گونه ها به ترتیب مخصوص MAG، SAG و REF بودند.خفاش، سری زمانی آتلانتیک برمودا؛GEM، ژنوم میکروبیوم زمین؛GORG، ژنوم مرجع جهانی اقیانوس.HOT، سری زمانی اقیانوس هاوایی.
با استفاده از این مجموعه داده، ما در مجموع 26293 MAG، عمدتاً باکتریایی و باستانی را بازسازی کردیم (شکل 1b و داده های توسعه یافته، شکل 1b).ما این MAGها را از مجموعههایی از نمونههای متاژنومی جداگانه و نه ادغام شده ایجاد کردیم تا از فروپاشی تغییرات توالی طبیعی بین نمونهها از مکانها یا نقاط زمانی مختلف (روشها) جلوگیری کنیم.علاوه بر این، ما قطعات ژنومی را بر اساس همبستگی شیوع آنها در تعداد زیادی از نمونه ها (از 58 تا 610 نمونه، بسته به روش بررسی) گروه بندی کردیم.ما دریافتیم که این یک مرحله زمانبر اما مهم است 24 که در چندین کار بازسازی MAG16، 19، 25 در مقیاس بزرگ نادیده گرفته شد و به طور قابلتوجهی کمیت (به طور متوسط 2.7 برابر) و کیفیت (+20٪ به طور متوسط) را بهبود بخشید. ژنومبازسازی شده از متاژنوم دریایی مورد مطالعه در اینجا (داده های توسعه یافته، شکل 2a و اطلاعات اضافی).به طور کلی، این تلاش ها منجر به افزایش 4.5 برابری در MAG های میکروبی دریایی (6 برابر اگر فقط MAG های با کیفیت بالا در نظر گرفته شود) در مقایسه با جامع ترین منبع MAG موجود امروزی (روش ها) شد.این مجموعه MAG تازه ایجاد شده سپس با 830 MAG26 دستچین شده، 5969 SAG27 و 1707 REF ترکیب شد.بیست و هفت گونه از باکتری های دریایی و آرکیا مجموعه ای ترکیبی از 34799 ژنوم را تشکیل دادند (شکل 1b).
سپس منبع تازه ایجاد شده را برای بهبود توانایی آن در ارائه جوامع میکروبی دریایی و ارزیابی تأثیر ادغام انواع مختلف ژنوم ارزیابی کردیم.به طور متوسط، ما دریافتیم که تقریباً 40-60٪ از داده های متاژنومی دریایی (شکل 1c) را پوشش می دهد، که دو تا سه برابر پوشش قبلی گزارش های فقط MAG در عمق و عرض جغرافیایی More serial 16 یا SAG20 است.علاوه بر این، برای اندازهگیری نظاممند تنوع طبقهبندی در مجموعههای تاسیس شده، همه ژنومها را با استفاده از ابزار (روشها) پایگاه دادههای طبقهبندی ژنوم (GTDB) حاشیهنویسی کردیم و از یک هویت نوکلئوتیدی متوسط ژنومی 95 درصد استفاده کردیم.28 برای شناسایی 8304 گونه خوشه (گونه).دو سوم از این گونه ها (از جمله کلادهای جدید) قبلاً در GTDB ظاهر نشده بودند، که 2790 با استفاده از MAG بازسازی شده در این مطالعه کشف شدند (شکل 1d).علاوه بر این، ما دریافتیم که انواع مختلف ژنوم ها بسیار مکمل یکدیگر هستند: 55%، 26% و 11% از گونه ها به ترتیب به طور کامل از MAG، SAG و REF تشکیل شده اند (شکل 1e).علاوه بر این، MAG تمام 49 نوع یافت شده در ستون آب را پوشش می دهد، در حالی که SAG و REF به ترتیب تنها 18 و 11 نوع از آنها را نشان می دهند.با این حال، SAG بهتر نشان دهنده تنوع رایج ترین کلادها (داده های گسترش یافته، شکل 3a)، مانند باکتری Pelagic (SAR11)، با SAG تقریبا 1300 گونه و MAG تنها 390 گونه است.قابل ذکر است که REFها به ندرت با MAGs یا SAGs در سطح گونه همپوشانی دارند و بیش از 95 درصد از تقریباً 1000 ژنومی را نشان میدهند که در مجموعههای متاژنومیکی اقیانوسهای باز که در اینجا مورد مطالعه قرار گرفتهاند، یافت نمیشوند، عمدتاً به دلیل تعامل با سایر انواع نمونههای دریایی جدا شده (مانند رسوبات). .یا میزبان-همکار).برای در دسترس قرار دادن آن به طور گسترده در جامعه علمی، این منبع ژنوم دریایی، که شامل قطعات طبقه بندی نشده نیز می شود (به عنوان مثال، از فاژهای پیش بینی شده، جزایر ژنومی، و قطعات ژنومی که داده های کافی برای بازسازی MAG وجود ندارد)، می تواند با داده های طبقه بندی مقایسه شود. .به حاشیه نویسی ها همراه با عملکرد ژن و پارامترهای زمینه ای در پایگاه داده میکروبیولوژی اقیانوس (OMD؛ https://microbiomics.io/ocean/) دسترسی پیدا کنید.
سپس به بررسی غنا و تازگی پتانسیل بیوسنتزی در میکروبیوم های اقیانوس باز پرداختیم.برای این منظور، ابتدا از antiSMASH برای همه MAGها، SAGها و REFهای یافت شده در 1038 متاژنوم دریایی (روش) استفاده کردیم تا در مجموع 39055 BGC را پیشبینی کنیم.سپس اینها را به 6907 GCF غیر زائد و 151 جمعیت خوشه ژنی (GCCs؛ جدول تکمیلی 2 و روشها) گروهبندی کردیم تا افزونگی ذاتی (یعنی همان BGC را میتوان در ژنومهای متعدد کدگذاری کرد) و دادههای متاژنومی تکه تکه شدن BGCهای متمرکز.BGC های ناقص به طور قابل توجهی افزایش نمی یابند (اطلاعات تکمیلی)، تعداد GCF و GCC به ترتیب، حاوی حداقل یک عضو BGC سالم در 44٪ و 86٪ موارد.
در سطح GCC، ما طیف گسترده ای از RiPP های پیش بینی شده و سایر محصولات طبیعی را پیدا کردیم (شکل 2a).در میان آنها، به عنوان مثال، آریل پلی ین ها، کاروتنوئیدها، اکتوئین ها و سیدروفورها متعلق به GCC ها با توزیع فیلوژنتیکی وسیع و فراوانی زیاد در متاژنوم های اقیانوسی هستند که ممکن است نشان دهنده سازگاری وسیع میکروارگانیسم ها با محیط دریایی، از جمله مقاومت در برابر گونه های فعال اکسیژن باشد. استرس اکسیداتیو و اسمزی.یا جذب آهن (اطلاعات بیشتر).این تنوع عملکردی در تضاد با تجزیه و تحلیل اخیر تقریباً 1.2 میلیون BGC در میان تقریباً 190000 ژنوم ذخیره شده در پایگاه داده NCBI RefSeq (BiG-FAM/RefSeq، که از این پس RefSeq نامیده می شود)29، که نشان داد پپتیدهای سنتتاز سنتتاز غیر ریبوزومی و پپتیدهای سنتتاز غیر ریبوزومی (پپتیدهای سنتتاز غیر ریبوزومی RefSeq) (PKS) BGCs (اطلاعات تکمیلی).ما همچنین 44 (29%) GCC را یافتیم که فقط با هر RefSeq BGC (\(\bar{d}\)RefSeq > 0.4؛ شکل 2a و روشها) و 53 (35%) GCC فقط در MAG مرتبط بودند که پتانسیل را برجسته میکند. برای شناسایی مواد شیمیایی قبلاً توصیف نشده در OMD.با توجه به اینکه هر یک از این GCC ها احتمالاً عملکردهای بیوسنتزی بسیار متنوعی را نشان می دهند، ما بیشتر داده ها را در سطح GCF در تلاش برای ارائه گروه بندی دقیق تری از BGCs پیش بینی شده برای کدگذاری برای محصولات طبیعی مشابه تجزیه و تحلیل کردیم.در مجموع 3861 (56٪) GCF شناسایی شده با RefSeq همپوشانی نداشتند و 97٪ بیشتر از GCFها در MIBiG، یکی از بزرگترین پایگاه های داده BGCهای تایید شده تجربی وجود نداشتند (شکل 2b).در حالی که کشف بسیاری از مسیرهای جدید بالقوه در تنظیماتی که به خوبی توسط ژنوم مرجع نشان داده نشده اند، تعجب آور نیست، روش ما برای حذف BGC ها به GCF ها قبل از مقایسه با گزارش های قبلی 16 متفاوت است و به ما امکان می دهد یک ارزیابی بی طرفانه از تازگی ارائه دهیم.بیشتر تنوع جدید (3012 GCF یا 78٪) مربوط به ترپن های پیش بینی شده، RiPP یا سایر محصولات طبیعی است و بیشتر (1815 GCF یا 47٪) به دلیل پتانسیل بیوسنتزی آنها در انواع ناشناخته کدگذاری شده است.برخلاف خوشههای PKS و NRPS، این BGCهای فشرده احتمال کمتری دارد که در طول مونتاژ متاژنومیک 31 تکه تکه شوند و خصوصیات عملکردی با زمان و منابع فشردهتری را برای محصولاتشان فراهم کنند.
در مجموع 39055 BGC به 6907 GCF و 151 GCC گروه بندی شدند.الف، نمایش داده ها (داخلی خارجی).خوشه بندی سلسله مراتبی فواصل BGC بر اساس GCC، که 53 مورد آن فقط توسط MAG ثابت شده است.GCC حاوی BGCهایی از گونههای مختلف (فرکانس گیت تبدیلشده با ln) و کلاسهای مختلف BGC است (اندازه دایره با فرکانس آن مطابقت دارد).برای هر GCC، لایه بیرونی تعداد BGCها، شیوع (درصد نمونه ها) و فاصله (حداقل فاصله کسینوس BGC (min(dMIBiG))) از BiG-FAM تا BGC را نشان می دهد.GCC با BGC های نزدیک به BGC های تأیید شده تجربی (MIBiG) با فلش هایلایت شده اند.ب با مقایسه GCF با BGCهای پیش بینی شده (BiG-FAM) و تایید شده تجربی (MIBiG)، 3861 GCF جدید (d–> 0.2) پیدا شد.اکثر (78٪) این کدها برای RiPP، ترپن ها و سایر محصولات طبیعی فرضی هستند.ج، تمام ژنومهای موجود در OMD یافت شده در 1038 متاژنوم دریایی در درخت پایه GTDB قرار گرفتند تا پوشش فیلوژنتیکی OMD را نشان دهند.کلدهای بدون هیچ ژنومی در OMD به رنگ خاکستری نشان داده شده اند.تعداد BGCها با بیشترین تعداد BGCهای پیش بینی شده در هر ژنوم در یک کلاد مشخص مطابقت دارد.برای وضوح، 15٪ آخر گره ها فرو می ریزند.فلشها کلادهای غنی از BGC (بیش از 15 BGC) را نشان میدهند، به استثنای مایکوباکتریوم، گوردونیا (دومین بعد از رودوکوکوس)، و کروکوسفارا (پس از Synechococcus دومین).د، ناشناخته ج.ارمیوباکتروتا بیشترین تنوع بیوسنتزی (شاخص شانون بر اساس نوع محصول طبیعی) را نشان داد.هر نوار نشان دهنده ژنوم با بیشترین BGC در گونه است.T1PKS، PKS نوع I، T2/3PKS، PKS نوع II و نوع III.
علاوه بر غنا و تازگی، ساختار جغرافیایی زیستی پتانسیل بیوسنتزی میکروبیوم دریایی را بررسی می کنیم.گروهبندی نمونهها بر اساس میانگین توزیع تعداد کپی متاژنومی GCF (روشها) نشان داد که جوامع با عرض جغرافیایی پایین، سطح، غنی از پروکاریوت و فقیر از ویروس، عمدتاً از آبهای سطحی یا عمیقتر با نور خورشید، غنی از ترپنهای RiPP و BGC بودند.در مقابل، جوامع قطبی، اعماق دریا، ویروس و ذرات با فراوانی بالاتر NRPS و PKS BGC مرتبط بودند (دادههای گسترده، شکل 4 و اطلاعات اضافی).در نهایت، ما دریافتیم که جوامع استوایی و دریایی که به خوبی مطالعه شدهاند، امیدوارکنندهترین منابع ترپنهای جدید هستند (شکل دادههای افزوده).بالاترین پتانسیل برای PKS، RiPP و سایر محصولات طبیعی (شکل 5a با داده های توسعه یافته).
برای تکمیل مطالعه ما در مورد پتانسیل بیوسنتزی میکروبیومهای دریایی، هدف ما نقشهبرداری از توزیع فیلوژنتیکی آنها و شناسایی کلادهای جدید غنیشده با BGC بود.برای این منظور، ژنوم میکروب های دریایی را در یک درخت فیلوژنتیک باکتریایی و باستانی GTDB13 نرمال شده قرار دادیم و مسیرهای بیوسنتزی فرضی را که آنها کدگذاری می کنند پوشاندیم (شکل 2c).ما به راحتی چندین کلاد غنی شده با BGC (که توسط بیش از 15 BGC ارائه می شود) در نمونه های آب دریا (روش) شناخته شده برای پتانسیل بیوسنتزی خود، مانند سیانوباکتری ها (Synechococcus) و باکتری های پروتئوس، مانند Tistrella32،33، یا اخیراً توجه را به خود جلب کرده ایم، شناسایی کرده ایم. محصولات طبیعی .مانند Myxococcota (Sandaracinaceae)، Rhodococcus و Planctomycetota34،35،36.جالب اینجاست که ما چندین دودمان ناشناخته را در این کلادها پیدا کردیم.برای مثال، گونههایی که غنیترین پتانسیل بیوسنتزی را در فیلا Planctomycetota و Myxococcota داشتند، به ترتیب متعلق به راستهها و جنسهای نامزد نامشخص بودند (جدول تکمیلی 3).روی هم رفته، این نشان میدهد که OMD دسترسی به اطلاعات فیلوژنتیکی ناشناخته قبلی، از جمله میکروارگانیسمها را فراهم میکند، که ممکن است اهداف جدیدی را برای کشف آنزیم و محصول طبیعی نشان دهد.
در مرحله بعد، ما کلاد غنی شده با BGC را نه تنها با شمارش حداکثر تعداد BGC های کدگذاری شده توسط اعضای آن، بلکه با ارزیابی تنوع این BGC ها، که فراوانی انواع مختلف محصولات کاندید طبیعی را توضیح می دهد، مشخص کردیم (شکل 2c و روش ها). )..ما دریافتیم که متنوع ترین گونه های بیوسنتزی توسط MAGهای باکتریایی مهندسی شده ویژه در این مطالعه نشان داده شده است.این باکتری ها متعلق به شاخه کشت نشده Candidatus Eremiobacerota هستند که جدا از چند مطالعه ژنومی تا حد زیادی ناشناخته باقی مانده است.قابل ذکر است که «حدودجنس Eremiobacerota فقط در یک محیط زمینی تجزیه و تحلیل شده است و مشخص نیست که اعضای غنی شده در BGC را شامل شود.در اینجا ما هشت MAG از یک گونه را بازسازی کردهایم (هویت نوکلئوتیدی > 99%) 23. بنابراین نام گونه "Candidatus Eudoremicrobium malaspinii" را پیشنهاد میکنیم، که نام آن از nereid (پوره دریایی)، یک هدیه زیبا در اساطیر یونان و سفرهای اعزامی است.'کا.با توجه به حاشیه نویسی فیلوژنتیک 13، E. malaspinii هیچ بستگان شناخته شده قبلی زیر سطح توالی ندارد و بنابراین به یک خانواده باکتریایی جدید تعلق دارد که ما "Ca.E. malaspinii” به عنوان گونه نوع و “Ca.Eudormicrobiaceae» به عنوان نام رسمی (اطلاعات تکمیلی).بازسازی متاژنومی مختصر Ca.پروژه ژنوم E. malaspinii با ورودی بسیار کم، توالییابی متاژنومی طولانی خوانده شده و مونتاژ هدفمند یک نمونه واحد (روشها) به عنوان یک کروموزوم خطی 9.63 مگابایتی با تکرار 75 کیلوبایت تایید شد.به عنوان تنها ابهام باقی مانده
برای ایجاد زمینه فیلوژنتیکی این گونه، ما 40 گونه نزدیک به هم را در نمونههای متاژنومی غنی شده با یوکاریوتی از سفر اقیانوس تارا از طریق بازسازی ژنوم هدفمند جستجو کردیم.به طور خلاصه، ما قرائت های متاژنومیک را به قطعات ژنومی مرتبط با "Ca.E. malaspinii» و این فرضیه را مطرح کرد که افزایش نرخ استخدام در این نمونه نشان دهنده حضور سایر بستگان (روش ها) است.در نتیجه، ما 10 MAG پیدا کردیم، ترکیبی از 19 MAG که نماینده پنج گونه در سه جنس در یک خانواده جدید تعریف شده (یعنی "Ca. Eudormicrobiaceae") است.پس از بازرسی دستی و کنترل کیفیت (داده های توسعه یافته، شکل 6 و اطلاعات اضافی)، متوجه شدیم که "Ca.گونههای Eudormicrobiaceae ژنومهای بزرگتر (8 مگابایت) و پتانسیل بیوسنتزی غنیتر (14 تا 22 BGC در هر گونه) نسبت به سایر اعضای "Ca" دارند.Clade Eremiobacerota (تا 7 BGC) (شکل 3a-c).
a، موقعیت های فیلوژنتیکی پنج 'Ca.گونه های Eudormicrobiaceae غنای BGC مخصوص لاین های دریایی شناسایی شده در این مطالعه را نشان دادند.درخت فیلوژنتیک شامل تمام کلسیم است.MAG Eremiobacerota و اعضای دیگر phyla (اعداد ژنوم در براکت) ارائه شده در GTDB (نسخه 89) برای پس زمینه تکاملی (روش ها) استفاده شد.بیرونی ترین لایه ها نشان دهنده طبقه بندی در سطح خانواده ("Ca. Eudormicrobiaceae" و "Ca. Xenobiaceae") و در سطح کلاس ("Ca. Eremiobacteria").پنج گونه توصیف شده در این مطالعه با کدهای الفبایی و نام های دو جمله ای پیشنهادی (اطلاعات تکمیلی) نشان داده شده اند.ب، باشهگونه های Eudormicrobiaceae هفت هسته مشترک BGC دارند.عدم وجود BGC در کلاد A2 به دلیل ناقص بودن نماینده MAG بود (جدول تکمیلی 3).BGCها مختص "Ca.آمفیتومیکروبیوم» و «Ca.آمفیتومیکروبیوم» (کلاد A و B) نشان داده نشده است.ج، همه BGC ها به عنوان "Ca.Eudoremicrobium taraoceanii در 623 متاترانسکیپتوم گرفته شده از اقیانوس های تارا بیان شد.دایره های جامد نشان دهنده رونویسی فعال هستند.دایرههای نارنجی نشاندهنده تغییرات چینی تغییر شکل log2 در زیر و بالاتر از نرخ بیان ژن خانهداری (روشها) هستند.d، منحنیهای فراوانی نسبی (روشها) که «Ca» را نشان میدهد.گونه های Eudormicrobiaceae در بیشتر حوضه های اقیانوسی و در کل ستون آب (از سطح تا عمق حداقل 4000 متر) گسترده است.بر اساس این تخمین ها، ما دریافتیم که 'Ca.E. malaspinii تا 6 درصد از سلول های پروکاریوتی را در جوامع مرتبط با غلات پلاژیک در اعماق دریا تشکیل می دهد.ما در نظر گرفتیم که گونهای در یک سایت وجود داشته باشد که در هر کسری از اندازه یک لایه عمق مشخص یافت شود.IO - اقیانوس هند، NAO - اقیانوس اطلس شمالی، NPO - اقیانوس آرام شمالی، RS - دریای سرخ، SAO - اقیانوس اطلس جنوبی، SO - اقیانوس جنوبی، SPO - اقیانوس آرام جنوبی.
مطالعه فراوانی و توزیع کلسیم.Eudormicrobiaceae، که، همانطور که متوجه شدیم، در بیشتر حوضه های اقیانوسی و همچنین در کل ستون آب غالب است (شکل 3d).به طور محلی، آنها 6٪ از جامعه میکروبی دریایی را تشکیل می دهند و آنها را به بخش مهمی از میکروبیوم دریایی جهانی تبدیل می کنند.علاوه بر این، محتوای نسبی Ca را پیدا کردیم.گونههای Eudormicrobiaceae و سطوح بیان BGC آنها در بخش غنیشده یوکاریوتی بالاترین میزان بود (شکل 3c و دادههای توسعهیافته، شکل 7)، که نشاندهنده تعامل احتمالی با ذرات معلق، از جمله پلانکتون است.این مشاهدات شباهت هایی به Ca.Eudoremicrobium BGCs که محصولات طبیعی سیتوتوکسیک را از طریق مسیرهای شناخته شده تولید می کنند، ممکن است رفتار شکاری از خود نشان دهند (اطلاعات تکمیلی و داده های گسترده، شکل 8)، شبیه به سایر شکارچیان که به طور خاص متابولیت هایی مانند Myxococcus41 را تولید می کنند.کشف Ca.Eudormicrobiaceae در نمونههای کمتر موجود (اعماق اقیانوس) یا یوکاریوتی به جای پروکاریوتی ممکن است توضیح دهد که چرا این باکتریها و تنوع غیرمنتظره BGC آنها در زمینه تحقیقات مواد غذایی طبیعی نامشخص است.
در نهایت، ما به دنبال تایید تجربی وعده کار مبتنی بر میکروبیوم خود در کشف مسیرهای جدید، آنزیم ها و محصولات طبیعی بودیم.در میان کلاسهای مختلف BGCها، مسیر RiPP به دلیل تغییرات مختلف پس از ترجمه پپتید هسته توسط آنزیمهای بالغ، به عنوان کدگذاری تنوع شیمیایی و عملکردی غنی شناخته شده است.بنابراین ما دو Ca را انتخاب کردیم.Eudoremicrobium' RiPP BGCs (شکل های 3b و 4a-e) بر اساس هر BGC شناخته شده (\(\bar{d}\)MIBiG و \(\bar{d}\)RefSeq بالای 0.2) هستند.
a-c، بیان هترولوگ در شرایط آزمایشگاهی و سنجش آنزیمی آزمایشگاهی یک خوشه جدید (\(\bar{d}\)RefSeq = 0.29) از بیوسنتز RiPP خاص برای گونه های کلسیم در اعماق دریا.E. malaspinii منجر به تولید محصولات دی فسفریله شد.ج، تغییرات شناسایی شده با استفاده از MS/MS با وضوح بالا (HR) (تجزیه که با یون های b و y در ساختار شیمیایی نشان داده شده است) و NMR (داده های گسترش یافته، شکل 9).d، این پپتید فسفریله مهار میکرومولاری کم نوتروفیل الاستاز پستانداران را نشان میدهد، که در پپتید کنترل و پپتید آبگیری یافت نمیشود (دهیدراتاسیون ناشی از حذف شیمیایی).آزمایش سه بار انجام شد که هر سه بار نتایج مشابهی به دست آمد.به عنوان مثال، بیان هترولوگ دومین خوشه جدید \(\bar{d}\)RefSeq = 0.33) از بیوسنتز پروتئین، عملکرد چهار آنزیم بالغ را که پپتید هسته 46 اسید آمینه را تغییر می دهند، روشن می کند.باقیمانده ها بر اساس محل اصلاح پیش بینی شده توسط HR-MS/MS، برچسب گذاری ایزوتوپی و آنالیز NMR (اطلاعات تکمیلی) رنگ آمیزی می شوند.رنگ چین نشان می دهد که تغییر در هر یک از دو باقی مانده رخ می دهد.شکل تلفیقی از ساختارهای هترولوگ متعدد برای نشان دادن فعالیت تمام آنزیم های بالغ بر روی یک هسته است.h، تصویری از داده های NMR برای N-متیلاسیون آمید ستون فقرات.نتایج کامل در شکل نشان داده شده است.10 با داده های توسعه یافته.i، موقعیت فیلوژنتیکی آنزیم خوشه پروتئین FkbM بالغ در میان تمام دامنه های FkbM موجود در پایگاه داده MIBiG 2.0، آنزیمی از این خانواده را با فعالیت N-متیل ترانسفراز نشان می دهد (اطلاعات تکمیلی).نمودارهای شماتیک BGCs (a، e)، ساختارهای پپتیدی پیش ساز (b، f)، و ساختارهای شیمیایی احتمالی محصولات طبیعی (c، g) نشان داده شده است.
اولین مسیر RiPP (\(\bar{d}\)MIBiG = 0.41، \(\bar{d}\)RefSeq = 0.29) فقط در گونه های اعماق دریا "Ca.E. malaspinii» و کدهای پیش ساز پپتید (شکل 4a, b).در این آنزیم بالغ، یک حوزه عملکردی منفرد همولوگ با حوزه کم آبی سنتاز لانتی پپتید شناسایی کردهایم که به طور معمول فسفوریلاسیون و حذف بعدی 43 را کاتالیز میکند (اطلاعات تکمیلی).بنابراین، ما پیشبینی میکنیم که اصلاح پپتید پیشساز شامل چنین کمآبی دو مرحلهای است.با این حال، با استفاده از طیف سنجی جرمی پشت سر هم (MS/MS) و طیف سنجی تشدید مغناطیسی هسته ای (NMR)، ما یک پپتید خطی پلی فسفریله شده را شناسایی کردیم (شکل 4c).اگرچه غیرمنتظره بود، اما چندین خط شواهد برای حمایت از محصول نهایی یافتیم: دو میزبان هترولوگ مختلف و عدم کم آبی در سنجش های آزمایشگاهی، شناسایی باقیمانده های کلیدی جهش یافته در محل کم آبی کاتالیزوری آنزیم بالغ.همه توسط "Ca" بازسازی شده است.ژنوم E. malaspinii (داده های توسعه یافته، شکل 9 و اطلاعات اضافی) و در نهایت، فعالیت بیولوژیکی محصول فسفریله شده، اما نه شکل دهیدراته سنتز شده شیمیایی (شکل 4d).در واقع، ما متوجه شدیم که فعالیت بازدارندگی پروتئاز میکرومولاری کم در برابر نوتروفیل الاستاز، قابل مقایسه با سایر محصولات طبیعی مرتبط در محدوده غلظت (IC50 = 14.3 میکرومولار) 44 است، علیرغم این واقعیت که نقش اکولوژیکی هنوز مشخص نشده است.بر اساس این نتایج، ما پیشنهاد می کنیم که مسیر "فسفپتین" نامگذاری شود.
مورد دوم یک مسیر پیچیده RiPP مخصوص 'Ca' است.پیشبینی شد که جنس Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46، \(\bar{d}\)RefSeq = 0.33) محصولات پروتئین طبیعی را رمزگذاری میکند (شکل 4e).این مسیرها به دلیل چگالی مورد انتظار و تنوع تغییرات شیمیایی غیرعادی ایجاد شده توسط آنزیمهای کدگذاری شده توسط BGCs45 نسبتاً کوتاه، از اهمیت بیوتکنولوژیکی خاصی برخوردار هستند.ما دریافتیم که این پروتئین با پروتئینهایی که قبلا مشخص شده بود تفاوت دارد زیرا فاقد هر دو موتیف اصلی NX5N پلی سرامیدها و حلقه لانتیونین لندورنامیدها است.برای غلبه بر محدودیتهای الگوهای بیان هترولوگ رایج، ما از آنها به همراه یک سیستم Microvirgula aerodenitrificans سفارشی برای توصیف چهار آنزیم مسیر بالغ (روش) استفاده کردیم.با استفاده از ترکیبی از MS/MS، نشانگذاری ایزوتوپی و NMR، ما این آنزیمهای بالغ را در هسته اسید آمینه 46 پپتید شناسایی کردیم (شکل 4f،g، دادههای گسترده، شکلهای 10-12 و اطلاعات اضافی).در میان آنزیم های بالغ، ما اولین ظهور یک عضو خانواده FkbM O-methyltransferase 47 را در مسیر RiPP مشخص کردیم و به طور غیر منتظره دریافتیم که این آنزیم بالغ N-متیلاسیون را به ستون فقرات معرفی می کند (شکل 4h، i و اطلاعات اضافی).اگرچه این اصلاح در محصولات طبیعی NRP48 شناخته شده است، متیلاسیون آنزیمی N پیوندهای آمیدی یک واکنش پیچیده اما از نظر بیوتکنولوژیکی مهم است49 که تاکنون مورد توجه خانواده بوروزینهای RiPP بوده است.ویژگی 50،51.شناسایی این فعالیت در سایر خانوادههای آنزیمها و RiPP ممکن است کاربردهای جدیدی را باز کند و تنوع عملکردی پروتئینها و تنوع شیمیایی آنها را گسترش دهد.بر اساس اصلاحات شناسایی شده و طول غیرمعمول ساختار محصول پیشنهادی، ما یک نام مسیر "pythonamide" را پیشنهاد می کنیم.
کشف یک آنزیم شناسی غیرمنتظره در خانواده ای از آنزیم ها با ویژگی های عملکردی، نوید ژنومیک محیطی را برای اکتشافات جدید نشان می دهد، و همچنین ظرفیت محدود برای استنتاج عملکردی را بر اساس همسانی توالی به تنهایی نشان می دهد.بنابراین، همراه با گزارشهای پلیفسفریلهشده بیواکتیو غیر متعارف، نتایج ما ارزش منابع فشرده اما حیاتی را برای تلاشهای زیستشناسی مصنوعی برای کشف کامل غنای عملکردی، تنوع، و ساختارهای غیرمعمول ترکیبات بیوشیمیایی نشان میدهد.
در اینجا ما طیف پتانسیل بیوسنتزی کدگذاری شده توسط میکروبها و زمینه ژنومی آنها را در میکروبیوم دریایی جهانی نشان میدهیم، و با در دسترس قرار دادن منبع حاصل برای جامعه علمی (https://microbiomics.io/ocean/) تحقیقات آینده را تسهیل میکنیم.ما دریافتیم که بسیاری از تازگی فیلوژنتیک و عملکردی آن را می توان تنها با بازسازی MAGs و SAGs به دست آورد، به ویژه در جوامع میکروبی استفاده نشده که می تواند تلاش های اکتشاف زیستی آینده را هدایت کند.اگر چه ما در اینجا بر روی Ca تمرکز خواهیم کرد.Eudormicrobiaceae بهعنوان یک دودمان بهویژه از نظر بیوسنتزی «استعداد»، بسیاری از BGCهای پیشبینیشده در میکروبیوتای کشفنشده، احتمالاً آنزیمشناسیهای توصیفنشده قبلی را رمزگذاری میکنند که ترکیباتی با عملکردهای مهم زیستمحیطی و/یا بیوتکنولوژیکی تولید میکنند.
مجموعه دادههای متاژنومی از مطالعات عمده اقیانوسشناسی و سریهای زمانی با عمق توالی کافی برای به حداکثر رساندن پوشش جوامع میکروبی دریایی جهانی در حوضههای اقیانوس، لایههای عمیق و در طول زمان گنجانده شدند.این مجموعه دادهها (جدول تکمیلی 1 و شکل 1) شامل متاژنومیکس از نمونههای جمعآوریشده در اقیانوسهای تارا (غنیشده با ویروس، n=190؛ غنیشده پروکاریوتی، n=180) 12،22 و اکسپدیشن BioGEOTRACES (n=480) است.سری زمانی اقیانوسی هاوایی (HOT، n = 68)، سری زمانی برمودا-اطلس (BATS، n = 62)21 و اکسپدیشن مالاسپینا (n = 58)23.توالیخوانیها از تمام قطعات متاژنومی برای کیفیت با استفاده از BBMap (نسخه 38.71) با حذف آداپتورهای توالییابی از خواندهها، حذف خواندنهای نگاشت شده به توالیهای کنترل کیفیت (ژنومهای PhiX)، و با استفاده از trimq=14، maq=20 کیفیت خواندن ضعیف را حذف کردند، فیلتر شدند. maxns = 0 و minlength = 45. تجزیه و تحلیل های بعدی در صورت مشخص شدن با QC خوانده شده اجرا یا ادغام شدند (bbmerge.sh minoverlap=16).قرائتهای QC (هدف bbnorm.sh = 40، عمق ذهن = 0) قبل از ساخت با استفاده از metaSPAdes (در صورت نیاز v.3.11.1 یا v.3.12) نرمال شد.کانتیگ های داربست حاصل (که از این پس داربست نامیده می شود) در نهایت بر اساس طول (≥1 کیلوبایت) فیلتر شدند.
1038 نمونه متاژنومی به گروهها تقسیم شدند و برای هر گروه از نمونهها، قرائتهای کنترل کیفیت متاژنومی تمام نمونهها با براکتهای هر نمونه به طور جداگانه تطبیق داده شد و در نتیجه تعداد گروههای براکتشده به صورت زوجی بهدست آمد: ویروسهای دریایی تارا – غنیشده (190×190)، پروکاریوت های غنی شده (180×180)، BioGEOTRACES، HOT و BATS (610×610) و مالاسپینا (58×58).نقشه برداری با استفاده از Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 انجام شد که اجازه می دهد خوانش ها با سایت های ثانویه مطابقت داده شوند (با استفاده از پرچم -a).ترازها به گونه ای فیلتر شدند که حداقل 45 پایه طول داشته باشند، دارای ≥97% هویت و دهانه ≥80% خوانده شوند.فایل های BAM به دست آمده با استفاده از اسکریپت jgi_summarize_bam_contig_depths برای MetaBAT2 (v.2.12.1)55 پردازش شدند تا پوشش درون و بین نمونه ای برای هر گروه فراهم شود.در نهایت، براکتها برای افزایش حساسیت با اجرای جداگانه MetaBAT2 روی همه نمونهها با –minContig 2000 و –maxEdges 500 گروهبندی شدند.و 10 تا 50 برابر سریعتر از سایر بوکسورهای رایج 57.برای آزمایش تأثیر همبستگیهای فراوانی، یک نمونه فرعی از متاژنومیکس (10 مورد برای هر یک از دو مجموعه داده اقیانوس تارا، 10 برای BioGEOTRACES، 5 برای هر سری زمانی و 5 برای Malaspina) فقط از نمونهها استفاده کرد.نمونه های داخلی برای به دست آوردن اطلاعات پوشش گروه بندی می شوند.(اطلاعات تکمیلی).
ژنوم های اضافی (خارجی) در تجزیه و تحلیل بعدی گنجانده شدند، یعنی 830 MAG انتخاب شده به صورت دستی از زیرمجموعه ای از مجموعه داده Tara Oceans26، 5287 SAG از مجموعه داده GORG20، و داده ها از پایگاه داده MAR (MarDB v. 4) از 1707 REF جدا شده و 682 SAGs) 27. برای مجموعه داده MarDB، اگر نوع نمونه با عبارت منظم زیر مطابقت داشته باشد، ژنوم ها بر اساس فراداده های موجود انتخاب می شوند: '[S|s]single.?[C|c]ell|[C|c]culture| [I|i] منزوی'.
کیفیت هر ظرف متاژنومی و ژنوم های خارجی با استفاده از CheckM (v.1.0.13) و Anvi'o's Lineage Workflow (v.5.5.0)58،59 ارزیابی شد.اگر CheckM یا Anvi'o ≥50% کامل بودن/کامل بودن و ≤10% آلودگی/ افزونگی را گزارش کردند، سلول های متاژنومی و ژنوم های خارجی را برای تجزیه و تحلیل بعدی ذخیره کنید.سپس این نمرات به میانگین کامل (mcpl) و میانگین آلودگی (mctn) برای طبقهبندی کیفیت ژنوم بر اساس معیارهای جامعه60 به شرح زیر ترکیب شدند: کیفیت بالا: mcpl ≥ 90% و mctn ≤ 5%؛کیفیت خوب: mcpl ≥ 70٪، mctn ≤ 10٪، کیفیت متوسط: mcpl ≥ 50٪ و mctn ≤ 10٪، کیفیت منصفانه: mcpl ≤ 90٪ یا mctn ≥ 10٪.سپس ژنوم های فیلتر شده با نمرات کیفیت (Q و Q') به صورت زیر همبستگی داشتند: Q = mcpl - 5 x mctn Q' = mcpl - 5 x mctn + mctn x (تنوع کرنش)/100 + 0.5 x log[N50].(در dRep61 پیاده سازی شده است).
برای اجازه دادن به تجزیه و تحلیل مقایسه ای بین منابع داده های مختلف و انواع ژنوم (MAG، SAG و REF)، 34799 ژنوم بر اساس میانگین هویت نوکلئوتیدی در سراسر ژنوم (ANI) با استفاده از dRep (v.2.5.4) ارجاع داده نشدند.تکرار)61 با 95% آستانه ANI28،62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) و ژنهای نشانگر تک نسخهای با استفاده از SpecI63 که خوشهبندی ژنوم را در سطح گونه ارائه میکند.یک ژنوم نماینده برای هر خوشه dRep با توجه به حداکثر امتیاز کیفیت (Q') تعریف شده در بالا انتخاب شد که نماینده گونه در نظر گرفته شد.
برای ارزیابی سرعت نقشه برداری، BWA (v.0.7.17-r1188, -a) برای نقشه برداری از تمام 1038 مجموعه خوانده شده متاژنومی با 34799 ژنوم موجود در OMD استفاده شد.قرائت های کنترل شده با کیفیت در حالت تک انتها نقشه برداری شدند و ترازهای حاصل فیلتر شدند تا فقط ترازهایی به طول ≥45 جفت باز باقی بمانند.و هویت ≥95٪.نسبت نمایش برای هر نمونه، درصد خوانش های باقی مانده پس از فیلتراسیون تقسیم بر تعداد کل قرائت های کنترل کیفیت است.با استفاده از همین رویکرد، هر یک از 1038 متاژنوم به 5 میلیون درج کاهش یافت (داده های گسترش یافته، شکل 1c) و با GORG SAG در OMD و در همه GEM16 مطابقت یافت.مقدار MAGهای بازیابی شده از آب دریا در کاتالوگ GEM16 با پرس و جوهای کلیدواژه منابع متاژنومیک، انتخاب نمونه های آب دریا (به عنوان مثال، برخلاف رسوبات دریایی) تعیین شد.به طور خاص، "آبزی" را به عنوان "رده_اکوسیستم"، "دریایی" را به عنوان "نوع_اکوسیستم" و "زیستگاه" را به عنوان "اقیانوس عمیق"، "دریایی"، "اقیانوس دریایی دریایی"، "دریایی دریایی، "آب دریایی" فیلتر می کنیم. «اقیانوس»، «آب دریا»، «آب دریای سطحی»، «آب دریای سطحی».این منجر به 5903 MAG (734 با کیفیت بالا) شد که در 1823 OTU توزیع شد (اینجا مشاهده کنید).
ژنومهای پروکاریوتی با استفاده از GTDB-Tk (v.1.0.2)64 با پارامترهای پیشفرض که GTDB r89 نسخه 13 را هدف قرار میدهند به صورت طبقهبندی مشروح شدند. Anvi'o برای شناسایی ژنومهای یوکاریوتی بر اساس پیشبینی دامنه و فراخوانی ≥50% و افزونگی ≤ استفاده شد.حاشیه نویسی طبقه بندی یک گونه به عنوان یکی از ژنوم های نماینده آن تعریف می شود.به استثنای یوکاریوتها (148 MAG)، هر ژنوم ابتدا با استفاده از prokka (v.1.14.5)65، نامگذاری ژنهای کامل، تعریف پارامترهای «archaea» یا «باکتریها» در صورت نیاز، که برای غیر غیرمجاز نیز گزارش شده است، از نظر عملکردی حاشیهنویسی شد. ژن های کد کنندهو مناطق CRISPR، در میان سایر ویژگی های ژنومی.ژنهای پیشبینیشده را با شناسایی ژنهای نشانگر تککپی جهانی (uscMG) با استفاده از fetchMG (v.1.2)66، اختصاص گروههای ارتولوگ و پرس و جو با استفاده از emapper (v.2.0.1)67 بر اساس eggNOG (v.5.0)68 حاشیهنویسی کنید.پایگاه داده KEGG (منتشر شده در 10 فوریه 2020) 69. آخرین مرحله با تطبیق پروتئین ها با پایگاه داده KEGG با استفاده از DIAMOND (v.0.9.30)70 با پرس و جو و پوشش موضوعی ≥70% انجام شد.نتایج بیشتر بر اساس NCBI Prokaryotic Genome Annotation Pipeline71 بر اساس میزان بیت ≥ 50 درصد حداکثر میزان بیت مورد انتظار (خود پیوند) فیلتر شدند.توالیهای ژنی نیز به عنوان ورودی برای شناسایی BGCها در ژنوم با استفاده از antiSMASH (v.5.1.0)72 با پارامترهای پیشفرض و انفجارهای خوشهای مختلف استفاده شد.همه ژنوم ها و حاشیه نویسی ها به همراه ابرداده های متنی موجود در وب (https://microbiomics.io/ocean/) در OMD گردآوری شده اند.
مشابه روشهای توصیفشده قبلی12،22، ما از CD-HIT (v.4.8.1) برای خوشهبندی بیش از 56.6 میلیون ژن کدکننده پروتئین از ژنومهای باکتریایی و باستانی از OMD به 95 درصد هویت و ژنهای کوتاهتر (90 درصد پوشش) استفاده کردیم. بیش از 17.7 میلیون خوشه ژنیطولانی ترین توالی به عنوان ژن نماینده برای هر خوشه ژن انتخاب شد.سپس 1038 متاژنوم با بیش از 17.7 میلیون عضو خوشه BWA (-a) مطابقت داده شد و فایلهای BAM حاصل فیلتر شدند تا فقط ترازهایی با 95% هویت و ≥45 تراز پایه را حفظ کنند.فراوانی ژن نرمال شده با طول ابتدا با شمارش درجها از بهترین همترازی منحصربهفرد و سپس برای درجهای نقشهبرداری فازی، با اضافه کردن تعداد کسری به ژنهای هدف مربوطه متناسب با تعداد درجهای منحصربهفرد، محاسبه شد.
ژنوم های OMD گسترش یافته (با MAG های اضافی از "Ca. Eudormicrobiaceae"، در زیر ببینید) به پایگاه داده ابزار تجزیه و تحلیل متاژنومی mOTUs74 (نسخه 2.5.1) اضافه شد تا یک پایگاه داده مرجع mOTU توسعه یافته ایجاد شود.تنها شش ژنوم تک کپی (23528 ژنوم) از ده uscMG زنده ماندند.گسترش پایگاه داده منجر به 4494 خوشه اضافی در سطح گونه شد.1038 متاژنوم با استفاده از پارامترهای پیشفرض mOTU (v.2) آنالیز شدند.در مجموع 989 ژنوم موجود در 644 خوشه mOTU (95٪ REF، 5٪ SAG و 99.9٪ متعلق به MarDB) توسط پروفایل mOTU شناسایی نشدند.این منعکس کننده منابع اضافی مختلف جداسازی دریایی ژنوم های MarDB است (بیشتر ژنوم های کشف نشده با ارگانیسم های جدا شده از رسوبات، میزبان های دریایی و غیره مرتبط هستند).برای ادامه تمرکز بر محیط اقیانوس باز در این مطالعه، آنها را از تجزیه و تحلیل پایین دست حذف کردیم، مگر اینکه در پایگاه داده توسعه یافته mOTU ایجاد شده در این مطالعه شناسایی یا گنجانده شوند.
همه BGCها از MAG، SAG و REF در OMD (نگاه کنید به بالا) با BGCهای شناسایی شده در همه داربست های متاژنومی (antiSMASH v.5.0، پارامترهای پیش فرض) ترکیب شدند و با استفاده از BiG-SLICE (v.1.1) (دامنه PFAM )75 مشخص شدند.بر اساس این ویژگیها، ما تمام فاصلههای کسینوس بین BGCها را محاسبه کرده و آنها را (پیوندهای میانگین) به ترتیب با استفاده از آستانههای فاصله 0.2 و 0.8 به GCF و GCC گروهبندی کردیم.این آستانهها انطباق آستانههایی هستند که قبلاً با استفاده از فاصله اقلیدسی ۷۵ همراه با فاصله کسینوس استفاده میشدند، که برخی از خطاها را در استراتژی اصلی خوشهبندی BiG-SLICE (اطلاعات تکمیلی) کاهش میدهد.
سپس BGCها فیلتر شدند تا فقط ≥5 کیلوبایت کدگذاری شده روی داربست ها را حفظ کنند تا خطر تکه تکه شدن همانطور که قبلاً توضیح داده شد کاهش یابد (16).این باعث شد که در مجموع 39055 BGC توسط ژنوم OMD کدگذاری شوند و 14106 اضافی روی قطعات متاژنومی شناسایی شدند (یعنی در MAGها ترکیب نشده اند).این BGCهای "متاژنومیک" برای تخمین نسبت پتانسیل بیوسنتز میکروبیوم دریایی که در پایگاه داده (اطلاعات تکمیلی) ثبت نشده استفاده شد.هر BGC از نظر عملکردی با توجه به انواع محصول پیشبینی شده توسط دستههای محصول ضد SMASH یا درشتتر تعریف شده در BiG-SCAPE76 مشخص شد.برای جلوگیری از سوگیری نمونهگیری در کمیسازی (ترکیب طبقهبندی و عملکردی GCC/GCF، فاصله GCF و GCC تا پایگاههای داده مرجع، و فراوانی متاژنومی GCF)، با نگه داشتن تنها طولانیترین BGC در هر GCF برای هر گونه، 39055 BGC بیشتر حذف شد. در مجموع 17689 BGC به دست آمد.
جدید بودن GCC و GCF بر اساس فاصله بین پایگاه داده محاسبه شده (پایگاه داده RefSeq در BiG-FAM)29 و تأیید تجربی (MIBIG 2.0) 30 BGC ارزیابی شد.برای هر یک از 17689 BGC نماینده، ما کوچکترین فاصله کسینوس تا پایگاه داده مربوطه را انتخاب کردیم.سپس این حداقل فاصله ها بر اساس GCF یا GCC، در صورت لزوم، میانگین (میانگین) می شوند.یک GCF جدید در نظر گرفته می شود اگر فاصله تا پایگاه داده بزرگتر از 0.2 باشد که مربوط به جدایی ایده آل بین GCF (متوسط) و مرجع است.برای GCC، ما 0.4 را انتخاب می کنیم که دو برابر آستانه تعریف شده توسط GCF است تا در یک رابطه طولانی مدت با پیوندها قفل شود.
فراوانی متاژنومی BGC بهعنوان میانگین فراوانی ژنهای بیوسنتزی آن (همانطور که توسط anti-SMASH تعیین میشود) در دسترس از پروفایلهای سطح ژن برآورد شد.سپس فراوانی متاژنومی هر GCF یا GCC به عنوان مجموع BGCهای نماینده (از 17689) محاسبه شد.این نقشههای فراوانی متعاقباً برای ترکیب سلولی با استفاده از تعداد mOTU در هر نمونه نرمالسازی شدند، که تلاشهای توالییابی را نیز به حساب میآورد (دادههای گسترده، شکل 1d).شیوع GCF یا GCC به عنوان درصد نمونههای با فراوانی > 0 محاسبه شد.
فاصله اقلیدسی بین نمونه ها از پروفایل نرمال شده GCF محاسبه شد.اندازه این فواصل با استفاده از UMAP77 کاهش یافت و تعبیههای حاصل برای خوشهبندی مبتنی بر چگالی بدون نظارت با استفاده از HDBSCAN78 استفاده شد.حداقل تعداد نقاط بهینه برای یک خوشه (و در نتیجه تعداد خوشه ها) مورد استفاده توسط HDBSCAN با به حداکثر رساندن احتمال تجمعی عضویت در خوشه تعیین می شود.خوشههای شناساییشده (و یک نمونه فرعی متوازن تصادفی از این خوشهها برای در نظر گرفتن سوگیری در تحلیل واریانس چند متغیره جایگشتی (PERMANOVA)) برای اهمیت در برابر فواصل اقلیدسی کاهشیافته با استفاده از PERMANOVA مورد آزمایش قرار گرفتند.میانگین اندازه ژنوم نمونه ها بر اساس فراوانی نسبی mOTU و اندازه ژنوم تخمینی اعضای ژنوم ها محاسبه شد.به طور خاص، میانگین اندازه ژنوم هر MOTU به عنوان میانگین اندازه ژنوم اعضای آن که برای کامل بودن تصحیح شد (پس از فیلتر کردن) برآورد شد (به عنوان مثال، یک ژنوم کامل 75 درصد با طول 3 مگابایت دارای اندازه تنظیم شده 4 است. MB).برای ژنوم های متوسط با یکپارچگی ≥70٪.سپس میانگین اندازه ژنوم برای هر نمونه به عنوان مجموع اندازههای ژنوم mOTU با وزن فراوانی نسبی محاسبه شد.
مجموعه ای فیلتر شده از BGC های کدگذاری شده با ژنوم در OMD در درختان GTDB باکتریایی و باستانی (در چارچوب های ۵ کیلوبایتی، به استثنای REF و SAG MarDB که در ۱۰۳۸ متاژنوم یافت نشد، در بالا مشاهده نمی شود) و دسته های محصول پیش بینی شده آنها بر اساس فیلوژنتیک نشان داده شده است. موقعیت ژنوم (به بالا مراجعه کنید).ما ابتدا داده ها را بر اساس گونه کاهش دادیم، با استفاده از ژنوم با بیشترین BGC در آن گونه به عنوان نماینده.برای تجسم، نمایندگان بیشتر به گروههای درختی تقسیم شدند و دوباره برای هر کلاد سلولی، ژنوم حاوی بیشترین تعداد BGC به عنوان نماینده انتخاب شد.گونه های غنی شده با BGC (حداقل یک ژنوم با بیش از 15 BGCs) با محاسبه شاخص تنوع شانون برای انواع محصول کدگذاری شده در آن BGCها بیشتر مورد تجزیه و تحلیل قرار گرفتند.اگر همه انواع محصولات پیشبینیشده یکسان باشند، هیبریدهای شیمیایی و سایر BGCهای پیچیده (که توسط anti-SMAH پیشبینی میشود) صرف نظر از ترتیب آنها در خوشه (مثلاً همجوشی پروتئین-باکتریوسین و باکتریوسین-پروتئوپروتئین) متعلق به یک نوع محصول در نظر گرفته میشوند. بدن).ترکیبی).
DNA باقیمانده (تخمین زده شده 6 نانوگرم) از نمونه Malaspina MP1648، مربوط به نمونه بیولوژیکی SAMN05421555 و مطابق با مجموعه خواندن متاژنومیک Illumina SRR3962772 برای خواندن کوتاه، پردازش شده بر اساس پروتکل توالی یابی PacBio با ورودی بسیار کم kmplit، یک نمونه ورودی PacBibeo برای استفاده از PacNARTD کیت (100-980-000) و کیت آماده سازی قالب SMRTbell Express 2.0 (900-938-100).به طور خلاصه، DNA باقیمانده با استفاده از کوواریس (g-TUBE، 52104) بریده، ترمیم و خالص شد (دانههای ProNex).سپس DNA خالص شده در معرض آماده سازی کتابخانه، تقویت، خالص سازی (دانه های ProNex) و انتخاب اندازه (> 6 کیلوبایت، آبی پیپین) قبل از مرحله خالص سازی نهایی (دانه های ProNex) و تعیین توالی بر روی پلت فرم Sequel II قرار می گیرد.
بازسازی دو حدود اول.برای MAG Eremiobacerota، ما شش ANI اضافی بیش از 99% شناسایی کردیم (اینها در شکل 3 آمده است)، که در ابتدا بر اساس نمرات آلودگی فیلتر شدند (بعدها به عنوان تکرار ژن شناسایی شدند، به زیر مراجعه کنید).ما همچنین یک سینی با برچسب "Ca" پیدا کردیم.Eremiobacerota» از مطالعات مختلف23 و آنها را همراه با هشت MAG از مطالعه ما به عنوان مرجعی برای خواندن متاژنومی از 633 نمونه غنی شده با یوکاریوت (> 0.8 میکرومتر) با استفاده از BWA (v.0.7.17) Ref -r1188، - یک پرچم) برای نمونه برداری استفاده کردیم. نقشه برداری (5 میلیون خوانده شده).بر اساس نقشههای خاص غنیسازی (فیلتر شده با ۹۵٪ هویت تراز و ۸۰٪ پوشش خواندن)، ۱۰ متاژنوم (پوشش مورد انتظار ≥۵×) برای مونتاژ و ۴۹ متاژنوم اضافی (پوشش مورد انتظار ≥1×) برای همبستگی محتوا انتخاب شدند.با استفاده از پارامترهای مشابه بالا، این نمونهها جمع شدند و 10 کلسیم اضافی اضافه شد.MAG Eremiobacerota بازسازی شده است.این 16 MAG (بدون احتساب دو مورد از قبل در پایگاه داده) تعداد کل ژنوم ها را در OMD گسترش یافته به 34815 می رساند.MAGها بر اساس شباهت ژنومی و موقعیت آنها در GTDB رتبه های طبقه بندی می شوند.18 MAG با استفاده از dRep به 5 گونه (ANI درون گونه ای > 99٪) و 3 جنس (ANI درون ژنی 85٪ تا 94٪) در همان خانواده حذف شدند.نمایندگان گونه ها به صورت دستی بر اساس یکپارچگی، آلودگی و N50 انتخاب شدند.نامگذاری پیشنهادی در اطلاعات تکمیلی ارائه شده است.
یکپارچگی و آلودگی 'Ca' را ارزیابی کنید.MAG Eremiobacerota، ما حضور uscMG و همچنین مجموعههای ژن نشانگر تکنسخهای اختصاصی و دامنهای را که توسط CheckM و Anvi'o استفاده میشوند، ارزیابی کردیم.شناسایی 2 تکرار از 40 uscMG با بازسازی فیلوژنتیک (به زیر مراجعه کنید) برای رد هرگونه آلودگی بالقوه تأیید شد (این معادل 5٪ بر اساس این 40 ژن نشانگر است).یک مطالعه اضافی از پنج نماینده MAGs 'Ca.سطح پایین آلایندهها در این ژنومهای بازسازیشده برای گونههای Eremiobacerota با استفاده از رابط تعاملی Anvi'o بر اساس فراوانی و همبستگیهای ترکیب توالی (اطلاعات تکمیلی) تأیید شد.
برای تجزیه و تحلیل فیلوژنومیک، ما پنج MAG نماینده "Ca" را انتخاب کردیم.Eudormicrobiaceae، همه گونه های "Ca.ژنوم ارمیوباکتروتا و اعضای دیگر شاخه ها (از جمله UBP13، Armatimonadota، Patescibacteria، Dormibbacerota، Chloroflexota، Cyanobacteria، Actinobacteria و Planctomycetota) از GTDB (r89)13 در دسترس است.همه این ژنوم ها همانطور که قبلا برای استخراج ژن نشانگر تک نسخه ای و حاشیه نویسی BGC شرح داده شد، حاشیه نویسی شدند.ژنوم های GTDB با توجه به یکپارچگی و معیارهای آلودگی فوق حفظ شدند.تجزیه و تحلیل فیلوژنتیک با استفاده از گردش کار Anvi'o Phylogenetics59 انجام شد.درخت با استفاده از IQTREE (v.2.0.3) (گزینههای پیشفرض و -bb 1000)80 روی همترازی 39 پروتئین ریبوزومی پشت سر هم که توسط Anvi'o (MUSCLE, v.3.8.1551) شناسایی شدهاند، ساخته شد.موقعیت های او کاهش یافت.برای پوشش حداقل 50 درصد از ژنوم 82 و Planctomycecota به عنوان یک گروه برون بر اساس توپولوژی درخت GTDB استفاده شد.یک درخت از 40 uscMG با استفاده از ابزارها و پارامترهای مشابه ساخته شد.
ما از Traitar (v.1.1.2) با پارامترهای پیشفرض (فنوتیپ، از نوکلئوتیدها)83 برای پیشبینی صفات میکروبی رایج استفاده کردیم.ما یک سبک زندگی شکارچی بالقوه را بر اساس یک شاخص شکارچی که قبلا توسعه یافته بود بررسی کردیم که به محتوای یک ژن کد کننده پروتئین در ژنوم بستگی دارد.به طور خاص، ما از DIAMOND برای مقایسه پروتئینهای موجود در ژنوم در مقابل پایگاه داده OrthoMCL (v.4)85 با استفاده از گزینههای –حساستر –id 25 –query-cover 70 –subject-cover 70 –top 20 و شمارش ژنهای مربوط به ژن های نشانگر برای شکارچیان و غیر شکارچیان.شاخص تفاوت بین تعداد نشانه های شکاری و غیر شکارچی است.به عنوان یک کنترل اضافی، ما همچنین ژنوم "Ca" را تجزیه و تحلیل کردیم.عامل Entotheonella TSY118 بر اساس ارتباط آن با Ca است.Eudoremicrobium (اندازه ژنوم بزرگ و پتانسیل بیوسنتزی).در مرحله بعد، ما پیوندهای بالقوه بین ژن های نشانگر شکارچی و غیر شکارچی و پتانسیل بیوسنتزی کلسیم را آزمایش کردیم.Eudormicrobiaceae» و دریافتند که بیش از یک ژن (از هر نوع ژن نشانگر، یعنی ژن شکارگر/غیر شکارگر) با BGC همپوشانی ندارد، که نشان میدهد BGC سیگنالهای شکار را مخدوش نمیکند.حاشیه نویسی ژنومی اضافی از replicon های درهم با استفاده از TXSSCAN (v.1.0.2) برای بررسی خاص سیستم ترشح، pili و flagella86 انجام شد.
پنج نماینده Ca با نقشه برداری از 623 متاترانسکریپتوم از بخش های غنی سازی پروکاریوتی و یوکاریوتی اقیانوس های تارا 22،40،87 (با استفاده از BWA، v.0.7.17-r1188، -a flag) نقشه برداری شدند.ژنوم Eudormicrobiaceae.فایلهای BAM با FeatureCounts (v.2.0.1)88 پس از 80% پوشش خواندن و 95% فیلتر هویت پردازش شدند (با ویژگی گزینههای Counts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) شمارش میکند تعداد درج در هر ژننقشه های تولید شده برای طول ژن و فراوانی ژن نشانگر mOTU نرمال سازی شدند (متوسط تعداد درج با طول نرمال شده برای ژن هایی با تعداد درج > 0) و به 74/22 تبدیل شدند تا بیان نسبی در هر سلول از هر سطح ژن به دست آید، که همچنین توضیح می دهد تنوع از نمونه به نمونه در طول توالی یابیچنین نسبتهایی امکان تجزیه و تحلیل مقایسهای را فراهم میکند و مشکلات ترکیب را هنگام استفاده از دادههای فراوانی نسبی کاهش میدهد.فقط نمونه هایی با بیش از 5 ژن از 10 ژن نشانگر mOTU برای تجزیه و تحلیل بیشتر در نظر گرفته شدند تا بتوان بخش بزرگی از ژنوم را تشخیص داد.
نمایه رونوشت نرمال شده Ca.E. taraoceanii در معرض کاهش ابعاد با استفاده از UMAP قرار گرفت و نمایش حاصل برای خوشهبندی بدون نظارت با استفاده از HDBSCAN (به بالا مراجعه کنید) برای تعیین وضعیت بیان استفاده شد.PERMANOVA اهمیت تفاوت بین خوشه های شناسایی شده را در فضای فاصله اصلی (نه کاهش یافته) آزمایش می کند.بیان تفاوت بین این شرایط در سراسر ژنوم مورد آزمایش قرار گرفت (به بالا مراجعه کنید) و 201 مسیر KEGG در 6 گروه عملکردی شناسایی شد، به نامهای: BGC، سیستم ترشحی و ژنهای تاژکدار از TXSSCAN، آنزیمهای تخریب (پروتئاز و پپتیدازها)، و شکارچی و غیر شکاری ژن های شکارچینشانگرهای شاخص شکارچیبرای هر نمونه، میانگین بیان نرمال شده را برای هر کلاس محاسبه کردیم (توجه داشته باشید که خود بیان BGC به عنوان میانگین بیان ژن های بیوسنتزی برای آن BGC محاسبه می شود) و برای اهمیت در بین حالت ها آزمایش شد (تست Kruskal-Wallis تنظیم شده برای FDR).
ژن های مصنوعی از GenScript و پرایمرهای PCR از Microsynth خریداری شدند.پلیمراز فوژن از Thermo Fisher Scientific برای تکثیر DNA استفاده شد.برای خالص سازی DNA از پلاسمیدهای NucleoSpin، ژل NucleoSpin و کیت خالص سازی PCR از Macherey-Nagel استفاده شد.آنزیم های محدود کننده و T4 DNA لیگاز از New England Biolabs خریداری شد.مواد شیمیایی به غیر از ایزوپروپیل-β-d-1-تیوگالاکتوپیرانوسید (IPTG) (Biosynth) و 1،4-دی تیوتریتول (DTT، AppliChem) از Sigma-Aldrich خریداری شدند و بدون خالص سازی بیشتر مورد استفاده قرار گرفتند.آنتی بیوتیک های کلرامفنیکل (Cm)، اسپکتینومایسین دی هیدروکلراید (Sm)، آمپی سیلین (Amp)، جنتامایسین (Gt) و کاربنی سیلین (Cbn) از AppliChem خریداری شدند.اجزای رسانه ای Bacto Tryptone و Bacto Yeast Extract از BD Biosciences خریداری شدند.تریپسین برای توالی یابی از پرومگا خریداری شد.
توالی های ژنی از BGC 75.1 ضد SMASH استخراج شد.E. malaspinii (اطلاعات تکمیلی).
ژنهای embA (منبع، MALA_SAMN05422137_METAG-framework_127-gene_5)، embM (منبع، MALA_SAMN05422137_METAG-framework_127-gene_4)، و embAM (شامل نواحی بینژنی) بدون همسازهها (شامل نواحی بینژنی) با همگامسازیشده و نواحی بینژنی بهعنوان ترکیببندی شدند. برای بیان در E چه زمانی.ژن embA در اولین سایت شبیهسازی چندگانه (MCS1) pACYCDuet-1 (CmR) و pCDFDuet-1 (SmR) با سایتهای برش BamHI و HindIII سابکلون شد.ژنهای embM و embMopt (بهینهسازی شده با کدون) در MCS1 pCDFDuet-1 (SmR) با BamHI و HindIII ساب کلون شدند و در دومین سایت شبیهسازی چندگانه pCDFDuet-1 (SmR) و pRSFDuet-1 (KanR) (MCS2) قرار گرفتند. NdeI/ChoI.کاست embAM در pCDFDuet1 (SmR) با سایتهای برش BamHI و HindIII سابکلون شد.ژن orf3/embI (موقعیت، MALA_SAMN05422137_METAG-scaffold_127-gene_3) با استفاده از PCR پسوند همپوشانی با استفاده از پرایمرهای EmbI_OE_F_NdeI و EmbI_OE_R_XhoI، هضم شده با NdeI و با استفاده از NdeI/Dliget به p همان آنزیم های محدود کننده (مکمل جدول).6).هضم و بستن آنزیم محدود طبق پروتکل سازنده (New England Biolabs) انجام شد.
زمان ارسال: مارس-14-2023