Abstract
We introduce the concept of metaconsensus and employ it to make high confidence predictions of early enzyme functions and the metabolic properties that they may have produced. Several independent studies have used comparative bioinformatics methods to identify taxonomically broad features of genomic sequence data, protein structure data, and metabolic pathway data in order to predict physiological features that were present in early, ancestral life forms. But all such methods carry with them some level of technical bias. Here, we cross-reference the results of these previous studies to determine enzyme functions predicted to be ancient by multiple methods. We survey modern metabolic pathways to identify those that maintain the highest frequency of metaconsensus enzymes. Using the full set of modern reactions catalyzed by these metaconsensus enzyme functions, we reconstruct a representative metabolic network that may reflect the core metabolism of early life forms. Our results show that ten enzyme functions, four hydrolases, three transferases, one oxidoreductase, one lyase, and one ligase, are determined by metaconsensus to be present at least as late as the last universal common ancestor. Subnetworks within central metabolic processes related to sugar and starch metabolism, amino acid biosynthesis, phospholipid metabolism, and CoA biosynthesis, have high frequencies of these enzyme functions. We demonstrate that a large metabolic network can be generated from this small number of enzyme functions
چکیده
در اینجا اتفاق نظر متا و نقش آن در پیشبینیهای آن در اعمال آنزیمهای اولیه و ویژگیهای متابولیکی که موجب میشود، را معرفی میکنیم. چندین مطالعه روش بیوانفورماتیکی مستقل قابل مقایسه بهمنظور شناسایی ویژگیهای تاکسونومیکی دادههای ژنتیکی، ساختار پروتئینها و و دادههای مربوط به مسیر متابولیسمی جهت پیشگویی مسیر فیزیولوژیکی شکلهای زندگی اجدادی و اولیه ارائه شده است. اما تمام روشها با تکیه بر تکنیکهای مناسب انجام شده است. در اینجا، با توجه به نتایج قبلی، مشخص شد که چندین روش برای پیشگویی اعمال آنزیمی قدیمی میباشد. ما روشهای متابولیکی جدیدی برای شناسایی روشهایی با بالاترین میزان فرکانس آنزیمهایی با اتفاقنظر متا را نگه داشتیم. با استفاده از گروهی از برهمکنشهای جدید کاتالیز شده با اشکال آنزیمی متا، به بازسازی شبکهای پرداختیم که منعکسکننده متابولیسم هستهای اشکال اولیه زندگی است. نتایج ما ده عمل آنزیمی را نشان دادند که 4 تا از آنها نقش هیدرولازی، سه تا ترانسفرازی، یکی اکسیدوردوکتازی، یکی لیازی، و یکی لیگازی داشتند و حداقل در اجداد مشترک وجود داشتند. زیرشبکهها در مراحل متابولیکی مرکزی در ارتباط با متابولیسم قند و نشاسته، بیوسنتز آمینواسید، متابولیسم فسفولیپید، و بیوسنتز کوانزیم A بودند که آنزیمهای متعددی مسئول انجام آنها هستند. ما نشان دادیم که شبکه متابولیکی بزرگی میتواند از این تعداد اندک آنزیمی ایجاد شود.
1-مقدمه
توسعه دادههای ژنومی، و زیست مولکولی موجب دستیابی به منابع عظیمی از توالیهای ژنتیکی [1، 2]، ساختارهای پروتئینی [3،4]، اعمال پروتئینها [1،5،6]، برهمکنشهای شبکه متابولیکی، و برهمکنشهای شبکههای مولکولی شده است [7]. با مقایسه این ويژگیها در درخت زندگی شناخته شده، ممکن است صفاتی آشکار شود که در گروه وسیعی از موجودات وجود دارد، بنابراین در آخرین نیای مشترک جهانی (LUCA) و اجداد آنها نیز موجود بوده است [8]. در این مطالعه تکیه ما بر دستآوردهای حال از سه روش مجزای متفاوت بوده است.
هریس و همکاران [9] توالی جهانی را با اجرای خوشههای گروههای ژنی اورتولوگ (COGs) [10] که در تمام توالیهای ژنومی کامل وجود دارند، مقایسه کردند. از 3100 گروه که در پایگاه دادهای COG لیست شده، 80 گروه در همه ژنومهای موجود مشترک بودند. از آنجاکه هر فشار تکاملی میبایست در درجه اول بر دنباله ژنی اثر گذارد، ظهور این COGها در تمامی ژنومهای توالی شده مستقیماً به ژنهای ژنومی LUCA مربوط میشود. ناقلین ژنی افقی اولیه ممکنست شکلی از COG را بسازند که با این روش بیشتر به اجداد شبیه است، درحالیکه حذف ژن، حتی در انواع جدید، کمتر به COG اجدادی مشابهت دارد....