[Перевод] Глубокое обучение в науке вредно без глубокой проверки фактов

Глубокое обучение гламурно и ажиотажно. Если обучить трансформер (современную языковую модель) на датасете из 22 миллионов ферментов, а затем использовать его для прогнозирования функции 450 неизвестных ферментов, то можно опубликовать свои результаты Nature Communications (уважаемом научном издании). Вашу статью прочитают 22 тысяч раз и она будет в верхних 5% из всех результатов исследований по оценке Altmetric (рейтингу внимания к онлайн-статьям). Однако если вы проделаете кропотливую работу по анализу чужой опубликованной работы и обнаружите, что она полна серьёзных ошибок, в том числе сотнями некорректных прогнозов, то можете опубликовать на bioRxiv препринт, который не получит и доли цитат и просмотров исходного исследования. На самом деле, именно это и произошло в случае двух статей: Functional annotation of enzyme-encoding genes using deep learning with transformer layers | Nature Communications Limitations of Current Machine-Learning Models in Predicting Enzymatic Functions for Uncharacterized Proteins | bioRxiv Эта пара статей о функциях ферментов стала прекрасным примером для изучения границ применения ИИ в биологии и неправильно расставленных акцентов в современной публикации результатов. В этом посте я расскажу о некоторых подробностях, однако призываю вас изучить статьи самостоятельно. Этот контраст станет ярким напоминанием о том, как сложно бывает оценить правдивость результатов ИИ без глубокого знания предметной области.

https://habr.com/ru/articles/917656/

#трансформеры #ферменты #биоинформатика #bert #энзимы

Глубокое обучение в науке вредно без глубокой проверки фактов

Глубокое обучение гламурно и ажиотажно. Если обучить трансформер (современную языковую модель) на датасете из 22 миллионов ферментов, а затем использовать его для прогнозирования функции 450...

Хабр

Как собрать ДНК с помощью кода: симуляция молекулярных операций на Python

Синтез ДНК кажется чем-то сугубо биологическим — с пробирками, центрифугами и белыми халатами. Но что, если попробовать собрать ДНК в коде? Не просто сгенерировать последовательность, а симулировать реальные процессы: лигирование, гибридизацию, ПЦР, ошибочные вставки, ферментативные сдвиги и многое другое. В этой статье — практическая попытка воссоздать молекулярную биологию средствами Python, без библиотек типа Biopython, с нуля. Много кода, немного шуток и один вопрос — можно ли построить in silico ДНК-лабораторию? Слова “биоинформатика” и “программирование” обычно встречаются в одном предложении, когда речь идёт о парсинге геномов, анализе экспрессии генов или машинном обучении для диагностики. Но однажды захотелось большего. Хотелось не просто читать гены, а играть с ними. Моделировать их, собирать руками. Вернее, клавиатурой. Идея : построить в коде лабораторную скамью, где можно будет “сшивать” фрагменты ДНК, копировать их, проверять на ошибки. Причём без привычных библиотек вроде Biopython — просто Python, NumPy и желание воссоздать реальный молекулярный процесс в виртуальной среде. Можно ли собрать виртуальную ДНК-плазмиду и отдать её синтетической биологии? Да. Но сначала немного теории.

https://habr.com/ru/articles/916192/

#симуляция_ДНК #молекулярная_биология #python #нуклеотиды #ферменты #генетика #кодирование_биологии #пцр #лигирование #последовательности_ДНК

Как собрать ДНК с помощью кода: симуляция молекулярных операций на Python

Синтез ДНК кажется чем-то сугубо биологическим — с пробирками, центрифугами и белыми халатами. Но что, если попробовать собрать ДНК в коде? Не просто сгенерировать последовательность, а симулировать...

Хабр

Клетка ХIX. Метаболизм

Среди важнейших признаков живой материи ее субъекты (объекты, организмы) выделяются из всех возможных обменом информацией, веществом и энергией с внешней средой, которые служат основой жизнедеятельности организмов. Помимо этого совокупность процессов регуляции, превращения веществ и трансформация энергии происходит и непосредственно в самих субъектах-живых организмах. Такие потоки информации (управления, регуляции), вещества и энергии между неорганической средой и биосферой, образуемой живыми организмами, всегда контролируются и регулируются многоуровневыми регуляторными информационными системами. А они обеспечивают упорядоченное во времени и в клеточном пространстве протекание химических реакций с множеством разнообразных ферментов. Обычно называют пять признаков живых систем : 1. Открытость (живые системы обмениваются с окружающей средой энергией, информацией, веществом) 2.Самовоспроизведение 3Саморегуляция(гомеостаз; системы не требуют регуляции из вне) 4.Самообновление (системы эволюционируют во времени) 5. Высокоупорядоченность На клеточном уровне реакции протекают последовательно в строго определенных участках клеток, что обеспечивается принципом компартментации клетки. Компартментализация (компартментация) — разделение клеток эукариот на отсеки (компартменты: митохондрии , хлоропласты , пероксисомы , лизосомы , эндоплазматический ретикулум , ядро клетки и аппарат Гольджи .), покрытые оболочкой из бислоя липидов, в которых локализованы определенные биохимические процессы. В самих компартментах (в том числе ядрах) выделяются также субкомпартменты , различающиеся по форме и функциям [1] .

https://habr.com/ru/articles/824658/

#метаболизм #анаболизм #катаболим #ферменты #пептиды #жиры #белки #дыхание #гликозид #глюкоза

Клетка ХIX. Метаболизм

Среди важнейших признаков живой материи ее субъекты (объекты, организмы) выделяются из всех возможных обменом информацией, веществом и энергией с внешней средой, которые служат основой...

Хабр

Контроль популяции: генетика в борьбе с насекомыми-вредителями

Большинство живых организмов на планете в той или иной степени взаимосвязаны и участвуют в формировании пищевой цепи. Удаление какого-либо вида из этой цепи может привести к дисбалансу экосистемы с ее последующем увяданием. При этом существуют организмы, польза от которых весьма сомнительна. Речь, конечно же, о паразитах, многие из которых оказывают негативное влияние на определенные сферы деятельности человека. В попытках избавится от вредителей, мы используем разного рода химические вещества, которые могут нести потенциальный вред не только сельхоз культурам, но и здоровью человека. Ученые из университета Джонса Хопкинса (США) нашли более безопасный метод в борьбе с паразитическими насекомыми, основанный на контроле их популяции. Как именно ученым удалось получить контроль над рождаемостью насекомых, и насколько эффективен их метод? Ответы на эти вопросы мы найдем в докладе ученых.

https://habr.com/ru/companies/ua-hosting/articles/816861/

#паразиты #насекомые #дрозофила #плодовая_мушка #вредители #генетика #ферменты #йод #щитовидная_железа #контроль_рождаемости #фертильность #биология #химия #экология #медицина

Контроль популяции: генетика в борьбе с насекомыми-вредителями

Большинство живых организмов на планете в той или иной степени взаимосвязаны и участвуют в формировании пищевой цепи. Удаление какого-либо вида из этой цепи может привести к дисбалансу экосистемы с ее...

Хабр