Itinai.com beautiful russian high fashion sales representativ 59ba29bc fe25 43a5 bc68 5ce6ebe94a84 3
Itinai.com beautiful russian high fashion sales representativ 59ba29bc fe25 43a5 bc68 5ce6ebe94a84 3

Улучшение предсказания функций белков с помощью глубокого обучения с увеличением поиска

 ProtEx: Enhancing Protein Function Prediction with Retrieval-Augmented Deep Learning

«`html

ПротЕкс: улучшение прогнозирования функций белков с помощью извлечения искусственного интеллекта

Сопоставление последовательностей белков и их биологических функций имеет решающее значение в биологии, поскольку белки выполняют разнообразные роли в организмах. Функции категоризируются с использованием онтологий, таких как термины Gene Ontology (GO), номера Enzyme Commission (EC) и семейства Pfam. Вычислительные прогнозы являются неотъемлемыми из-за стоимости лабораторных экспериментов и быстрого роста баз данных. Техники включают методы на основе гомологии, которые используют инструменты для выравнивания последовательностей, такие как BLAST, для вывода функций, и методы глубокого обучения, которые прогнозируют функции непосредственно из последовательностей. Основные проблемы включают обобщение прогнозов для новых классов белков и работу с белками, которые не имеют сходства с известными последовательностями, известные как «темная материя» белковой вселенной.

ПротЕкс: новый подход к прогнозированию функций белков

Исследователи из Google DeepMind, Google и Университета Кембриджа представили ПротЕкс, метод прогнозирования функций белков с использованием извлеченных образцов из базы данных для улучшения точности, надежности и обобщения на новые классы. ПротЕкс комбинирует непараметрический поиск сходства с глубоким обучением, вдохновленным техниками извлечения в NLP и компьютерном зрении. ПротЕкс извлекает положительные и отрицательные образцы с помощью инструментов, таких как BLAST, и обучает нейронную модель сравнивать эти образцы с запросом. Этот подход достигает передовых результатов в прогнозировании номеров EC, терминов GO и семейств Pfam, особенно преуспевая с редкими и несходными последовательностями. Исследования подтверждают эффективность стратегии предварительного обучения и условий образцов.

ПротЕкс развивает традиционные методы поиска сходства белков и недавние нейронные модели для прогнозирования функций белков. Традиционные методы, такие как BLAST, извлекают гомологичные последовательности для вывода функций. Однако модели глубокого обучения могут превзойти их, прямо сопоставляя последовательности с функциями. ПротЕкс интегрирует эти подходы, используя BLAST для извлечения образцов и нейронную модель для условного прогнозирования на этих образцах. Этот метод отлично справляется, особенно с редкими и невидимыми классами. Модели извлечения вдохновляются в нейролингвистическом программировании и компьютерном зрении, что улучшает производительность путем включения контекста из извлеченных образцов. ПротЕкс эффективно адаптируется к новым меткам без дополнительной донастройки, используя предварительное обучение на множественных последовательностях для улучшения точности прогнозирования.

Применение ПротЕкс в прогнозировании функций белков

ПротЕкс направлен на прогнозирование меток функций белков для заданной последовательности аминокислот. Процесс включает извлечение соответствующих положительных и отрицательных образцов для каждой кандидатской метки с использованием методов, таких как BLAST. Модель прогнозирует значимость каждой метки, условия на последовательности и ее образцах, и агрегирует эти прогнозы для формирования окончательного набора меток. Генератор кандидатских меток уменьшает количество рассматриваемых меток для улучшения эффективности. Предварительное обучение включает сравнение пар последовательностей с различной сходностью, а донастройка использует обучающие данные для создания положительных и отрицательных примеров. Модель использует архитектуру T5 Transformer для выполнения этих задач.

Оценка ПротЕкс и его результаты

ПротЕкс был оценен с использованием нескольких наборов данных для задач классификации номеров EC, терминов GO и семейств Pfam. BLAST использовался в качестве извлекателя для задач EC и GO, в то время как подход извлечения по классам был применен к более крупному набору данных Pfam. В задачах прогнозирования EC и GO ПротЕкс превзошел предыдущие методы и показал значительные улучшения при условии образцовых последовательностей. ПротЕкс также достиг передовых результатов на наборе данных Pfam, демонстрируя последовательную точность в общих и редких семействах белков. Модель была предварительно обучена на парах последовательностей и донастроена с использованием положительных и отрицательных образцов, используя архитектуру T5 Transformer.

В заключение

ПротЕкс представляет собой метод, который интегрирует поиск сходства на основе гомологии с предварительно обученными нейронными моделями, достигая передовых результатов в задачах классификации EC, GO и Pfam. Несмотря на увеличенные вычислительные требования из-за кодирования нескольких последовательностей и независимых прогнозов классов, возможны улучшения эффективности через архитектурные настройки и генерацию кандидатских меток. Будущие улучшения могут использовать передовые техники поиска сходства и специализированные архитектуры. Несмотря на то, что метод улучшает прогнозирование функций белков, проверка через лабораторные эксперименты остается важной для критических приложений. Этот подход основан на существующих инструментах и предлагает более точные и надежные функциональные аннотации белков.

Проверьте статью. Вся заслуга за этим исследованием принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter. Присоединяйтесь к нашему каналу в Telegram, каналу в Discord и группе в LinkedIn.

Если вам нравится наша работа, вам понравится наша рассылка.

Не забудьте присоединиться к нашему SubReddit | Также, посмотрите нашу платформу AI Events

Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ) и оставалась в числе лидеров, грамотно используйте ПротЕкс: улучшение прогнозирования функций белков с помощью извлечения искусственного интеллекта.

Проанализируйте, как ИИ может изменить вашу работу. Определите, где возможно применение автоматизации: найдите моменты, когда ваши клиенты могут извлечь выгоду из AI.

Определитесь какие ключевые показатели эффективности (KPI): вы хотите улучшить с помощью ИИ.

Подберите подходящее решение, сейчас очень много вариантов ИИ. Внедряйте ИИ решения постепенно: начните с малого проекта, анализируйте результаты и KPI.

На полученных данных и опыте расширяйте автоматизацию.

Если вам нужны советы по внедрению ИИ, пишите нам на Tелеграм. Следите за новостями о ИИ в нашем Телеграм-канале itinainews или в Twitter @itinairu45358.

Попробуйте AI Sales Bot itinai.ru/aisales. Этот AI ассистент в продажах, помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж, снижать нагрузку на первую линию.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab itinai.ru. Будущее уже здесь!

«`

Бесплатный ИИ: для автоматизации продаж

Умные продажи