Itinai.com it company office background blured chaos 50 v 774f6708 277e 48b0 88cb 567652104bfb 3
Itinai.com it company office background blured chaos 50 v 774f6708 277e 48b0 88cb 567652104bfb 3

Tencent Research представила DRT-o1: две версии DRT-o1-7B и DRT-o1-14B с прорывом в нейронном машинном переводе литературных текстов

 Tencent Research Introduces DRT-o1: Two Variants DRT-o1-7B and DRT-o1-14B with Breakthrough in Neural Machine Translation for Literary Texts

«`html

Нейронный машинный перевод (НМП)

Нейронный машинный перевод – это сложная область обработки естественного языка, которая автоматизирует перевод текста между языками с использованием моделей машинного обучения. За годы своего развития он стал незаменимым инструментом для глобальной коммуникации, применяемым в таких областях, как перевод технических документов и локализация цифрового контента.

Проблемы перевода литературного контента

Несмотря на успехи в переводе простого текста, НМП сталкивается с проблемами при работе с литературным контентом, насыщенным метафорами и сравнениями. Эти выражения несут глубокие культурные и контекстуальные нюансы, что делает их перевод более сложным. Обычные системы часто прибегают к дословному переводу, который может не передавать задуманное значение и культурную суть, особенно в литературе.

Уникальные трудности перевода

Перевод идиоматических выражений и метафорических текстов предполагает уникальные сложности из-за их зависимости от культурной интерпретации. Дословные переводы часто ведут к потере нюансов, что делает результат запутанным или лишенным смысла для носителей языка. Даже самые продвинутые системы НМП не всегда способны корректно интерпретировать абстрактный и фигуративный язык.

Инновационная система DRT-o1 от Tencent

Исследователи из Tencent разработали инновационную систему DRT-o1, которая включает два варианта:

  • DRT-o1-7B
  • DRT-o1-14B

Эти варианты строятся на основе Qwen2.5 и интегрируют новую многопользовательскую структуру для решения сложностей перевода метафорического и идиоматического содержания. Исследователи сосредоточились на литературе и отобрали 63,000 подходящих предложений для перевода.

Многопользовательская структура

Система DRT-o1 использует три роли для итеративного улучшения перевода:

  • Переводчик
  • Советник
  • Оценщик

Каждый агент последовательно улучшает перевод, обеспечивая качество результата.

Достижения DRT-o1

Система DRT-o1 значительно улучшает производительность по сравнению с существующими моделями НМП. Результаты экспериментов показывают, что DRT-o1-7B увеличивает BLEU на 8.26 пунктов, а DRT-o1-14B – на 7.33 пункта. Интеграция GPT-4o гарантирует плавность и читабельность, что значительно улучшает качество машинных переводов.

Выводы исследования

  • Создание датасета включало 577,600 предложений, отобранных из 400 книг.
  • Многопользовательская структура обеспечивает итеративное улучшение качества перевода.
  • Системы DRT-o1-7B и DRT-o1-14B превосходят существующие модели.
  • Интеграция GPT-4o улучшает качество машинных переводов.

Заключение

Система DRT-o1 и ее варианты представляют собой трансформационный подход к нейронному машинному переводу. Исследователи преодолели давние проблемы, сосредоточившись на литературном языке и внедряя сложную многопользовательскую структуру, что позволяет сохранять смысл и культурный контекст метафор и сравнений.

Используйте искусственный интеллект для развития вашей компании

Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта и оставалась в числе лидеров, грамотно используйте DRT-o1. Определите, как AI может изменить вашу работу, и выберите подходящее решение для автоматизации.

«`

Бесплатный ИИ: для автоматизации продаж

Умные продажи