
«`html
Named Entity Recognition (NER) в области обработки естественного языка
Распознавание именованных сущностей (NER) является важным элементом обработки естественного языка и находит применение в медицинском кодировании, финансовом анализе и разборе юридических документов. Компанией NuMind был представлен подход, который предлагает использовать большие языковые модели (LLM) для уменьшения ручной разметки при создании пользовательских моделей. В результате были представлены три модели NER: NuNER Zero, NuNER Zero 4k и NuNER Zero-span.
NuNER Zero
Модель NuNER Zero является компактной нулевой моделью, обученной на разнообразном мультидоменном наборе данных и предназначенной для обнаружения сущностей произвольной длины. Она показывает улучшение F1-Score на 3,1% по сравнению с другими моделями на бенчмарке GLiNER.
NuNER Zero 4k
Модель NuNER Zero 4k является версией NuNER Zero с увеличенным контекстом до 4 тыс. токенов и может превзойти NuNER Zero в ситуациях, где размер контекста имеет значение.
NuNER Zero-span
Модель NuNER Zero-span предназначена для предсказания длины сущности и показывает незначительное улучшение производительности по сравнению с NuNER Zero, но не может обнаруживать сущности длиной более 12 токенов.
В заключение, распознавание именованных сущностей (NER) является важным элементом обработки естественного языка. Компания NuMind предлагает подход, использующий большие языковые модели (LLM) для уменьшения ручной разметки при создании пользовательских моделей NER.
Источники:
Если вы хотите узнать больше о применении искусственного интеллекта в продажах, обращайтесь к нам по ссылке itinai.
«`