Стратегия и практика издательского бизнеса 07/2025 | Page 5

ИЮЛЬ 2025
ТЕХНОЛОГИИ И ИННОВАЦИИ
[ gipp. ru ] [ wan-ifra. org ]

5

Их использование привело к 120-процентному увеличению трафика от предлагаемых статей на ту или иную тему. Более точное распознавание объектов повысило качество персонализации и дало возможность читателям быстро отслеживать интересующие их темы. Улучшенный семантический таргетинг рекламы позволил размещать объявления с соблюдением конфиденциальности без отслеживания пользователей. Автоматизация поиска и добавление тегов сделала старые статьи более востребованными. ekstrabladet. dk
3. Генерация естественного языка( NLG)
Чтобы улучшить качество журналистских материалов, при этом сохраняя за ними редакционный контроль, и расширить их охват, в Ekstra Bladet применяют NLG. Команда PIN разработала редакционный набор ИИ-инструментов, названный Monitoring and Assisted Generation of News Artefacts( MAGNA). Эта система развивалась поэтапно:
W Автоматизация на основе правил( GOFAI). Изначально Ekstra Bladet использовала систему AX Semantics, основанную на правилах, для создания кратких новостных заметок на локальную тематику: о задержках в движении поездов, погоде, сделках с недвижимостью и т. д. К 2021 году было опубликовано 200 тысяч статей, созданных с помощью ИИ.
W Обобщение с использованием гибридного ИИ. В 2023 году были интегрированы GPT-модели OpenAI. Генерация, дополненная поиском( RAG), дала возможность выпускать контент, созданный с помощью ИИ, который основывался на фактических данных из архивов Ekstra Bladet.
W Оперативное рецензирование. Редакторы просматривали резюме, сгенерированные с помощью ИИ, перед публикацией. Отклоненные резюме учитывались в последующих генерациях, повышая их точность. В 2023 году редакция опубликовала 289 статей с использованием ИИ. Инструмент генерации заголовков и анонсов повысил вовлеченность аудитории. Оперативная проверка значительно повысила достоверность контента, созданного с помощью ИИ, сократив количество ошибок в четыре раза. Журналисты получили возможность экономить время и сосредоточиться на подготовке больших статей.
Редакция Ekstra Bladet публикует порядка 300 статей, подготовленных с использованием ИИ, в год.
Система NER автоматически идентифицирует и помечает объекты в статьях, что способствует улучшению индексации и поиску связанного контента.
Инструмент генерации заголовков и анонсов повысил вовлеченность аудитории. Оперативная редакторская проверка значительно повысила достоверность контента, созданного с помощью ИИ, сократив количество ошибок в четыре раза. Журналисты получили возможность экономить время и сосредоточиться на подготовке больших статей.
Обучение и тестирование Команда PIN разработала собственную технологию машинного обучения и установила партнерские отношения с университетами, предоставив доступ к данным, необходимым для создания и комплексной оценки ИИ-систем.
При настройке набора рекомендательных систем во время полномасштабного внедрения в 2023 году учитывались результаты более чем 50 A / B-тестов влияния различных систем на поток новостей. « Эти тесты, в числе прочего, показали, что наши модели коллаборативной фильтрации фокусируются в значительной степени на наиболее популярных новостных сюжетах, в то время как модели фильтрации на основе контента выдают рекомендации, не способные сильно удивить читателей чем-то новым », – отмечает Линдскоу.
При обучении и внедрении NLP-моделей они опирались на систему оценок, разработанной командой PIN, которая определяла влияние различных методов обучения на точность, эффективность и полезность моделей. « Это позволило нам внедрить NLP-модели со сбалансированным соотношением точности и эффективности », – говорит Линдскоу.
Наконец, при разработке ИИ-систем, основанных на NLG, они проводили тестирования в ручном и автоматическом режимах, чтобы свести к минимуму фактические ошибки, попадающие в новостной контент. По словам Линдскоу, результаты этих тестов побудили их использовать методику машинного обучения Human-in-the- Loop( HITL) и добиться того, чтобы все инструменты генеративного ИИ, которыми пользуются в редакции, опирались на архив статей Ekstra Bladet, а не полагались на внутренние « знания » GPT‐4.
Он добавляет, что в JP / Politikens охотно делятся полученными знаниями в области ИИ: « Общая цель издателей – добиться нормализации использования искусственного интеллекта в медиаиндустрии. Мы опубликовали, в частности, некоторые из наших алгоритмов NLP и базовые алгоритмы рекомендательных систем ».
Извлеченные уроки
« Проект PIN – это путешествие по неизведанной территории с большим количеством A / B-тестов. И мы вынесли из него ряд важных уроков. Во-первых, не все рекомендательные системы, которые эффективно работают в других медиасекторах, подходят для новостных СМИ. Например, коллаборативная фильтрация, которую использует Netflix, в стремительно меняющейся новостной среде часто дает эффект « холодного запуска »( ситуация, когда для корректной работы системы не хватает информации). Здесь лучше всего подойдут рекомендательные системы, основанные на контенте, с использованием NLP.
Во-вторых, нужно учитывать, что рекомендательные системы могут по-разному влиять на читательскую аудиторию. Так что мы используем различные системы, чтобы соответствовать нашим редакционным стандартам и удовлетворять разнообразные потребности читателей », – рассказывает Линдскоу.
Кроме того, в 2023 году они обнаружили, что генеративный ИИ, такой как ChatGPT, выдает гораздо меньше ошибок, когда привязан к базам данным. Поэтому в компании следят за тем, чтобы такие редакционные ИИ-инструменты опирались в первую очередь на их собственные данные.
Неха Гупта, редактор WAN-IFRA