Начать проект

Для компании Российская газета потребовалось разработать модуль автоматической классификации статей, выявления запрещенных материалов и цитирования полученных результатов.

Проблема
Компания Российская газета является одной из крупнейших газет РФ с миллионной аудиторией. На плечи руководства ложится большая ответственность по соблюдению законов РФ относительно публикуемых материалов. Ввиду большого штата компании главному редактору приходится регулярно просматривать готовящиеся к публикации статьи на предмет упоминания в них запрещенных на территории РФ организаций, бранных слов, экстремистских и прочих недопустимых высказываний.
Решение
Нашей компанией была реализован модуль по автоматическому определению категорий статей и извлечению характеристических цитат на основе которых присвоена категория. Для удобства использования модуль был подготовлен к внедрению в имеющуюся издательскую систему. Особенности модуля:
·         Определение более 90 категорий текста;
·         Возможность присвоения нескольких категорий одному тексту;
·         Извлечение цитат на основе которых были присвоены категории.
 
Результат
Сокращение рисков по уходу в печать «недопустимых» материалов;
Сокращение времени, затрачиваемого на проверку статей и, следовательно, времени подготовки материалов к печати.