Компания IBM работает над усовершенствованием технологии Content Clarifier. Это приложение способно адаптировать текстовый веб-контент таким образом, чтобы он был более понятен людям с расстройствами аутического спектра и другими видами когнитивных расстройств.
Над технологией работают специалисты подразделения IBM Accessibility Research, используя для адаптации контента машинное обучение и технологии распознавания языка.
Еще по теме: DistingTec – российский проект по трудоустройству людей с аутизмом в IT-сфере
Content Clarifier может упрощать предложения, сохраняя смысл. Для этого система анализирует источник информации, определяет важные данные и отсеивает все необязательное. Технология позволяет сделать текст богаче – в процессе обработки не только убираются эвфемизмы, но и добавляется релевантный контент, к примеру, ссылки на статьи в Википедии.
Источником для преобразования может быть как pdf или word-файл или html-страница с текстом, так и аудиофайл с записью речи. Сейчас для демонстрации возможностей технологии Content Clarifier работает как веб-приложение, однако IBM предлагает разработчикам использовать API для создания своих приложений.
Веб-приложение дает возможность протестировать технологию в трех форматах:
- упрощенный текст, когда сложные понятия заменяются на более простые, дополнительный контент в виде гиперссылок и изображений помогает лучше разобраться с явлением;
- выжимка из текста, когда убирается большое количество дополнительной и вводной информации и остается только главный тезис;
- режим «ультра», упрощение выжимки.
https://www.youtube.com/watch?v=0XkriBN5T4E