© CABAR – Центральноазиатское бюро по аналитической журналистике
При размещении материалов на сторонних ресурсах, гиперссылка на источник обязательна.

Искусственный интеллект в аналитике: быстро, точно без эмоций

Уже больше года команда редакторов CABAR.asia эффективно использует методы машинного обучения (МО) при создании журналистских материалов. В чем плюсы этих методов и почему медиа и аналитики должны использовать МО в своей работе? 


Уже больше года команда CABAR.asia использует методы машинного обучения. Фото: CABAR.asia
Уже больше года команда CABAR.asia использует методы машинного обучения. Фото: CABAR.asia

По словам регионального директора IWPR по Центральной Азии Абахона Султоназарова, идея о внедрении методов МЛ у него появилась в Лондоне в 2019 году, когда он встречался с представителями аналитических центров

«На встречах мне стало понятно, что сейчас в основном, аналитика базируется на искусственном интеллекте и машинном обучении. И эти методы они используют очень активно, в том числе, для закрытой аналитики по заказу транснациональных компаний и разных государств, — говорит Султоназаров.

Абахон Султоназаров. Фото из личного архива.
Абахон Султоназаров. Фото из личного архива.

По его словам, на Западе даже аналитические записки для руководства стран составляют с использованием методов МО. Сейчас транснациональные компании заказывают у аналитических центров закрытые анализы, например, для принятия решений о том, стоит ли инвестировать в ту или иную страну.

«Машина не обманывает, считает очень быстро, точно и без эмоций. Она даёт четкую картину и точный анализ, — перечислил Султоназаров достоинства МО.  

По его словам, медиа Центральной Азии не применяют методы МО в своей аналитике.

«Для всех это было что-то новое. Может какие-то IT компании это используют, но именно в аналитике медиа ничего подобного не было», — отметил Султоназаров.

После этого офис IWPR по Центральной Азии включил методы применения искусственного интеллекта и машинного обучения в стратегию развития CABAR.asia как аналитической платформы на 2019-2024 годы.

После этого необходимо было обучить редакторов, которые не имели понятия о методах МЛ. Для этой цели был привлечен Атобек Рахимшоев специалист по искусственному интеллекту, выпускник Американского университета Центральной Азии (АУЦА).

Были и другие проблемы, в том числе, дефицита статистических данных, прежде всего, данных государственной статистики, которые требовались для полноценного применения методов МО.

Особенно остро эта проблема стояла в Таджикистане и Узбекистане. Зачастую, приходилось искать информацию вручную, поэтому иногда приходилось искать темы попроще.

За это время были опубликованы ряд материалов, в которых так или иначе были использованы методы машинного обучения.

Среди этих материалов – «Кыргызстан 2021: контент-анализ зарубежных и российских масс медиа», «Экология через призму СМИ Кыргызстана», «Феномен Манижи на Евровидении: Манифест феминизма и подрыв устоев», «Таджикские песни: любовь и лилии вместо патриотического пафоса» и др.

Атобек Рахимшоев. Фото со страницу АУЦА в facebook.com
Атобек Рахимшоев. Фото со страницу АУЦА в facebook.com

По словам Атобека Рахимшоева, специалиста по искусственному интеллекту, ему было одновременно интересно и сложно работать с разными редакторами платформы CABAR.asia в новой и «несколько абстрактной области».

Рахимшоев признал, что в Центральной Азии непросто найти необходимые данные в Интернете.

«Вторая проблема заключалась в том, что мы не автоматизировали процесс сбора данных на начальном этапе. Позже я научился это делать, и мы решили эту проблему», — говорит Рахимшоев.

Наталье Ли, редактору платформы CABAR.asia, автора статьи с использованием МО, сначала было «немного страшно» работать с новым методом.

«Не было понятно, как и в каких материалах использовать эти инструменты. Тем не менее, это интересный новый опыт, который расширяет границы журналистики и дает интересные результаты», — говорит Наталья Ли.

Она также считает наибольшей проблемой – отсутствие больших данных (big data) в Центральной Азии.

Наталья Ли. Фото: CABAR.asia
Наталья Ли. Фото: CABAR.asia

«Ни организации, ни госструктуры не собирают больших массивов данных, которые затем можно было бы анализировать с помощью машинного обучения. Поэтому пока в регионе единственные источники для подобных материалов – это СМИ и социальные медиа. При этом со вторым также возникают проблемы, потому что, как правило, социальные сети не дают возможности собирать данные для последующей обработки», — говорит Наталья Ли.

В этом году к ней обратилась за консультацией студентка АУЦА, которая проходила стажировку в IWPR и сейчас готовит дипломный проект с похожей методикой исследования, как и в статье Натальи Ли.

Марат Мамадшоев, главный редактор IWPR в Таджикистане согласен с тем, что использование методов МО в аналитической журналистике имеет большие перспективы.

Марат Мамадшоев. Фото: Фото: CABAR.asia
Марат Мамадшоев. Фото: Фото: CABAR.asia

«Плюсы искусственного интеллекта — возможность анализа большого количества данных очень быстро и точно. Но, нельзя забывать и о проблемах МО, связанных, в том числе, с ошибками в алгоритмах и моделях», — говорит Мамадшоев.

По его мнению, мало кто из  аналитиков в регионе может успешно применять методы МО, а те кто пытается это делать являются самоучками и также нуждаются в менторской поддержке.

«Темпы инноваций настолько высоки, что недавно приобретенные навыки порой быстро устаревают. По этим причинам аналитикам, работающим с искусственным интеллектом в своих исследованиях, необходимо оказывать постоянную менторскую поддержку», — считает Мамадшоев.

Зачем СМИ и аналитикам нужно использовать МО?

Сергей Маринин. Фото: Фото: CABAR.asia
Сергей Маринин. Фото: Фото: CABAR.asia

И в заключение несколько мнений о необходимости применения методов МО в медиа. 

«Представляется, что современные медиа и аналитические центры (особенно последние) в будущем не смогут производить качественный анализ определенных социально-политических явлений без понимания того, какие открытия дает накопленный массив данных. Потенциал применения машинного обучения позволяет оценить перспективы развития, дает предсказательные модели, то есть варианты развития событий, основанные на конкретных накопленных данных. Это не спекуляции политологов, не рассуждения экспертов в стиле «будет/не будет», а более точное понимание процессов и прогностические подходы к аналитике. Поэтому учиться правильно анализировать большие данные – это будущее и отчасти уже воплощенное настоящее», — Сергей Маринин, менеджер проекта в IWPR в Центральной Азии.

«Использование МО дает возможность взглянуть на ту или иную проблему под другим углом и показать тенденции, о которых мы, возможно, догадывались, но не было подтверждений», — Наталья Ли.

«Сегодня объем доступных данных очень велик, что затрудняет обработку всей этой информации человеческим мозгом и создает потребность в использовании современных аналитических инструментов. Я думаю, что коллегам из независимых СМИ было бы очень полезно научиться использовать современные инструменты, чтобы сделать аргументацию в своих материалах более надежной и объективной за счет обработки большого объема данных», — Атобек Рахимшоев.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: