Новый проект от Google: фильтрация комментариев на основе их «токсичности»

Интернет-оскорбления – горячая тема в последнее время. Twitter уже долгие годы ведет борьбу с троллями, разрабатывая все новые и новые возможности для предотвращения этого неприятного явления. IT-компании создают решения, которые позволяют сделать сообщества более безопасными для пользователей.

Google присоединилась к числу компаний, решивших побороться с оскорблениями в интернете – новый проект является частью технологического инкубатора Jigsaw. Инженеры и исследователи Jigsaw работают над решением таких геополитических проблем, как нападения на свободу слова, отказ от правосудия, коррупция и насильственный экстремизм.

Perspective – свежий проект Jigsaw, нацеленный на улучшение области комментирования веб-сайтов, которая часто становится очагом оскорблений при плохой модерации. Борьба с негативными качествами человеческого поведения, которые нередко прикрываются онлайн-анонимностью, является прекрасной задачей для ботов.

Проект Perspective использует машинное обучение для идентификации и фильтрации комментариев на основе их «токсичности». Существующий API оценивает комментарии по принципу «предполагаемого воздействия комментария на диалог». Владельцы сайтов могут впоследствии использовать эту информацию для осуществления обратной связи в реальном времени и ускорения процесса модерации. Лайв-демо позволяет читателям фильтровать комментарии, основываясь на шкале «токсичности».

Также на сайте Perspective имеет Writing Demo, который оценивает «токсичность» напечатанного текста. Модель определяет «токсичность» как «грубый, неуважительный или бессмысленный комментарий, который, скорее всего, заставит вас закрыть обсуждение».

Разработчики могут запросить доступ к API Perspective

Оскорбительные комментарии особенно часто появляются на новостных ресурсах, требуя от модераторов быть особенно бдительными, готовыми устранять угрозы цивилизованному обсуждению. Именно по этой причине в New York Times работает 14 фулл-тайм модераторов, которые вручную проверяют 11 тысяч комментариев, появляющихся каждый день. Несмотря на усилия этой команды, комментирование доступно только для 10% всех статей в Times из-за высокой нагрузки на модераторов.

Издание New York Times, являющееся партнером Perspective, открыло промодерированные архивы комментариев за 10 лет, чтобы помочь команде Jigsaw сформировать модели для машинного обучения, которые нацелены на улучшение обсуждения в сети. Также издание в настоящий момент работает над созданием open source инструмента для модерации, что позволит расширить обсуждения в других областях Times.

Wikimedia Foundation также сотрудничает с Jigsaw для разработки инструментов по автоматическому выявлению оскорбительных комментариев и анализа их воздействия на обсуждения в целом. Инструменты нацелены на смягчение персональных нападок, обрушивающихся на волонтеров-редакторов.

Проект Perspective пока что находится на начальном этапе разработки, однако девелоперы уже могут запросить API-ключ. Google будет раскрывать все эксперименты, модели и данные исследований, полученные в процессе машинного обучения, формируя новый инструмент для улучшения онлайн-обсуждений.

Поскольку WordPress используется более чем на 27% всех сайтов сети, плагин, созданный на базе Perspective API, может оказать существенное влияние на улучшение комментирования для широкого сегмента этих сайтов. Многие издания, для которых обсуждения могли бы иметь высокую ценность, в данный момент отключили комментирование полностью из-за проблем с модерацией.

Старая формула «никогда не читай комментарии» позволяет оградиться от подобных оскорблений, однако при этом демонстрирует слабость владельца сайта по привлечению читателей, которые не готовы беседовать с некультурными людьми. Читатели не всегда имеют эмоциональную энергию на борьбу с грубыми комментариями, проскочившими модерацию. Конечно, некоторым Reddit-стиль общения может показаться оживленным и привлекательным, однако большинство людей считают это деморализующим фактором.

Цель проекта Perspective – это не редактирование или изменение комментария, чтобы сделать его менее «токсичным»; вместо этого читателям предлагается способ фильтрации комментариев на основе индивидуального уровня комфорта. Выводя ясные предупреждения и безопасную версию комментариев по умолчанию, издание сможет избежать чрезмерного цензурирования откликов пользователей, сняв с себя лишнюю модерационную нагрузку.

Проект Perspective экспериментирует с машинным обучением в сфере онлайн-взаимодействия. Модерация комментариев и устранение их «токсичности» для многих изданий является слишком сложным процессом, требующим массу ресурсов. Комментарии по-прежнему играют важную роль, что подтверждает факт привлечения инженеров, дизайнеров и исследователей Google к данной проблеме. Новая технология позволяет подчеркнуть важность публичных обсуждений в сети. Будет интересно посмотреть, какие инструменты, построенные на Perspective API, появятся для WordPress в ближайшее время.

Источник: wptavern.com

Комментарии: 9

Футон 26.02.2017 в 15:09
Если честно не понимаю почему это гугл или твитер должны бороться? Оскорбления всегда будут и тут ничего не сделать!
Ответить
1. Дмитрий (автор) 26.02.2017 в 15:35
  Машинное обучение поможет их отсеять еще на начальном этапе.
  Ответить
  1. Волшебник 18.03.2017 в 16:26
    На самом деле — некая корпорация, которая через api, установленное на множестве сайтов, проводящая «правильную» линию, и фильтрующая всё, что не угодно геополитическим интересам сильных мира сего, это довольно опасная штука, которая сможет воздействовать на общение людей и формировать исход обсуждений в нужном направлении. Этакая скрытая цензура и рычаг манипуляции. Пишите например вы своё мнение, а вам не дают его опубликовать, потому что оно слишком «токсичное и не геополитичное».
    Ответить
    1. Дмитрий (автор) 19.03.2017 в 02:54
      Я думаю, что токсичность будет определяться именно по ругательствам и по осмысленности и соответствии тематике обсуждения. Т.е. если это статья про котиков, то политика в ней будет смотреться неуместно.
      Ответить
Футон 26.02.2017 в 15:37
в будущем будут рукводить всем нейронные сети!
Ответить
v-gol 27.02.2017 в 23:15
Возможно этот шаг приведёт в дальнейшем к фильтрации и понижению в выдаче всех сайтов содержащих не нормативную лексику.
Ответить
Ирина 28.02.2017 в 10:13
Хотелось бы посмотреть, как это будет реализовано. Для меня всё это выглядит немного как фантастика, ведь отсев чисто по нецензурным словам слишком примитивная мера, очевидно, будет как-то тоньше. Я работала одно время модератором текстов, как раз для того, чтобы дальше положительные/отрицательные тексты оценивались автоматом, но серьезного прогресса достигнуть так и не удалось (хотя, конечно, это был не гугл :) )
Идея хорошая, без сомнения.
Ответить
Андрей 03.03.2017 в 14:16
Вбросы всегда были и всегда будут. Просто станут тоньше, будут апеллировать к другим темам. Но борьбы «сколько человек — столько мнений» избежать нельзя. Убрать хамство это одно, а троллингу поможет противостоять только спокойное игнорирование его комментариев.
Ответить
1. Дмитрий (автор) 03.03.2017 в 18:37
  Безусловно, но это поможет хоть как-то снять высокую нагрузку с модераторов, которая ложится на них на сайтах с высоким трафиком.
  Ответить

Добавить комментарий