Интеллектуальная модерация в каталоге
Автор: Ярослав М. Витязев
18
Апр
Теперь пользователям интеллектуального каталога доступна возможность отправки сайта на модерацию:
- необходимо нажать на соответствующую кнопку на странице описания ресурса;
- указать причину по которой вы считаете, что этот ресурс является спамом;
- пройти тест Тьюринга.
После чего процесс переходит под управление подсистемы искусственного интеллекта:
- модуль пробегает по всей базе правил-критериев, определяющих спам,
- в случае попадания хотя бы под одно условие, модуль (в зависимости от типа нарушения):
- делает предупреждение автору сайта,
- [и/или] корректирует или удаляет описание,
- [и/или] блокирует или удаляет ресурс,
- [и/или] удаляет учетную запись пользователя.
- в том случае, если подсистема искусственного интеллекта не может идентифицировать спам - заявка отправляется администратору каталога (который, в свою очередь, может пополнить базу правил).
Разумеется все изменения фиксируются в документах, связанных с интернет-ресурсом (доступ к документам можно получить, дописав "docs/" к концу URL описания ресурса), пример:
Комментариев — 2 for "Интеллектуальная модерация в каталоге"
Мне кажется, что задача постмодерации ресурса несколько неактуальна если рассматривать ее саму по себе. В нашем каталоге механизм “стука” был прикручен в июне 2006 года (для http://lermont.ru/blog/post.php?num=63) и с того времени поступило от силы десяток жалоб из которых не было ни одной актуальной.
Другое дело, если Вы рассматриваете задачу постмодерации ресурсов только для обкатки алгоритмов, а реально нацелились на премодерацию =) …
P.S. Кстати, а не подскажите, как Вы делаете скриншоты сайтов?
2Lermont:
Реализация пре-модерации крайне затруднена по простой причине: база эвристических правил постоянно пополняется, поэтому ресурс, который был добавлен ранее, сегодня уже может не удовлетворять требованиям модерации (и этот ресурс или его часть следует удалить). Прогонять же всю базу ресурсов при добавлении новой эвристики не представляется возможным - слишком большой объем данных. Прогонять же все, но частями - тоже вариант решения, но мне он, откровенно говоря, не нравится (так сделано в глобальном каталоге) - это создает дополнительную нагрузку, которая, как правило, избыточна.
А заявочки поступают, некоторая их доля вполне адекватна. А вот эвристики пока еще далеки от совершенства. Дорабатываем.
По поводу скриншотов: а вы посмотрите в исходный код и сделайте так же. (: Хотя этот способ ненадежный — в любое время авторы могут закрыть такую возможность и придется перейти на более “тормозные” методы.
PS: Пре-модерация тоже существует, разумеется. Пост-модерация нужна лишь для осуществления повторных проверок (в случае пополнения базы эвристик). Резюме: одной пре-модерацией ну никак не обойтись.
Оставить комментарий