Graph Labeler
Публичная страница проекта
Graph Labeler Ручная разметка смысловых связей между словами
Семантический граф русского языка

Проверяем, какие слова правда связаны по смыслу

Graph Labeler — это небольшая игра про язык и смысл. Тебе показывают пару слов и пример из текста, а ты решаешь: между ними правда есть смысловая связь или нет. Каждое такое решение занимает несколько секунд, но вместе они помогают собирать данные для большого лингвистического исследования

1
Смотрим не на догадку, а на живой контекст. Важен пример, а не первое ощущение от пары слов
2
Плюс идёт только за нормальную смысловую связь. Простое соседство слов в тексте НЕ считается
3
Пропуск здесь тоже полезен. Лучше честно не голосовать, чем занести в данные случайный шум
Начать размечать У меня уже есть аккаунт
Нужны только браузер, пара минут и внимательность
Связей в графе 132917 Все пары слов, которые дошли до ручной проверки
Уже просмотрено 1724 Карточки, по которым уже есть хотя бы один голос
Покрытие 1.3% Насколько далеко продвинулись по текущему корпусу
Всего голосов 1781 Общий вклад всех участников проекта
Участников 8 Люди, которые помогают собирать граф
Зачем это вообще нужно

Потому что автоматика находит много кандидатов, но не всегда понимает смысл

Отделяем живое от случайного

Потому что язык лучше всего понимает человек, а не алгоритм

Собираем нормальные данные

Разметка потом идёт в фильтрацию графа, в оценку качества и в дальнейшую работу с моделями. Чем чище решения, тем полезнее итог

Делаем маленький, но понятный вклад

Так из короткой игры постепенно вырастает полезное исследование смысловых связей в русском языке

Курс молодого бойца

Как быстро начать и не наделать шума

1
Сначала прочитай пример целиком

Сначала прочитай пример целиком. Контекст здесь важнее первой ассоциации

2
Плюс ставь только там, где связь читается нормально

Если без натяжки видно, что слова связаны по смыслу, это уверенный плюс.

3
Минус — когда слова просто рядом

Не каждое соседство в тексте означает смысловую связь

4
Пропуск не портит разметку

Это нормальная часть игры и полезный выбор для качества данных

Главный лидерборд

Кто сейчас больше всех помогает проекту

#1
phoenix
phoenix Архивариус
1430 100.0% от топа
#3
NM
nmixx Следопыт
55 3.8% от топа
#4
ДА
Да Следопыт
25 1.7% от топа
#7
TE
tester Новичок
0 0.0% от топа
Жизнь проекта

Что нового и что уже происходит

Как смотреть на карточку Сначала прочитай примеры. Если связь видна в контексте — ставь плюс. Если слова просто рядом, но семантической связи нет — минус. Если примеры не помогают, пропуск.
Публичные профили У каждого пользователя есть ссылка вида /user/имя. Ей можно делиться с друзьями.
+ связь подтверждена phoenix : лист — тетрадь Недавнее действие в ленте проекта
+ связь подтверждена phoenix : однодневено — стукач Недавнее действие в ленте проекта
+ связь подтверждена phoenix : ружье — собака Недавнее действие в ленте проекта
Частые вопросы

Что стоит знать до старта

Нужно быть лингвистом? Нет. Здесь важнее внимательность, любопытство и умение смотреть на слова в контексте
Что делать, если не уверен? Лучше пропустить карточку. Осторожный пропуск полезнее случайного ответа
Это игра или научный проект? И то и другое. По ощущениям это лёгкая игра на внимательность и чувство языка, а по сути — помощь большому лингвистическому исследованию
Это правда помогает исследованию? Да. Каждое решение — маленький вклад в исследование смысловых связей между словами в русском языке
Старт за минуту

Как подключиться

1. Зарегистрируйся

Создай аккаунт и сразу сохрани пароль.

2. Открой интерфейс

С телефона или с ноутбука — логика везде одна.

3. Посмотри обучалку

Внутри всё объясняется очень быстро: плюс, минус, пропуск

4. Погнали

Дальше просто размечаешь карточки и добавляешь свой кусок в общий граф