Обсуждение:Hacknowledge 2019

(перенаправлено с «Обсуждение:Хакатон по Викиданным»)
Последнее сообщение: 5 лет назад от Ghuron в теме «Темы выступлений»

Примеры идей

править
  1.  
    Для того, чтобы сподвигать читателей википедии становится её авторами, мы подсвечиваем красным цветом ссылки на несуществующие статьи. В частности, так делается и в карточках статей, автоматически наполняемых из викиданных (см. например первооткрыватель NGC 989). В элементе викиданных, соответствующем красной ссылке (d:Q520937 для нашего примера), зачастую содержится немало информации. И если бы удалось изложить её литературным русским языком, получилась бы годная заготовка статьи. Технический механизм подстановки текста для отсутствующих статей работает (кликните на красную ссылку в карточке NGC 989). Однако в нынешнем виде его полезность весьма сомнительна, требуется сторонний веб-сервис, который «переведёт» содержимое элемента викиданных на русский язык и оформит текст в соответствии с руководством Википедия:Оформление статей.
  2. Wikidata game — это интересный пример «казуализации» википедии. Для того, чтобы написать статью в ру-вики, нужно переварить принятые в сообществе правила, а также найти и прочитать кучу источников. Для того, чтобы из текста вики-статьи сформулировать полноценное утверждение в викиданных, достаточно лишь иметь базовую языковую и компьютерную грамотность. Последовавшая за ней wikidata distributed game представляет собой целый framework для создания игр, но как и любой инструмент, она накладывает довольно серьёзные ограничения на возможные сценарии игр. Например есть сотни элементов викиданных о людях с изображением, но без указания пола или тысячи элементов о людях, но без информации о цвете глаз.
  3. Практически любой произвольный запрос типа «перечислить уроженцев Санкт-Петебруга, в честь которых назван топоним в Санкт-Петербурге» возвращает дай бог 10 % информации от того, что уже есть в неструктурированном виде в википедии. Существует несколько инициатив по выгрузке в викиданные полуструктурированной информации, в частности из карточек или категорий статей. Но, например, информация о том, что Равшана Куркова была супругой Артём Ткаченко есть только в тексте в неструктурированном виде. Именно там сосредоточен самый большой массив информации, который было бы интересно загрузить в викиданные. В качестве одной из обозримых вариаций этой задачи можно рассмотреть возможность формулирования критериев включения статей в категории. Например, люди, включенные в Категория:Тангутологи должны в викиданных иметь род занятий тангутолог.
  1. создание аналога кинопоиска (привет, Яндекс!) и/или навигации по научным статьям (привет разные базы данных, mathnet или math genealogy)
  2. родословное древо: динамическая визуализация данных через JavaScript в браузере аля родовод
  3. выделение данных о пользователе по его правкам и поиск "уток"

Два основных направления:

  • Упаковка - проекты, основанные на общественном достоянии (пример можно посмотреть здесь);
  • Функционал - проекты, обеспечивающие интеграцию разных проектов и ориентирование в массивах открытого контента (примеры можно посмотреть здесь и здесь).

Первая группа проектов должна быть основана на использовании контента проектов Викимедиа, Ноосферы, открытых библиотек и архивов (в целом любых). Результатом, условно говоря, могут быть чат-боты, которые позволяют получить нужный контент, стриминг на основе того, что где-то лежит, тематические пополняемые библиотеки контента, приложения, которые так или иначе интегрируют части произведений в ОД и т.п. Цель - сделать для открытого контента упаковку, которая повысит интерес к нему со стороны пользователя.

Вторая группа проектов должна интегрировать материалы нескольких платформ, упрощать поиск по массивам контента, адаптировать его для пользователя. Здесь важны в первую очередь решения по каталогизации произведений, приведению в единообразный вид метаданных, их обогащению, переводу, дополнению ссылками на копии произведения в интернете, приведению в порядок и конвертации в удобные форматы файлов произведений в ОД, сбору открытого контента на просторах сети и т.д. Цель: найти решения (точнее, их прототипы) для повышения эффективности и функциональности Ноосферы.

Задача: Разработать инструмент оперативного отслеживания ошибочного проставления дат смерти в Викиданных.
Обоснование: В проекте Викиданные нередки случаи добавления ошибочной даты смерти ныне живущей персоны, после чего она появляется в Википедии и в интернет-поисковиках. Малоопытным участникам Википедии трудно понять, как это исправить, и в википедийных списках наблюдения по умолчанию правки Викиданных не отображаются. По этой причине дата смерти может висеть несколько дней. Подобные случаи неоднократно привлекали внимание СМИ, что негативно сказывается на репутации Википедии и поисковиков.
Постановка задачи:
1. Создать в русской Википедии страницу "Википедия:Недавно проставленные даты смерти из Викиданных".
2. На этой странице публиковать таблицу, содержащую элементы Викиданных о людях, где была добавлена дата смерти в течение последних 7 дней.
3. Публиковаться должны только те элементы Викиданных, для которых существует статья в русской Википедии.
4. Проверяться на предмет добавления даты смерти должны только элементы Викиданных, созданные не менее месяца назад.
5. Таблица должна оперативно обновляться (желательно не реже чем раз в 10 минут).
6. Таблица должна содержать следующие столбцы: "Элемент Викиданных", "Статья Википедии", "Дата рождения", "Дата смерти", "Время правки", "Кем внесена информация".
7. Должна быть возможность сортировки по всем столбцам. Новые записи должны быть сверху.
Пример заполнения таблицы:
# Элемент Викиданных Статья Википедии Дата рождения Дата смерти Время правки Кем внесено
1 no label (Q999999999) Иванов, Иван Иванович 01.01.1971 05.10.2017 11:11, 30 апреля 2019 123.456.78.90
2 no label (Q987654321) Петров, Пётр Петрович 12.01.1989 27.04.2019 19:56, 29 апреля 2019 193.233.42.76
3 no label (Q123456789) Сидоров, Сидор Сидорович 01.01.1999 29.04.2019 13:25, 29 апреля 2019 Andreykor

Темы выступлений

править
Вернуться на страницу «Hacknowledge 2019».