Skip to content

Call #2

SvA1 edited this page Nov 7, 2019 · 3 revisions

Обсудили статью (https://arxiv.org/pdf/1812.09449.pdf), более подробно разобрали, что из себя представляет метрика precision\recall. Обсудили выбор бейзлайна и бенчмарк.

На воскресенье запланировано:

  • заполнить трелло ссылками на статьи, где применяются упомянутые алгоритмы (https://paperswithcode.com/task/named-entity-recognition-ner)
  • дополнить список подходами, которые хотелось бы попробовать, со ссылками
  • более детально поработать с данными: посчитать количество уникальных прогнозов, количество прогнозов с полным заполнением ячеек сущностей, количество англоязычных, среднюю длину прогноза (ссылка на ноутбук-пример работы с данными с пандас: https://colab.research.google.com/drive/1PB_rTnzz2rcPIktsrFvG4SdedTWsZ9g8)

Для презентации будет важно рассказать про данные и показать примеры, дать примерный список подходов\алгоритмов, которые планируем применять и их кратко описать.

Clone this wiki locally