Call #2

Обсудили статью (https://arxiv.org/pdf/1812.09449.pdf), более подробно разобрали, что из себя представляет метрика precision\recall. Обсудили выбор бейзлайна и бенчмарк.

На воскресенье запланировано:

заполнить трелло ссылками на статьи, где применяются упомянутые алгоритмы (https://paperswithcode.com/task/named-entity-recognition-ner)
дополнить список подходами, которые хотелось бы попробовать, со ссылками
более детально поработать с данными: посчитать количество уникальных прогнозов, количество прогнозов с полным заполнением ячеек сущностей, количество англоязычных, среднюю длину прогноза (ссылка на ноутбук-пример работы с данными с пандас: https://colab.research.google.com/drive/1PB_rTnzz2rcPIktsrFvG4SdedTWsZ9g8)

Для презентации будет важно рассказать про данные и показать примеры, дать примерный список подходов\алгоритмов, которые планируем применять и их кратко описать.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Call #2

Clone this wiki locally