Replies: 1 comment 1 reply
-
|
Beta Was this translation helpful? Give feedback.
1 reply
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
В рамках итерации необходимо создать пример реализации ИИ-сервиса классификации текстовых документов.
В данном примере, в качестве документов будут выступать тестовые документы - отчеты. Необходимо по тексту определить к какой тематике относится отчет. перечень типов отчетов будет определен в ходе выполнения итерации.
Документы отчетов относятся к объекту Report, который имеет следующие атрибуты:
ReportType:
name - имя отчета (caption). Может меняться по каким-то причинам (например был тип "Отчет по новостям", а со временем решили, что красивее звучит "Новостной отчет")
typeId - идентификатор отчета. Не меняется, всегда остается фиксированным для однозначного сопоставления Типа отчета и Отчета
Например для "Отчет по новостям" идентификатор будет просто "новости" или "news".
Идентификатор в виде строки нужен, чтобы легче составлять данные для обучения (проставлять например какие-то гуиды было бы трудно для составителя)
Отчеты попадают в систему в отсканированном виде в формате pdf. После загрузки документа и сохранения объекта Report, автоматически запускается следующая последовательность
Схема:
Beta Was this translation helpful? Give feedback.
All reactions