We stand with Ukraine

Anotación con aprendizaje activo y NLU

La preparación de los datos puede ser más rápida y eficaz con un etiquetado comprensible y colaborativo

Trabajar en proyectos de procesamiento del lenguaje suele requerir la comprensión de términos y jerga específicos  propios de la materia de que se trata. Algunas actividades de anotación requieren incluso que expertos de negocio, profesionales valiosos y escasos en el mercado, se conviertan en los principales responsables de anotar y etiquetar los textos.

Para el desarrollo de forma eficiente de modelos de clasificación y extracción de información con machine learning, es imprescindible contar con “datasets” anotados para los distintos casos de uso, con un nivel de calidad máxima para que permitan el correcto entrenamiento y validación del modelo.

Expert.ai convierte de forma sencilla y rápida a cualquier usuario, incluidos desarrolladores, ingenieros de gestión del conocimiento, lingüistas computacionales o científicos de datos, en anotadores expertos ,  permitiendo de esta forma ampliar y acelerar los proyectos según sus necesidades, y todo ello a través de una interfaz sencilla y fácil de usar que ofrece la posibilidad de explorar y anotar una amplia variedad de tipos de datos diferentes. Las funciones de anotación de expert.ai mejoran la eficiencia y eficacia de las actividades de etiquetado de datos mediante:

  • Pre-anotación del contenido habilitada por análisis semántico
  • Propagación de anotaciones validadas en todo el corpus
  • Aprendizaje activo basado en anotaciones existentes

Al incorporar las funciones de comprensión del lenguaje natural (NLU) de expert.ai, la plataforma realiza una exacta  pre-anotación que permite agilizar todo el proceso. Gracias a las capacidades de análisis semántico “out-of–the-box“, los usuarios pueden desambiguar de manera sencilla palabras (tokens), conceptos y entidades extraídos en los documentos a anotar.

No necesario perder el tiempo etiquetando datos cuando existe una forma más inteligente de anotar textos no estructurados de forma rápida y precisa.

Principales características

  • Acelerar el proceso de etiquetado, ya que la plataforma expert.ai se encarga de identificar los documentos más adecuados para el mejor data-set.
  • Aprendizaje activo, el sistema aprende de las anotaciones ya disponibles para sugerir nuevas anotaciones dentro del corpus de documentos.
  • Utilización de sugerencias de la plataforma NLU basadas en inflexiones, palabras compuestas y sinónimos para realizar mejores anotaciones.
  • Preanotación automática de documentos utilizando reglas simbólicas de otros proyectos
  • Posibilidad de que varios anotadores trabajen simultáneamente en cualquier proyecto con controles de seguimiento y validación.
  • Etiquetado en modo rápido que permite introducir un gran volumen de anotaciones de entidades en un documento.
  • Propagación de anotaciones en todo el corpus de documentos con un solo clic.
  • Trabajo en colaboración con seguimiento de los cambios de los usuarios y controles de validación.
  • Importación/exportación en formato BRAT standoff.
  • Clasificación basada en la taxonomía mediante un editor gráfico (arrastrar y soltar objetos).
  • Visualización de las anotaciones en el contexto del formato de archivo original.