Conversión automática de licencias textuales a licencias digitales estructuradas

Sánchez Romero, Aida (2019). Conversión automática de licencias textuales a licencias digitales estructuradas. Tesis (Master), E.T.S. de Ingenieros Informáticos (UPM).

Descripción

Título:	Conversión automática de licencias textuales a licencias digitales estructuradas
Autor/es:	Sánchez Romero, Aida
Director/es:	Rodríguez Doncel, Víctor https://orcid.org/0000-0001-5770-0882 Corcho, Oscar https://orcid.org/0000-0002-9260-0753
Tipo de Documento:	Tesis (Master)
Título del máster:	Inteligencia Artificial
Fecha:	2019
Materias:	Informática
ODS:	09. Industria, innovación e infraestructura
Escuela:	E.T.S. de Ingenieros Informáticos (UPM)
Departamento:	Inteligencia Artificial
Licencias Creative Commons:	Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of TFM_AIDA_SANCHEZ_ROMERO.pdf]

Vista Previa

PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (2MB) | Vista Previa

Resumen

La extracción de información es una de las principales áreas de estudio dentro de la Inteligencia Artificial. Esta tarea se centra en derivar información estructurada a partir de un documento no estructurado o semi-estructurado utilizando para ello técnicas de procesamiento del lenguaje natural (NLP). Estos documentos pueden ser muy variados, desde artículos de prensa hasta informes científicos. Por ello, y debido a la complejidad y ambigüedad del lenguaje natural (aun cuando el dominio está perfectamente acotado) ésta no es una tarea sencilla. De esta forma, la extracción de información ha sido estudiada en varios dominios muy restringidos involucrando a una gran comunidad de investigadores durante más de tres décadas. A pesar de ello, no es hasta hace poco más de 5 años que el término “legaltech” o tecnología jurídica comienza a tomar fuerza, el cual hace referencia al uso de la tecnología para ofrecer servicios jurídicos. Algunos de estos servicios abarcan: revisar contratos para encontrar cláusulas inaceptables o requeridas (LawGeex ); ayudar a detectar plazos, obligaciones o vigencias en los procesos de due diligence (Luminance); o analizar jurisprudencias con el fin de extraer información relevante para planear una estrategia procesal (Ravel Law). En este trabajo se crea un sistema software basado en este mismo concepto que es capaz de extraer la información relevante de una licencia escrita en lenguaje natural. Para ello, utiliza técnicas basadas en NLP centrándose, sobre todo, en el tipo de eventos (o acciones) que están permitidas, prohibidas y/o son requeridas. A partir de estos datos crea un RDF válido que los contiene junto con el nombre, la versión y el texto o código legal de la licencia. Algunos ejemplos del tipo de eventos que debe detectar y extraer son, entre otros, si se permite su uso comercial, copia, modificación o distribución; o si el usuario debe proporcionar el código fuente o acreditar al creador/los creadores de la misma.---ABSTRACT---Information Extraction is one of the main areas of focus inside Artificial Intelligence. This task focuses on deriving structured information from an unstructured or semi-structured document using Natural Language Processing (NLP) techniques. These documents can be very varied from press articles to scientific reports. Hence, this is not a simple task (even though the domain is perfectly limited) due to the complexity and ambiguity of natural language. Therefore, Information Extraction has been studied in several very restricted domains involving a large community of researchers for more than three decades. In spite of this, it is not until just over 5 years ago that the “legaltech” or legal technology concept began to prevail. This concept refers to the use of technology and softwares to offer legal services. Some of these services include review contracts to find unacceptable or required clauses (LawGeex ); help detect deadlines, obligations or validity in due diligence processes (Luminance); or analyze jurisprudence in order to extract relevant information to raise a procedural strategy (Ravel Law). In this work, we create a software system based on this concept. This system is able to extract the relevant information from a license written in natural language. Thus, it uses techniques based on NLP and, above all, it uses techniques in order to extract the type of events (or actions) that are allowed, required and/or forbidden. From this data it creates a valid RDF that contains them along with the name, version and text or legal code of the license. Consequently, the type of events that should be detected are, among others, if their commercial use, copy, distribution or modification is allowed or not. Other possible events should be detected could be if the user must provide the source code or credit the creator/s of the license.

Más información

ID de Registro:	56030
Identificador DC:	https://oa.upm.es/56030/
Identificador OAI:	oai:oa.upm.es:56030
Depositado por:	Biblioteca Facultad de Informatica
Depositado el:	05 Ago 2019 06:41
Ultima Modificación:	05 Ago 2019 06:41

Estadísticas

Exportar cita

Editar (sólo personal del Archivo)

En esta página

Menú principal

Buscar

Conversión automática de licencias textuales a licencias digitales estructuradas

Cita

Descripción

Texto completo

Resumen

Más información

Acciones

Documentos

El repositorio

Agrupados por ...

Datos Investigación

Financiadores

Especiales

En otros formatos

Redes sociales

Información adicional