Idioma: Español
Fecha: Subida: 2021-02-22T00:00:00+01:00
Duración: 28m 03s
Lugar: Curso
Visitas: 21 visitas

20210208 3-ASIO SPARQL Endpoint

Transcripción (generada automáticamente)

Si nos importa. Buenas tardes. Vamos a hacer eso ahora una, una presentación acerca de uno de los componentes que tiene ha sido que se les parque aquella, vamos a acercarnos un poco a un componente práctico que tiene un componente que no, que desde el punto de vista de la administración del sistema ha sido la administración de la plataforma. No hace falta conocer en profundidad, pero sí que hace falta conocer digamos que esto sería el equivalente a un servidor que que respondiese a consultas de tipo se cuele un Oracle o escuela, Server etc, pero en vez de interrogar con ese cuele interroga con un lenguaje que se cuele y en vez de interrogar a tablas estaba un modelo de tablas que pueda estar en ese cuele lo que hace es interrogar a un modelo de modelo que representa, que contienen los datos desgracia de conocimiento, que eso ha explicado antes Diego. La esta parte de la formación la vamos a dar entre Álvaro Palacios y yo yo me guste más otra. Aquí tenéis nuestro correo electrónico por si acaso. Queréis algo, la documentación las subiremos después y luego vamos a ver unas consultas prácticas que están en el mismo. Están en un repositorio donde está todo el código del proyecto y la documentación. Los aspectos que vamos a ver sobre el parqué del en primer lugar va a ser un tema de utilización de los datos, es decir, para qué sirve esto. Vamos a repasar un poco los estándares de la web semántica ya se ha introducido diego anteriormente esto. Vamos a ver un repaso breve. Explicaremos que es una red de gestor. Veremos qué características tiene sus parques. En el punto de interrogación es que va a tener así y una introducción breve al lenguaje es parte del, luego continuará Álvaro con con unas consultas desde el punto de vista desde punto de vista práctico. En cuanto a la autorización de los datos, se obtiene 2, 2, dos módulos o dos componentes. Por una parte está bien, queda hacer ver que es un componente que permite la publicación de los datos que están cargados en la red de gestor hacia fuera. Esto significa que los datos están accesibles por personas con un interfaz html crecido y también están disponibles para máquinas, o sea para software que quiera reutilizarlo. Luego está el parque del pueden, que permite a usuarios y administradores consultar los datos de conocimiento que están en el texto, con el lenguaje que hemos comentado, que sea más la reutilización de los de los datos Ignacio viene por conocer la red de Hércules, ejecutar consultas y reutilizar. En nuestro caso lo que nos interesa es las dos primeras partes. En este caso he intentado hacer ver brevemente lo que permite hacer una publicación de los datos que están en la red de gestor y como datos abiertos y enlazados, es decir, éstos son datos que puede consumir o buena parte de los datos que van a estar en Asia. Son datos públicos que puede consumir cualquiera. Qué características tiene tiene un interfaz html? Que se puede personalizar, esto también es un servicio web que hay que mantener, que es uno de los componentes, así que veremos en las jornadas prácticas de instalación. El jueves y viernes se pueden personalizar los estilos, los formatos y demás, y permite presentar además de los datos brutos, los datos. Con alguna presentación más enriquecida como tablas y gatos proporcionan. Los los datos en un formato que las máquinas pueden reutilizar, cumple este estándar, que se aplazó un estándar, una recomendación de estándar de doble triste y cuenta con un servicio que permite hacer búsquedas para localizar entidades el interfaz. Pues bueno, lo que ofrece es más o menos de esto, una interfaz de lo que se ve en el que se ven datos un poco brutos como están aquí y ya representaciones un poco enriquecidas como una tabla o un que relaciona a los investigadores entre sí o a este investigador, con otros investigados. En cuanto a los parques, pueden es lo que es el componente que permite a los usuarios y a los administradores consultar los datos de conocimiento con un lenguaje de consultas es parte del una vez que están almacenados. En el resto de parqués, una es un acrónimo que significa que el protocolo está en su versión 1, punto 1, igual que con que sucede con ese suele ser ver que les ha tenido versiones, si 92, etc. Es el parque del un punto uno desde 2013 ahora mismo está en revisión. No creo que el estándar salga en este año y el que viene igual tampoco no solamente es él, no solamente define el lenguaje de consulta, sino que también es un protocolo de consulta. El lenguaje de interrogación -es decir, el propio, el oso define como hay que lanzar las consultas que en realidad se lanzan mediante el protocolo. Http. Con un interfaz, es decir, admite peticiones de peticiones Post y permite, con las peticiones de querer hacer una recuperación de los datos y con las peticiones post -hacer recuperación de los datos, pero también actualización. El empollón que vamos a proponer para sido en principio hacia el público, solamente permite lectura. Evidentemente, no les dejaban modificar datos, pero el, el que habrá disponible para la administración, si que permite o permitirá modificarlo. Voy a hacer una revisión rápida de lo que os dé parte de lo que es lo que es. Ha comentado Diego anteriormente. En cuanto a los estándares y las tecnologías de la web, digamos que la semántica parte de unas tecnologías de tipo que tiene que ver con hipertexto, que tiene una sintaxis y responde a un esquema XML html. De hecho, es un XML o por lo menos ya el html5, mientras que en las tecnologías de la voz se semántica y digamos que están un poco por encima en esa pila, con con con los siguientes os estándares rdc, es un modelo de datos que hace referencia a objetos y sus relaciones. El esquema es una manera de definir. Ese vocabulario desea esas relaciones. Hay un un estándar, un poco más avanzado, que es el estándar de definición antológica que se ha utilizado, nació en la que, por hacer una comparativa con una definición de tablas, lo que se definen es el conjunto de los entidades de las entidades atributos, características de los atributos y relaciones entre todo ello. Esto sería un poco parecido a un esquema de base de bases de datos en los que tenemos tablas indicios y restricciones, y, por último, en esta pila Tecnológica tenemos que es el lenguaje de consultas, que es lo que se utiliza para recuperar la información. En las aplicaciones del agua se mantenga, como es así brevemente, es un concepto, es un es un que permite describir recursos. Entonces cada entidad está definida por un algo parecido a una web, es una única es uniforme y sobre ayer, que permite que permite o mejor dicho, que asigna un identificador único a garantizar recursos. Cualquier cosa que tener cuál puede ser, pues rdc o, por ejemplo, esta web que está aquí esta es la Wehrlein Luri que identifica a un investigador, una propiedad es un recurso que tiene un nombre como por ejemplo autor; es decir, un un investigador como éste tiene una propiedad que es autor o página web y luego está pues bueno, de los valores que pueden tener esas propiedades, pues como podría ser que este investigador se llama Diego López, de Ipiña o que su página web es esta. También hay que decir que un valor de propiedad para establecer estas relaciones, es decir, un tributo, puede ser a su vez otra entidad, es decir, imaginemos yo me llamo Esteban. Vivo en Pamplona, Esteban y Pamplona son entidades, no son solamente cadenas de texto, Esteban es una persona y la ciudad en la que vivo es otra entidad. Vale? Esto aquí explica un poco. Pues bueno, qué tipos de gafas podemos tener desde un punto de vista genérico? Pues tenemos aquí a una persona que es amigo de Alis, que es una persona y que nació el 14 de julio del 90, al que le interesa la Mona Lisa, y, ya que hay otra parte en este grupo en el que queremos que la Mona Lisa, fue creada por Leonardo Da Vinci, y aquí tenemos un vídeo, un vídeo, un contenido multimedia, que trata de moralista. Esto sería un grapo o genérico. Si hablamos un poco de relaciones de investigación, como son las que podemos encontrarnos en ha sido, tenemos que hay investigadores que pueden estar relacionados porque son autores de un mismo documento y luego tenemos documentos que tienen áreas temáticas, que son a su vez otras entidades. Este es el tipo de relaciones. Ese modelo en el que se han construido nació, como ha explicado Diego anteriormente y que visualmente, por si quieres hacer una idea, más o menos puede tener esta representación. Entonces, qué hace una zona rdc, crea una web de conceptos distribuidos o tienen secciones sobre relaciones lógicas entre las entidades o la información que están en rdc, pueden hacerse con gráficos en otros lugares, es decir, esto que hablábamos de limpieza es decir, se puede enlazar con otras, permite realizar inferencias y permite ser consultado con lenguajes de consulta, como es mediante la rdc. Lo que hacemos es que esta información sea procesarle por máquinas, que es una de las explotaciones que va a tener así en un futuro. Será permitir explotaciones más sofisticadas de consultas, como veremos. Bueno, teníamos que haber visto una introducción general a los proyectos Hércules, hay una, hay un, hay un, hay un PAR de proyectos Hércules que precisamente lo que hacen es explotar este modelo antológico y estos datos, y finalmente tenemos una antología que define la jerarquía de términos a utilizar y formaliza los metadatos? En un dominio de conocimiento, en este caso, la antología Rh. Lo que hace es hacer. Lo que define es un formalismo de los metadatos, del dominio de dominio, de conocimiento de la gestión de la investigación universitaria. El rdc es el componente que almacena el vacío de conocimiento de ese formato como componente dentro de la arquitectura. Es un servidor, que responde a consultas, es genéricamente esto. Podéis encontrar los documentaciones o algún otro sitio que tiene otros nombres; no es una red de gestora, sino que sale mal, que es el servidor. Rdc. Es una red de Fesser ver o en castellano, servidores para el texto. Lo que hace es que lo que hace es proporcionar el servicio de datos y consultas hacia la izquierda. Táser ver mediante el parque, como veremos mañana, en el desarrollo de Asier. Se ha realizado un best man mañana lo veremos en detalle para que cada universidad pueda decidir cuál es el gestor que le conviene a instalar en función pues bueno de que arquitecturas tiene, de qué necesidades, de datos tiene, de cuál es su entorno, de desarrollo, etc. Es eso lo veremos mañana, pero sí que hay un requisito que tiene que cumplir. El estándar es Parker, uno punto. Brevemente, el que tiene que cumplir una red de texto, saque que tiene una red de funcionalidades lo veremos; mañana en el vestuario, detalle tiene que poder manejar rdc; si es puede tener extensiones, como por ejemplo para manejar datos de tipo geográfico de posicionamiento y tiene que tener una serie de funciones de seguridad; es decir, vosotros, como administradores de sistemas que Reyes, que los usuarios anónimos puedan acceder a datos anónimos, pero no a los datos privados, y al revés. Tendréis que poder garantizar que los usuarios, sistemas que tenían que acceder a datos privados, pueden hacerlo con el nivel de seguridad que os interesa establecer; tiene que tener unas características de rendimiento y estabilidad que responda a las consultas en un tiempo adecuado, en función del volumen de datos que va a tener el sistema, que permita cargar datos con agilidad, que no consiga mucha memoria y que sea robusto y permita escalar esto es muy importante, es decir, se puede partir de un momento en el que los datos igual son menores, pero el sistema tiene que poder responder con un rendimiento adecuado al crecimiento, sin perder la robustez y por último, necesita como cualquier sistema de base de datos. No es distinto, hay unos costes de unos derechos que decir puede tener licencia, no tener licencia, y unos costes, que no son solamente desprecio, sino de coste de mantenimiento. Dígame cuánto cuesta mantener el sistema en horas hombre o en monitorización; es que hay que establecer etc. Otro punto importante es la facilidad de despliegue, es decir, cómo de fácil es instalarlo, que no se puede hablar con doquier. Hace falta es un ejecutable que te descargas y hasta en fin, lo fácil, lo difícil que es instalarlo y luego las facilidades que tiene para ser administrado y mantenerle. Estos son los aspectos que desde el punto de vista de Administración de Sistemas os interesan para decidir o ayudar en la decisión de cuál es el gestor que tenga que tener. Así que hemos analizado en el mar son estos 8, que son los más populares. En principio es la propuesta de la que se, de la que se parte si alguno de vosotros conociera otro. Pues bueno, se podría añadir a la comparativa, y esto lo veremos mañana en detalle y tenerlo en consideración en esta decisión. Bueno, esto es el es donde está disponible, es lo veremos mañana en detalle. Es una aplicación web que se puede usar de manera personalizada. En cuanto al parque le permite o por lo menos se les de acceso público, lo que va a permitir las consultas de lecturas sobre los datos públicos os va a permitir configurar limitaciones de uso para que no se satura; y no tenga y no sea achacable, o bueno, no es achacable, no es nunca se puede evitar que sea achacable, pero por lo menos que no sufra con los ataques, y tenemos como tres interfaces distintos. Aquí tenemos un asunto que está un poco pendiente de creo que lo tenemos ya resuelto de protección con SL, porque hemos tenido un problemilla con el certificado y la instalación en desarrollo. Los tres interesantes que tenemos tienen esta presentación visual. Bueno, el lo previsible es que se use más el primero, si es que es virtuoso el elegido; en caso contrario, pues ponente será el segundo interfaz que está integrado dentro del del frontal público de la web de Asia. Este es parque le pueden, como hemos dicho antes, es accesible por personas en un interfaz web como el que hemos visto en la anterior y por máquinas mediante peticiones. Http. Tipo veto Post. Por ejemplo, esta petición que vemos aquí se estaría ejecutada con un. Lo que hace es lanzar esta consulta. Es una consulta se lanzaría a esta consulta. Es parques contra el servidor que está en esta dirección. Esto es una petición; es una manera de automatizar básica, pero es algo que se puede hacer. Como ejemplo veis, veis que es un que es un interfaz puramente web. Voy a hacer ahora una, una, una introducción breve a parque, como os he comentado. Luego mi compañero Álvaro Palacios nos explicará un poco algunos casos de consultas para que sirva de punto de partida para el tipo de consultas básicas que en principio se hacen desde, pues se deberían hacer desde sistemas que son más de comprobación de datos que no de usos, digamos más sofisticados que en general, corresponden a desarrollo, entonces es parque lo que permite consultar redes a través de un lenguaje sencillo. Bueno, esto está escrito aquí es un lenguaje sencillo siempre que la consulta no sea muy complicada como pasa con ese cuele se cuele. También es un lenguaje simple, pero si la consulta es compleja, pues es compleja, es parques un lenguaje que está hecho específicamente para extraer y consultar información, en repositorios de la información está expresada en las redes y como como elementos destacados tienen su lenguaje de consultas, que ofrece un mecanismo para transmitir la consulta, hemos visto que este tipo es un mecanismo, está basado en peticiones de topos a través de TDT o https y que devuelve los actos en XML. Son para máquinas, porque también estos interfaces, en general, siempre ofrecen una opción de para humanos en el que la que los datos están en html. Entonces era un ejemplo de consultas parques sencilla que es obtener, los triples de una investigadora concreta. Esto sería la consulta, es parte del disco, indica que se quieren, que se quieren obtener todos los datos que la consulta ofrece. El grapo de origen de los triples sería éste. En lobos, esto es lo que va a explicar Álvaro con más detalle, pero bueno, un Graph o sería algo así como el equivalente a una tabla en ese cuele o en un sistema se cuele sistema relacional, pero digamos que aquí no hay en él. Las tablas en estos brazos no hay tabla, sino que todos los datos están en un formato de sujeto verbo. Predican de su perdón de sujeto, predicado objeto, es decir, ese ejemplo que ese puesto antes de Esteban Vigo en Pamplona, Jesús, vive en Murcia, etc. Ese tipo de frases o sentencias son las que están guardadas; en él no hay tablas como tal, sino que es todo un conjunto enorme de frases de este estilo. Indexadas, de tal manera que, con las consultas, cuales se pueden recuperar en tiempos bastante, bastante rápidos. Por último, esta sería la petición de la condición de lo que se quiere de lo que se solicita, es decir, queremos que nos devuelvan todos los datos de esta investigadora en este gráfico. Esto sería lo que expresa esta consulta, una consulta, un poco distinta. Sería bueno tener de las entidades, obtener ustedes obtención de las entidades de la esquina investigador concretos, objetos, es decir, este investigador investigador? En qué entidades aparece como relación en donde, de qué publicaciones es coautor, en qué proyectos trabajas, etc. Entonces lo que haríamos aquí sería devolver, en este caso, el Nóos, las los juristas, digamos que devolvería el identificador y el tipo de relación en la que el investigador, está participando, el Gafo, en el que lo mismo que hemos visto antes, ese grifo en el que hay que buscar la información. Laura el investigador como objeto de otras entidades. El? Este sería el identificador del investigador, la petición. Es decir, lo que queremos es que nos devuelva el tipo de relación. En este caso, por ejemplo, que participa en un continente, en ciertas publicaciones, bale. En parque se usan prefijos, a veces para acortar las, se usan, es muy recomendable usarlos para cortar las consultas. Si os fijáis aquí antes tenemos, por ejemplo, este rdc dos puntos. Este es un prefijo esto se usan, XML, lo que quieres decir, en este caso, rsf abreviado. Esto. Aquí está toda esta web. Es decir, cuando estamos preguntando la consulta anterior por. En realidad estamos preguntando por todo esto. Almohadilla r, estos son los prefijos, digamos que son estándar, hay otros, y se pueden definir otros. En las consultas, en las consultas, que te puedes definir, por ejemplo, el. En esta consulta que hemos visto anteriormente podríamos definir unos un prefijo para http dos puntos punto bueno el punto es para no tener que escribirlo todo en la consulta. En cuanto a la anatomía de una de un de una consulta es. No siempre tenemos los prefijos que hemos comentado, tenemos las consultas, la definición de la consulta es decir, lo que queremos y de dónde lo queremos. Aquí tendríamos en el cuerpo, lo que estaría serían los datos que queremos obtener, ya que serían los que son muy parecidos a los que podemos encontrar en una consulta se cuele agrupación javier límite etc esto nos hemos puesto aquí una referencia por si quieres profundizar un poco más. Digamos que él en una consulta se pueden combinar esos patrones de, es decir, se pueden unir, se pueda hacer una conjunción. Esto es parecido a lo que sucede en ese cuele con un. Se pueden unir los resultados o se pueden hacer con un Lequio en que sería un los resultados de, pero solamente los obligatoriamente, y los debe. Si hay. Podemos hacer su consulta, igual que sucede en Google. Es decir, dentro de ese podemos hacer otros. Podemos añadir filtros, los filtros se colocan con este. Con esta sintaxis permite filtros de tipo de tipo igual distinto, con expresiones regulares más o menos, como puede pasar en Google. Permite hacer agregados agregados para este tipo, con su porcentaje mínimo, máximo concatenación es un ejemplo, esto sería parecido a las agrupaciones que se hacen en el caso de las consultas y se cuelen. Y sobre el protocolo esto es importante. Cuando se pide aquí en él hemos visto antes un ejemplo en curso, los los parámetros, digamos que tiene, esto serían el cuello, es a la consulta, que tiene que estar codificada. Antes hemos visto, os habéis fijado, voy a volver atrás, según disculpas. Esta consulta que está aquí esto es los espacios en blanco y los caracteres un poco peculiares están codificados Espacio en Blanco las comillas, los corchetes de mayor menor que agrupan un brazo etc. Eso está codificado. La consulta no va tal cual, sino que tiene que pasar por un incordio. Voy a volver donde estaba. Otro parámetro que se puede incluir ese Gafo por defecto y luego otros grupos en concreto que queramos, que son sobre los que queramos que se ejecute la consulta. Si esto es así aquí se indican, estos son estos. Estos dos parámetros son opcionales; si se indican aquí sobre escriben a los que estén puestos en la consulta. Aquí hay un asunto importante que afecta más en desarrollo, que en nuestro caso es que a veces la consulta estrella, a la longitud máxima, que permite corregir la longitud máxima que permite un gueto o el cuello, este tienen lo que suele tener una longitud máxima. Entonces hay veces que en este caso aunque fuera una consulta para recuperar datos sino para actualizar, sería obligatorio pasarla por un puesto comandos. Que tenemos en los parques para actualizar datos tan. Tenemos un comando para cargar datos, podemos borrar un brazo entero, crear un brazo o eliminar un brazo; borrar el grapo. Lo que se hace es borrar el contenido, pero no el grifo y que se borra el grifo y el contenido bien tenemos aquí un tutorial recomendado, desmarque del que os si queréis el saque de falta, algún montado, profundizar en alguna consulta, resolver alguna duda de cómo se ejecuta una consulta. Podéis verlo. Aquí son tutorial, un bastante austero en su presentación, pero está bien en el contenido. Os recomendamos y voy a pasarle el control a mi compañero Álvaro Palacios, que va a ver ahora una serie de consultas. Ocupan un momento voy a dejar de compartir. Esto no vale. Voy a parar la grabación.

Propietarios

Proyecto Hércules

Comentarios

Nuevo comentario

Serie: Formación lunes 8 de febrero ASIO Gnoss (+información)

Descripción

videos