Idioma: Español
Fecha: Subida: 2021-02-22T00:00:00+01:00
Duración: 1h 44m 31s
Lugar: Curso
Visitas: 55 visitas

20210210 1-Introducción a Linked Open Data

Transcripción (generada automáticamente)

Bueno, pues muchos buenos días a todos. Estamos aquí en familia. Había cuatro personas, quizás poco a poco se irá incorporando más gente, os voy a hacer una introducción a quienes el concepto de Hita a sus manifestaciones más importantes y sobre todo pues os voy a contar la relevancia que tiene en el sector público el sector bueno, de las universidades, también entre el mundo académico, y la razón por la cual pues hoy somos introduce en ese término no es algo esencial, dentro de las pilares o libres fundacionales de Hércules, entonces bueno prestado un conjunto de transparencias de una presentación oficial ofrecida por el hielo por el portal de datos abiertos europeo. Por eso esto explica que muchas de las carencias que vais a ver hoy están escritas en inglés. Vale, confío que no sea un problema para ninguno de nosotros, y esto es el índice de lo que hubiera una haber lugar. Vamos a definir datos enlazados. En segundo lugar, vamos a intentar distinguir entre datos abiertos y datos enlazados. Veremos que desearíamos que los datos fueran abiertos y enlazados, pero hay estaciones. Hay situaciones en las cuales, pues no se dan esos dos atributos asociados. Luego, pues veremos las cinco maneras de publicitar, de publicar información en la web y que hay un esquema o un enfoque para clasificar como debía estás abriendo tus datos, y finalmente acabaré dando unas pinceladas sobre por qué es necesario, importante para la sociedad, para los sectores industriales. El compartir datos de manera bien. Un contexto breve de por qué estamos hablando, estamos hablando del inédito, porque esto es una tendencia a la evolución del agua, inicialmente, como he dicho en otras tutoriales o en otras formaciones anteriores; a esta solamente había un árbol de documentos, los documentos tienen una estructura que es idónea y adecuada para que un navegador pueda usar esos datos; sin embargo, un agente software, difícilmente entiende lo que está ahí modelado como etiquetas de marcado, como lenguaje html. Es necesario. Salió a hacer programas, software sofisticados usando técnicas de procesamiento del lenguaje o técnicas de inteligencia artificial; son capaces de destilar la información. Por eso veremos trabajando algunos desde hace ya una década más de una década en la idea de la semántica y, por tanto, de la web de datos, donde soñábamos, con que los datos estén conectados unos con otros, y esos datos vengan acompañados de metadatos, para que sea muchísimo más sencillo entender lo que hay detrás. La realidad actual es que la web tenemos contenidos tremendamente heterogéneos en cuanto a su contenido, en cuanto a su estructura, en cuanto e incluso a la codificación de los caracteres que conforman tales documentos. También una en cuenta que hay diferentes alfabetos y que los sistemas de codificación de la información han sufrido o han experimentado diferentes evoluciones en los últimos. Entonces el futuro requiere una integración más inteligente y en esa desgravación no desea evolución. El concepto del inédita aparece. Podemos entender que el inédita es esta idea de intentar pasar de una web habilitada, documentos a una web de datos enlazados, entre lanzados, unos con otros. Veréis como la izquierda pues tenemos documentos de marcado escritos en html que tienen ni vínculos el grandísimo invento o innovación de la web, o el hecho de que era posible navegar de unos documentos a otro. El tema de los vínculos que hoy lo pensamos pensamos que es algo bueno, tremendamente sencillo y no una innovación demasiado grande, pero, pero realmente lo que ha marcado la diferencia en el enfoque de publicar información, bueno, pues queremos transitar hacia una web donde haya datos, y sus datos estén localizados en diferentes grapos conocimiento o en diferentes ficheros. Claro, es que eta es como si dijéramos una versión más blanda, una versión notan estricta de la web semántica se queda simplemente con la esencia. Con lo más importante, para fomentar el intercambio y el entrelazado la conexión entre diferentes datos, cuando hablamos de no sabiamente estamos hablando de web semántica, aunque si hacemos con cinco estrellas a lo grande bien hecho, también estaremos usando web semántica. Entonces, esta es una importante distinción para alcanzar esta quimera de la web de los datos lo mejor sería adoptar en toda su esencia la semántica, pero en su defecto, al menos ir adoptando los conceptos de ley bale entonces, donde empezó todo empezó con una colección de documentos publicados en diferentes portales, podemos acceder a observar en la parte izquierda, a esos documentos, usando un concepto importante que son las vr. es universal. Eso es lo que hay. 2. Inicialmente, estos documentos escritos, en un lenguaje que se llama html son gracias a una pieza de software, son los navegadores, entendibles por las personas, pero lo una vez más incidido difícilmente comprensibles por las máquinas. Por tanto, reiteró la web de Data intenta facilitar el acceso a esos datos. También a las máquinas quiere que sea una web, tanto para personas como para procesos, eso, acuerdo y que aparecen por aquí conceptos como la psoriasis, una vez más, una hora y. Atención, es un súper conjunto de una uva rl, es decir, es un identificador único no es necesariamente, y es si cuando tu introduces esa Wehrlein un navegador no es absolutamente obligatorio que llegues a un recurso a través de esa hoy, aunque obviamente es la práctica, más vale entonces, con la voz de datos que nos producen hacia datos entendibles por las máquinas que están aderezados, con un montón de metadatos, o sea que a partir, aparte de los datos en sí mismo, por ejemplo, es una fila de un recibo donde tenemos el nombre del producto, el precio o la fecha. Hay una serie de metadatos que informan sobre especifican cosas, como que la fecha tiene un formato, dado que el código de la factura también sigue en formato, dado que el código aparece antes de la descripción del elemento comprado, este tipo de reglas o de vocabulario son los metadatos, que aderezan los que luego se representa, y así vamos a conseguir. Estos datos, que son, qué tienen? Qué tienen lo bueno de las dos partes. Ya vimos en otro módulo anterior que hay ciertas extensiones del agua, semántica que intentan combinar lo mejor de ambos mundos. El hecho de que el contenido pueda ser a través de un navegador, web, y el hecho de que un programa pueda extraer fácilmente la esencia de lo que está siendo representado. Ese estándar se llama y luego, pues bueno, por supuesto también podemos tener dos versiones de las páginas html o de los documentos html, que es la que va al navegador, web y otra en otros formatos, como pueden ser rbs, XML y Jay-Z, y si conocéis un poquito el funcionamiento del protocolo http. Os daréis cuenta o comentó el protocolo? Http. De hecho, está diseñado para negociar qué contenidos se sirven a diferentes clientes o agentes, solicitando información de un servidor web. El protocolo. Http. Es el protocolo que permite negociar a un cliente con un servidor en ese proceso de negociación claros. Un cliente a veces es un navegador web; el navegador web; cuando se conecta con el servidor web. Indica cuál es su preferencia de contenidos, que tipo de contenidos quiere recibir. Su navegador, web; lo que dice. Yo deseo que acepto contenidos. En html, mientras que un programa, software, por ejemplo, hecho en la actuación, puede decir que su preferencia es que se le sirvan contenidos en formato XML. Algo interesante a entender es que cuando tú públicas datos, si quieres que tus datos no solamente sirvan para la web tradicional sino también subirte al tren del debe es permitir que los clientes, htc, negocie con tu servidor de contenidos las diferentes versiones de un recurso. Esta transparencia a aquellos que se inste es mi tutorial inicial a la web semántica agradece, y aol ya lo habéis visto en este transparencias de modo muy rápido. Simplemente quiero resaltar el hecho de que es posible mezcla datos, semánticos o datos, también enlazados, he dicho que los datos semánticos en esas redes, que al fin y al cabo son la quinta esencia, la mejor de datos enlazados, y hay diferentes mecanismos para mezclar html con metadatos, una de las formas más apreciadas es la que acabo de comentar, a ahí tenéis un enlace. Básicamente nos dirige a una página que explica un poquillo qué es esto de reaccionar. Pero esencialmente, si explorará dice este enlace, lo que vais a descubrir, lo que vais a descubrir es que se enriquecen los elementos, html. Por ejemplo, esto es una etiqueta que para describir una imagen, pero en este caso fijaron, estamos enriqueciendo esa imagen indicando que esa imagen es de hecho libre, que tiene detrás una licencia. Creative Commons tres puntos, pero vale, y bueno, pues básicamente usa una serie de atributos adicionales, y los elementos html para poder ir los anotando con sentencias de tipo se mantiene. Si tenéis curiosidad, repito, saber cómo se hace os invito a que leáis este artículo que está ahí pero vinculada antes de que surgiera este estándar desarrollado por la Web Consortium, que básicamente es la organización que regula todos los estándares, alrededor de aguar, pues ya existían un conjunto de convenciones de facto las que habían acordado una importante número de desarrolladores de contenidos web que permitían crear gays atributos tales como los que aparecen a quienes grita. Esto no es estandarizado, vale, pero hay muchos micros, formatos, definidos para describir cosas como eventos, como geolocalización, como relaciones de parentesco entre personas. Vale aquí qué tonterías tenemos? Aquí? No estamos diciendo que el autor de esta página, imaginaros que estar, escribir una página, existe menos de un tal equipo ni por vinculó a una tal y de paso dice que es una chica dulce, que la conocido y que le gustaría tener una cita con no esa es una manera también de enriquecer, de anotar contenía el sistema, y este es el formato recomendado hoy en día, dentro del estándar para crear páginas html, que se denomina html5 bale, y aquí véis cómo podemos describir un texto? Era detalles sobre los Juegos angry, ver para su versión Android como lo podemos enriquecer, con esas cositas en grito en negrita indicando. Básicamente que esto que estamos describiendo es de tipo software aplique tiene una tributo nombre tiene otro atributo sistema operativo y también tiene una esto sería una. Aquellos de vosotros que habéis estudiado, agradece conmigo y esto sería una obvia, es compartir, porque a su vez está diciendo que una aplicación, o sea que está especializado como gay, que no solamente es una aplicación solo bueno, sino que encima es un juego bien. Entonces, pasando aquí esa transparencia. En resumen, para acabar hay por aquí un conjunto de tecnologías críticas que nos permiten mezclar ambos mundos. El mundo en la rueda de documentos con el mundo de la vida y último apunte y recordatorio para aquellos que ya visteis esto conmigo es que se ha ido más allá y si bien sabemos que la semántica es complicada, de ser adoptada por todas las organizaciones y que requiere una inversión de esfuerzo ingente bueno, al menos sí que podemos anotar, partes partes de nuestros documentos, las partes más importantes y se han puesto de acuerdo un conjunto de buscadores de Internet, los más famosos los que veis aquí listados, bien, Google, Yahoo, para que se han puesto de acuerdo para crear un conjunto de vocabulario, los comunes, tal manera que esos buscadores, una página que describa información de eventos o sea capaz de interpretarlo de. Igual manera porque esas páginas Man adoptar una serie de atributos Comunes para describirlo bale, si tenéis curiosidad, invito a que visite esta página donde están descritos minuciosamente todos estos esquemas. Pero, bueno, hoy estábamos aquí para hablar de eta, o sea, vamos a profundizar. Vamos a adentrarnos en entender los principios del inédita y vamos a estudiar qué retos hemos de resolver para hacer realidad esta idea de élite, comencemos por una definición dada por en este caso un informe importante que creó la Comisión Europea titulado. Como los datos enlazados, están transformando el Gobierno electrónico hoy saber qué que los mejores representantes del mundo de Linde y eta son las administraciones públicas a través de sus portales abiertos. Lo que pretendemos con asiduidad Hércules es poder crear también un portal de datos abiertos y enlazados de la información académica del mundo universitario español. Entonces, vayamos a la definición, datos enlazados. Es un conjunto de principios del diseño sabe cómo hacer cosas para que para compartir información legible por máquinas en la web y que suele ser utilizada por administraciones públicas, por negocios y por ciudadanía, vale. Que el propósito es poner a disposición de todos estos agentes importantes de nuestra sociedad, contenidos sobre los cuales ellos luego puedan trabajar, puedan hacer cálculos estadísticos, puedan transformar esos datos, puedan agregar, los puedan crear gráficas de visualización; y nuestro amigo Tim muy bien conocido. Confío por todos los otros, es el creador de la web, es el precursor de la web semántica es el precursor incluso el agua descentralizada. Esa es su última. Su última propuesta de evolución de la uer nos dio cuatro principios esenciales que deben de cumplir los datos. Para decir etiquetar como primero vamos a usar un gris para nombrar aquellos conceptos que queramos describir, ese es el paso, el paso 2, vamos a tratar que esas de hecho apunten a algo que podamos extraer información una vez que viajamos a esa sur bale, una vez que hemos viajado extraemos de ellas, o podremos introducir a través de sus puntos de acceso, pues consultas o le contenidos, derivados de. F. Podríamos interpretar y algo muy importante. Ese es el principio de hecho, más importante de los dados en las 2, por eso se llama Lin. Nuestros datos ganan en usabilidad; ganan en interés, ganan en valor. Si están enlazados a los datos de otros, sí yo estoy describiendo por ejemplo un concepto. La Universidad de Deusto, cuando yo, es que Bolonia sale hurto, debería hacer la Universidad de Deusto con otro concepto que, por ejemplo, describe el barrio de Deusto, con otro concepto que describe la ciudad de Bilbao con otro concepto que la Comunidad Autónoma del País Vasco con otro concepto que describe el país España etc etc etc tenemos que permitir la navegación por todos estos conceptos de eso vale de eta. Otra definición alternativa muy similar es una buena práctica recomendada para exponer compartir, conectar, piezas de información y conocimiento, la web semántica usando y r una vez más incidido. Esta es una definición estricta. Es posible que nos encontramos manifestaciones de Linde y que no sigan los principios de semana de manera escrúpulos, no vamos a ver, hay un especie de red o de clasificación en los datos enlazados, pues aquellos que no cumplan con la semántica web y con sus estándares como rsf para tener una calificación de 3, este ya es máximo frente a las cinco posibles estrellas que pueden. Gracias al él vamos a poder descubrir conectar, describir y reutilizar datos. El sueño sueño es concebir este garaje de Gracia donde haya algunos que, por ejemplo, describen información del adn, otros grapos describen información, por ejemplo del censo de Estados Unidos, otros pueden describir información sobre publicaciones o sobre también artículos acm y la idea es que eso es gracias a las instancias de fotógrafos, estén en las a través de híper vínculos con otros instancias de esos años. Bien es lo que queremos conseguir, son cosas como las que veáis en pantalla que es lo que teníamos en pantalla aparecen diferentes colores. Esos colores representan diferentes conceptos. Por un lado, el dominio azul representa un libro, el dominio. Este gris oscuro representa una revisión de un libro y este dominio verde que veis aquí me presenta a unas personas, mientras que esta otra representa una entrada en la media correspondiente a una ciudad. Entonces, en este caso estamos consiguiendo links de porque estamos diciendo que esta perdonar este autor de una revisión, este autor de una revisión es de hecho la misma persona. A ahora ver este y de que representa un libro disculpa es exactamente hace referencia al mismo libro, podría ser que en el dominio en el grifo de las revisiones, los tres puntos que veis aquí haya un paz o ruta un poquito diferente a la que nos encontramos aquí imaginemos, Nóos, que éste tuviera aquí vivió ese punto o barra y ese ver en lo que sea y éste tenga aquí libros, punto, Old, barra y nos conectamos con una propiedad o si hay más de esa manera decimos que este libro es referencia en este gráfico gris oscuro, es el mismo que este libro referenciado en este otro párrafo de libros, con otro aire aparentemente distinto, pero que apuntan al mismo concepto. Esto mismo se repite. Aquí aquí tenemos el correspondiente a un revisor, a la persona que hace la revisión, y aquí tenemos salir de correspondiente a alguien que tiene una página web vale, y donde Bueno ha descrito sus metadatos, por ejemplo, usando un bocado. Lo que vemos aquí es que otra vez estamos más peleando, estamos enlazando, estamos diciendo que este concepto en es el mismo que este, otro concepto y así sucesivamente. Confío que con esto de manera gráfica entendéis, que es esto de Linde, y para qué queremos estudiar. Al final lo que queremos es hacer. Aplicar útiles que explotan esos datos, Javier. Lo que veis aquí fue un esfuerzo que hicimos en mi grupo de investigación para intentar cruzar datos correspondientes a los residuos generados en diferentes municipios de la provincia de Vizcaya, y de una manera un poquito más accesible a los seres humanos. Creamos un mapa de calor indicando cual es bueno. Pues, qué municipios generan más residuos que otros. Si hiciéramos y pudiéramos hacer este análisis a nivel de barrio. Esos datos podrían ayudarnos a tomar decisiones como si es necesario colocar más contenedores, si es necesario, lanzar campañas entre la ciudadanía para que reciclen más para eso es para lo que queremos. Open o p, podría ayudar a la empresa que se encarga de recoger los residuos generados en los contenedores de una ciudad a optimizar sus rutas a preveer, cuando debería acercarse a los contenedores, basado en históricos de los datos. Bale bien. Por tanto, no solamente es pertinente hablar de eta, sino también del Lens Open Government de eta. Qué es, sin duda alguna, la manifestación más clara de dónde está utilizando esta idea de élite y cuáles son los objetivos detrás de hacer que los gobiernos, las administraciones públicas, publiquen datos avión. Bueno, queremos potenciar la integración flexible de los datos a leer. Queremos facilitar la interconexión entre diferentes sistemas de información de un Gobierno. Queremos facilitar nuevos empresas que ofrecen servicios innovadores a las administraciones públicas, tengan más fácil conectarse a su información. Además, se quiere incrementar la calidad de los datos, dado que esos datos se hacen públicos, están sujetos al escrutinio público, están sujetos a los innovadores que trabajan sobre sus datos. Y que detectan problemas fallos con ellos, gracias a abrir esos datos, podemos dar lugar a servicios innovadores, por ejemplo, pues conecten todos los datos de información, de transporte en tiempo real de una ciudad y nos permitan encontrar la ruta más rápida, el punto al punto b o la ruta menos contaminante del punto a Al punto, y supuestamente los gobiernos, a los datos que van a conseguir es qué hacer soluciones para ellos sea cada vez menos costoso. Llegamos aquí; tenemos un enlace importante allí o pierda y te aporta. Este libro te aporta, es una especie de catálogo indexada a todos los datos de las administraciones públicas. Europa observar están, pues clasificadas en diferentes sapiens. Ocho categorías, por ejemplo, Saló que, por ejemplo, podemos tata sets que nos hablan de infame, y pandemia no estamos todos sufren, pues hay veréis como en este catálogo de datos le dice qué información se está generando, y además veréis que tenemos diferentes maneras de acceder a los datos. Tenemos como a tope de DC lo tenemos en formato extranjero. Lo bueno es que podemos buscar a ir a Taseer. Podemos también navegar o acceder a un conjunto de soluciones que se han generado encima de esos datos. Y tiene incluso un Spark el pollo, es decir, tiene un punto de consultas, es parte de aquí los un conjunto de ejemplos. No vamos a ver si encontramos una concreta. Son preguntas demasiado genéricas, tendríamos un poquillo para descubrir alguna consulta concreta sobre estos catálogos de datos, que veremos ale, pero, bueno, lo importante es que ese es el portal de los portales a los cuales tenemos acceso, luego navegar por el mejor portal que tenemos a nivel estatal, que es el nivel. El portal aporta bien, pero vayamos ahora a pensar o a entender cómo publicamos nuestros datos. Como lente, entonces he visto que había cuatro principios. El primero es que tenemos que usar identificadores uniformes de recursos para nombrar las cosas y segundo ya que elegimos unas son unas que apuntan, vía htc, a un recurso existente en la web mucho mejor, porque podemos acceder a ellos. Esta sería, por ejemplo, Lahore que apuntaría a un recurso que es la es unisex y que está descrito, pues en un catálogo de publicaciones que tienen la Comisión Europea. Si yo hago explica ahí pues accedió a un recurso. Este recurso en que está descrito estos rdc y lo bonito que tiene es que, pues claro, este recurso está descrito en todos los idiomas. Oficiales de la Unión Europea, claro, es que aquí os ofrecemos en castellano que dice que este recurso, que está descrito a través de una antología que es la antología aunque está describiendo el fondo de las Naciones Unidas para la infancia es decir bale y luego pues bueno te están clasificando que unicef va a estar, como veremos por aquí. Claro está aquí. Esto que veis aquí está diciendo que no es una entidad sola, ella depende de la. Eso es lo que es La uno vale. Si yo eso es, estoy de esta manera lanzando a unicef con las Naciones Unidas. Muestra recurso muy mal por mi parte, vamos a ver si lo consigo, copiar adecuadamente, introduce. Ya veis, aquí nos aparece la instancia que describe minuciosamente la Organización de las Naciones Unidas, donde lo tendremos en castellano tanta aquí lo tenemos Organización de las Naciones, muy bien, para eso sirven las claros cuando alguien de hecho accede a la ruta tal como he dicho ahora debe devolver información útil, agradecer que sea o tiene que permitir a través de un empollón o interfaz; bueno, meter ahí consultas que extraigan los da y importante principio, 4. Cada concepto debería estar emplazado a otros. Aquí voy resaltado justamente lo acababa de enseñar como unicef es una tradición que al fin y al cabo depende de las Naciones Unidas, por eso esa propiedad significa algo así como que es un concepto especializado de las Naciones Unidas ; es una organización de las Naciones Unidas, bien, he hablado muchas veces hoy hasta ahora de lengua o pentrita de modo un tanto confuso, hay que decir la inédita, no necesariamente es o pentrita que de eta son los datos que pueden ser utilizados de manera libre. Reutilizados distribuidos a leer -y en general no suelen tener restricciones, no tienes que pagar royalties por usarlos, como mucho, y esto es una práctica como tienes que reconocer, de dónde han provenido tal datos bale entonces y no son necesariamente lo mismo, aunque lo ideal sería que trabajaremos con Open de eta, claro que datos abiertos pueden ser publicados de manera pública, con una licencia abierta, pero no necesariamente estarán enlazados, unos con otros. Los de eta pueden tener pueden seguir los cuatro principios, sin embargo, para acceder a ellos tienes que registrar o tienes que auténtica arte contra un portal h. Bien, aquí tenemos una vez más un recordatorio de estas cuatro reglas que necesariamente debemos cumplir para tener datos enlazados aquí en este dibujo como aparecen cuatro entidades, no aparece una entidad chico, una entidad chica, un coche y una casa, y vemos por aquí estas flechas, que básicamente establecen enlaces entre ellas. Por ejemplo, tenemos que A que esta persona es propietaria, hospital de este coche, con Four o con esta relación, o que esta chica conoce a este chico, a través de esta relación o a no, sea que le indica lo que hace. Es permite descubrir navegar moverte por diferentes conceptos a través de las relaciones que se establecen entre bien entonces una vez más-volviendo al tema de estos son nombres únicos para referenciar a las cosas y que son importantes porque es la manera que podemos direccionar suelen ser un estre un pacto y además suelen seguir suelen ser bien escritas que no tienen pues Strings que están bien definidas que son vale y además yendo más allá suelen ser persistentes es decir que no son volátiles que sea su origen en el tiempo siguen apuntando siempre al mismo recurso vale eso es algo muy importante cuando decidimos que tiene que apuntar a un recurso el hecho de que sea aquí habéis ejemplos pues bueno un poco el nuevo portal de Linde y al que habíamos ido antes pues aquí ves cómo está descrito el país españa es una taxonomía de países a ver y aquí pues otros organismos dentro de de ese repositorio, colega de Génova Esteban, luego se enseñará cómo se permite la navegación, datos enlazados, en este caso del dominio el segundo principio fundacional de eta es conveniente usar? No es otra cosa que una. Sintaxis para repuntar datos y recursos en la web y también es conveniente poder hacer uso de este lenguaje estándar para consultar grapos r recuerda que, con lo que modelo, un triplete de información, esas tripletes consiste en un sujeto básicamente el recurso al que tú quieres describir que estoy identificado por un hombre, un predicado que básicamente es una relación generalmente entre dos conceptos y que también, a su vez tiene la sociedad de Lahore, y, finalmente, un objeto suelen ser dos tipos, puede ser un recurso con su propia orina o puede ser directamente una estrella con un valor final primitivo. Aquí vemos el ejemplo de dos tripletes. Tenemos la ciudad de Madrid al sujeto. Es un predicado en un caso apuntando a un literal. En otro caso, apuntando a un objeto vale bien, ya se habían anunciado, que tiene ley, que fue el creador del agua, fue el creador de la web semántica que ha sido el precursor, del inédita. O se ha creado este mecanismo para clasificar los datos en la zona. Entonces dice. Bueno, depende de cuándo te esfuerzas publicar de modo abierto ser posible y de lanzar tus datos. Pues tu portal podrá recibir a un rey una calificación de una estrella, dos estrellas, tres estrellas, cuatro 5, como es. Si lees el texto, el tema va desde solamente requerir tus datos. El formato en el que esté tener una licencia abierta, por ejemplo un PDF publicado en una página web. Eso es eso puede ser considerado como el inédita con una estrella públicas, una extra es un formato propietario, pero que es; es evitable con un montón de herramientas, pues ya tendría dos estrellas. Si haces un esfuerzo mayor y a otras un estándar que es el propietario que no pertenece a una corporación que no ha sido diseñado por la Corporación en este caso Michael usa, por ejemplo, sino que es abierto, pues tendría las estrellas si estas fuerzas en publicar estos datos ya como merece seguir los principios de la web semántica puede tener cuatro estrellas, y si ya rizar el rizo y encima enlaza estos conceptos con otros, de otros garajes externos al tuyo, entonces tienes 5. Esto es exactamente lo mismo, esta tabla y ahora vamos a ir escribiendo una, uno con un ejemplo. Claro. Esto que veis aquí sería un ejemplo de algo publicado bajo la calificación de una estrella. Lo que tenemos es un documento doc, accesible a través de una licencia abierta. Cuáles son las ventajas de los datos? Puede obtener una copia? Pues una vez que tienes los datos modificados, hacer lo que quieras, con ello, para el público cuáles son las ventajas? Es fácil publicarlo. No tiene que tratar los datos apenas, y no tienen que explicar pues, o dar explicaciones sobre la empresa. está descrito en un formato propietaria pero altamente popular y la gente puede hacer uso. Puede ser un poco más allá y decir vale? En primer lugar, he publicado algo en un formato que no es estructural, es decir, que es binario. Son datos binarios leer en este otro caso. Puede que los datos sean binarios, pero son estructurados; hay muchas utilidades que pueden extraer las celdas, las tablas las filas, las columnas de su documento. Sería publicar algo, por ejemplo, como un examen, tal como el que veis aquí a leer. Como consumidor, tú puedes procesar directamente el fichero, usando software propietario para luego hacer cálculos visualizaciones, y luego puedes tú por supuesto, transformar esos datos. En otros formatos para el público mantiene las ventajas de la época anterior y es bastante sencillo, aunque se ha esforzado un poquito más. En vez de publicar algo como Documentos, Wall, que no tiene una estructura que programática mente puede ser tratada, la, publicada como Nextel, que hay muchas librerías, aguas que permite programática, tratar esos bien, el paso tres es vaya más allá; nuevos formatos, propietarios usemos un formato, que es libre; alguno de los que veis aquí en pantalla, como por ejemplo XML v r, deje, y encima es estructurada. Ese es el formato hacerse v, aparecen en primer lugar en la primera fila, lo que son las cabeceras, las columnas de una tabla y luego por cada fila, por cada línea hay una fila y las columnas de la fila están separadas por comas. Como veis? Aquí por eso se llama Coma, se pare. Vale. Hay otro formato que es el té ese, v fabulador, se para ti Bailly. Bien, pues aquí estamos viendo un ejemplo que muestra datos sobre los accidentes en carreteras, en 2006, en algún lugar geográfico. Ventajas para el consumidor. No puedes manipular fácilmente los datos, y encima usar cualquier lenguaje producción, cualquier librería, para hacerlo, no está restringido a utilizar una herramienta que es capaz de entender algo propietario. Ahora publicado por Bueno, relativamente sencillo, de publicar aquí tienen que hacer un esfuerzo, un poquito extra. Tienen que abrir, por ejemplo, este fichero, y ya lo tenían en un excel y en vez de exportarlo como nexo con exportan en un formato abierto, como cese o normas como el que permiten fácilmente, pasarlos o transformarlos. Las cuatro estrellas, pues aquella queremos ir más allá y queremos modelar estos datos estructurados, haciendo que encima tengan para identificar los conceptos. Ha descrito lo que veáis en pantalla es un ejemplo del portal de datos abiertos español. Datos punto es que lo hace también. Al igual que el europeo, indexar todos los datos que son publicados por las administraciones públicas en España y yo voy Estado o rl que veis aquí pues básicamente estuviera accediendo a la visión a la parte de un recurso identificado por el sabor y que resaltó. Estoy diciendo que este recurso está publicado con una licencia abierta y está distribuido en diferentes formatos. De hecho, pertenece al portal de datos abiertos de el Ayuntamiento de Santander junto con el Ayuntamiento de Zaragoza . Quizás son los ayuntamientos que tienen portales de laudos abiertos más sofisticados, bale entonces aquí véis que esta información puede ser, visualiza, hable de diferentes modos en html, una visualización que por cada comercio básicamente está describiendo. Si quitas. Bale estaba, me he perdido con. Que siempre ayuda. Vuelvas transparencias, a complicar aquí otra vez. Lo que quería enseñar es que este recurso lo lo lo bonito que tiene, es que también los mismos contenidos los está exportando. Por ejemplo, en parte que es un. Una señalización bastante más entendible, más legible, para los seres humanos, la hubiera descargado mejor si la descargó aquí como. Me pongo en. Y voy a ponerlo como lo es. Vamos a ver si ahora lo vemos de una manera digna en pantalla, mal no, porque no es portado como agradece Simeone, bueno. Bien, esto ya tiene un formato más como el que yo quería mostrar al final en tres es un súper conjunto de tarde. Es una manera estabilizar. Ya veis que aquí aparecen filas. Bueno, más o menos las los seres humanos entendemos que es lo que están describiendo que cada comercio y por cada comercio soy de su nombre, su a, que se dedica el código Postal, cuando fue creado y así con cada una de las tiendas, en este caso de Santander, que cuyos datos han sido exportados como a leer qué ventajas para aquellos que queramos explotar estos datos tiene enlaces este documento a otros recursos, entre ellos todos aquellos que pertenecen a la misma categoría pues apuntan al concepto categorías como, por ejemplo, moda. Yuca. Puede estar además fácilmente pasar un enlace a una de las entidades, a alguien para informarle de sus datos puedes combinar de una manera sencilla, otros para el publicado otros publicados de datos. Ahora podrían establecer enlaces a tu brazo, aldeas, tiendas, en este caso en Santander. Imaginemos que por ahí alguien que sentando crear un catálogo de los comercios de todas las ciudades españolas es lo que podríamos hacer en este catálogo es ir apuntando a los catálogos de cada una de las ciudades y, como publicado ahora encima, pues puedes tomar de ejemplo el vocabulario que está siendo utilizado para publicar las tiendas de Santander y hizo lo propio tú bien para introducir nuevas tiendas a Santander o para crear tu propio catálogo de comercios y otra ciudad. Obviamente, esto es más costoso, mucho más costoso que el que publica lo que es para nosotros formatos o o maneras de crear, y, obviamente, también, inéditas estable en alguien que en personal, y se asegure que la calidad de lo que portas es esta es la primera final no terminado a finales, tener formatos, datos enlazados a otras, a otros que estamos viendo cómo desde una página que habla de un ministerio este caso de Grecia, se puede apuntar a una secretaría dentro de ese ministerio y, bueno, básicamente lo que hay. Ahí es al fin y al cabo. Enlaces todos lo lo lo bello de tenerle inédito Cinco -Estrellas, es que fácilmente puedes ir descubriendo datos relacionados, puedes combinar datos de distintos tus datos, son más fácilmente descubrirles, pero bueno, tienes que invertir bastante dinero y esfuerzo en conseguir publicar los datos de Samuel. Pues bien, entonces sí si os preguntáis como transformaría el portal web de mi organización, en un portal de datos enlazados, cuales son, cuáles son los los pasos que quede seguir, no como publicados. Relatos como responsable, tendré que empezar con algunos conjuntos de datos, no voy a lanzarme a la piscina y publicar todo como y directamente te sale una selección, aquí es la tasa más importantes, además de mayor relevancia para el público. Luego tendré que seleccionar algunos modelos para representar tales datos y finalmente procede a la publicación. Si yo soy alguien que quiere innovar en cierto sector, lo que tengo que hacer es ir a catálogos de datos públicos de cierto sector de tal sector, por ejemplo, el sector energético, el sector de la educación imaginaos, que queremos crear una herramienta que recomienda el grupo de investigación de la universidad a debería mezclarse con que otro grupo de investigación de la Universidad ve para conjuntamente, tener más posibilidades de concurrir a convocatorias de proyectos para hacer eso, pues obviamente tengo que seleccionar. Qué voy a utilizar. Tendré que establecer puentes entre ellos si no existe, tendrá que integrarlos, y en acciones en ocasiones podría incluso generar como resultado una peseta agregado. Bien, ya hay obvias ventajas de subirse a esta iniciativa o a esta visión de cómo mejorar la transparencia, como también, pues seguir cierta legislación que se está publicando sobre cómo hay que hacer un mejor servicio y rendición de cuentas públicas a la ciudadanía. Podemos mejorar la audiencia, podemos hacer que los datos que son de todos, pues al fin y al cabo sean utilizados mejor y de una manera sencilla, bale. Hay que tener en cuenta que cuando datos tenemos que modelar también los metadatos para incrementar el valor de aquellos datos que publicamos, tenemos que licencias abiertas y algo muy importante donde quiero incidir. Para acabar mi sesión es el tema, tenemos que tener cuidado, que lo que publicamos que sea lo más correcto posible y que tenga bueno, que esté limpio, que éste esté depurada. Entonces esto debe depurar datos, pues es una tarea compleja, una tarea costosa en tiempo y dinero, pero necesaria para que para corregir errores, para asegurarse que usamos formatos homogéneos, para resolver, inconsistencias, entrenadas y mitad metadatos todos para eliminar duplicados. Bien, afortunadamente, sobre todo cuando trabajamos con datos, es un formato muy común de exportar información. Hay herramientas libres, como esta, que veis aquí o pez Rifai, que te permite de una manera muy intuitiva importar. Ese es eliminar duplicados, hacer cosas como la que habéis aquí claro que aquí tenemos una tabla con Valores, donde como veis las fechas cada uno las ha indicado, como le ha venido de engaño, las direcciones de correo electrónico y algunos que no las han escrito de manera correcta. Hay columnas que no tienen valores, hay maneras distintas en diferentes idiomas de publicar datos de los países. Entonces esto, diríamos, la parte azul es una chapuza. Es una mala manera de publicar datos en enlazados, porque si tú quieres procesar esta con un programa, pues tienes que tener un programa lleno de excepciones lleno de valoraciones, complicaría sobremanera su lógica y que estaría sujeto a los cambios arbitrarios de formatos por aquellos que publican los datos. Todas. Hay procesos que se encargan de generar estos datos más limpios. Eso es lo que es el clima sin es lo que hacen herramientas como bale final sí publicamos. Nuestra misión final es romper los silos de información que hay detrás de nuestras organizaciones. Queremos que otros se den cuenta de la riqueza del conocimiento, es interesante para temas de marketing, para temas de demostrar el valor de lo que hacemos. Aquí tenéis algunos ejemplos, podrían haber puesto un listado larguísimo de algunos repositorios de datos públicos que me parecen reseñables. Por ejemplo, me parece muy destacable el portal de datos de la ciudad de Zaragoza. Si queréis jugar con datos y ver como una humillación pública, una universidad debería publicar datos. Bien, recomiendo que visite este portal, donde se han esforzado muchísimo, en alcanzar la excelencia, en alcanzar las cinco estrellas, en la publicación de datos abiertos, y en la zaga; por supuesto que dos ejemplos claros de los que ya hice mención en días anteriores de datos en la zona ya abiertos son whisky nata, y el primero, recordar son repositorio de repletas; son contribuir por la comunidad y que no tiene una antología, es básicamente nombre a describir tripleta este modo sencillo y todos podéis participar, enriqueciendo añadiendo nuevas tripletes y a través de un mes parque del, que es el que estoy apuntando a qué hora y media es un choque conjunto de la Wikipedia, que han extraído las partes, que son procesales de las páginas, html los y han ofrecido también un Spar que le impone a la consulta. Bien, para acabar simplemente decir. Si estáis muy interesados en el portal de la iniciativa aporta es un portal excelente documenta, de qué va esto, de crear datos que dan servicio y que aporta un valor a la sociedad y una industria como vayáis pues tiene diferentes tareas. Aporta esta iniciativa del Ministerio de Innovación cuyo propósito es impulsar y coordinar la apertura de datos, estimular un mercado ligado a la reutilización de información, el sector público y contribuir a favorecer las condiciones del desarrollo de la Estrategia Europea de Datos en España que se cambie esta iniciativa es la que vela, porque cada vez se preste más atención a la generación de datos públicos de valor para todos, sobre todo para innovadores, para empresas, para que los utilicen luego en sus soluciones. De hecho, sí aquí vemos empresas que están utilizando datos importantes. Como por ejemplo idealista es bien conocida por todos nosotros, que hace un uso extensivo de todos estos datos públicos que veis aquí el catastro. Además, si tenéis curiosidad, por favor esa Saguer y esto lo bueno es que es una realidad, que cada vez tenemos más datos siendo publicados y deberíamos capaces de lanzarnos con ellos y explotarlos. Y bueno tiene esta es este movimiento, pues tiene un alto potencial económico y relevancia para sectores como la agricultura, el turismo, la energía, sector inmobiliario ale lleváis algunas aplicaciones para las cuales los datos públicos podrían utilizarse en este sector. Bueno, hemos acabado por eso, transparencia o se demostrado por eso los principios del diseño de ese propósito, que tiene de facilitar el procesado enlazado la conexión entre diferentes datos provistos por diferentes organizaciones para crear soluciones de valor añadido no siempre es equivalente open de eta. Aunque su manifestación más común es tener la Open de eta y se apoya, pues en estándares enfoques tradicionales de la uer y de las webs se mantenga como la psoriasis. Como el lenguaje agradece Sparks y entre sus muchas múltiples ventajas inédita, integración con sistemas antiguos, delegado negro, así permite la interoperabilidad semántica y da lugar a la creatividad, a la innovación, aquí tenéis referencias a a básicamente al trabajo que he utilizado o las hace a los documentos que utilizado para generar esta presentación concretamente admito clonado una parte importante de esta presentación que está enlazada, y eso es todo lo que quería contar de momento. Ahora, el turno de preguntas o consultas. Qué pasa Maite? Que no se puede acceder al enlace compartido? Mal. La. Vale, vale, si hay esto, es un todo si se podía decir, pero que algunos hayan podido hacer. Queréis hacer alguna consulta. Podéis hablar también de no es obligatorio que lo hagáis por horchata josefa. Tiene un problema con el micro y no puede, aunque quisiera hacer consultas. Bueno, pues ahora supuestamente mi colega Esteban va a tomar el control. Vamos a ver si se incorpora. Voy a consultarle. Cómodo se conecte. Le voy a ceder el rol de moderador y es que ese es su buena compañía. Quizás alguno de vosotros se va a conectar luego la sesión de de Haika y de arriesgarse a. Voy a hablar con Jiménez. Ahora que me dice. Se merece que le espere un minuto. Mientras tanto, si quieres preguntarle algo, adelante. En principio todo. Claro, hasta el momento ya todo esto está siendo algo muy novedoso, por lo menos por mi parte, pero la verdad es que no lo hace sencillo, dentro de toda la complejidad que tiene este tema. Claro, me alegro que aparecido su tema, voy a darle permisos a Esteban. Gracias. Tengo que a no disculpas a Jesús sin querer disculpas Jesús tras hacerme hacer respirador. Yo ahora decir si puedes hacer un esperado, por favor, vale, como sería la grabación, la pararla. Bueno, yo yo voy a parar la grabación, no, yo tampoco puedo. Era los llamados a las personas, no tiene que haber un momento, que es que estoy viendo la pantalla, a ver si soy, sí sí la está salvando en la nube Diego, sino porque es un poco problema de grabar el disco duro. Pero bueno, vale, pues si continúa yo a recibir enlace continuo y han dejado buena compañía aquí con la mano. Gracias Diego Gracia, no. Bueno. Nada. Voy a compartir pantalla. Buenos días en Diego se ha hecho una presentación genérica de de lo que se trata, la relación con Open Data en la relación o la cómo surge el inquieto Penat a partir de la definición de una serie de estándares de la web semántica y cómo al final lo que se gusta llegamos es él ofrecer, digamos, la trastienda de las de las webs enlazadas, que serían los datos que soportan esas webs. Es decir, ahí hay un hay una frase de Tim Berners-Lee en un momento dado que dice. Dame los datos o algo así. Entonces él lo que busca el momento del Open Data, es ofrecer los datos o datos de interés, datos que están tras la información que se publican, las las diferentes webs para los usuarios en general y también para máquinas. Vamos a ver ahora en esta presentación un poco el enfoque dirigido hacia Asia. Bueno, vamos a ver, estos dos asuntos está en primer lugar, pues bueno, al proyecto Hércules, qué relación tiene el espacio con el Open Data y qué tipos de lazos externos tenemos y que supone tener estos datos? . 979 01:08:05,020 --> 01:08:06,980 El proyecto de Hércules, Si recordáis, la la presentación general que hicimos ayer a la mañana era un es un sistema, sea ésta, está basado en la creación del Sistema de Gestión de investigación que va a exponer, tiene como soporte datos abiertos, semánticos, para ofrecer una visión global de los datos de la investigación del sistema universitario español. La idea es mejorar la gestión, análisis las posibles sinergias y que hay entre entre las universidades y el gran público. En particular entre las intensidades y la empresa ha subrayado sí sí ha subrayado, en rojo el tema de datos abiertos se mantiene, es decir, desde el desde el primer lugar desde el primer momento Hércules es un proyecto que tiene la apertura de los datos la apertura de los datos no de cualquier manera sino de una manera se mantiene. Entonces esto es, es un, es un punto de partida para el proyecto y es un criterio de de realización del proyecto. El proyecto tiene que ser capaz de suministrar este tipo de información. Los dos pilares que tiene el proyecto, que lo estructura sería, por una parte, la construcción de un prototipo de sistema gestión de la investigación que se pero otra parte está la arquitectura se mantiene también lo subrayado, es decir, son los dos puntos de arquitecturas. La arquitectura se mantiene, lo que va a permitir la expresión de los datos abiertos, semánticos acuerdo. El proyecto, como ya dijimos, se divide entre sus proyectos, tenemos acción, tenemos ese eje y tenemos ha sido la arquitectura, la arquitectura semántica infraestructura antológica de los datos del sistema universal español en ese sistema de gestión y el esma, que es el que son. Los dos proyectos que están comenzando ahora son los que van a enriquecer los datos; a partir de internet iban a desarrollar métodos para permitir análisis. Entonces aquí de nuevo, desde el primer momento, desde el primer momento que se plantearon estos proyectos, tenemos el tema de la arquitectura semántica la infraestructura antológica, es decir, la manera de definir los datos con estándares de la web semántica y enriquecerlo a partir de internet. Son datos a partir de internet, es decir, no enriquece con otra cosa, sino con datos. En cuanto a la definición de ocio, era el desarrollo de una plataforma incidente para almacenar, gestionar y publicar los datos del sng, y esto es importante publicar sería el punto de partida de nuevo desde el diseño, que tiene que ser capaz de publicar datos de la sgae basándose en las estructuras. Esto implica que se van a publicar de una determinada manera, ese será el prototipo innovador, sistema de gestión de la investigación y el esma. Consiste en identificar, extraer y analizar y evaluar conjuntos de datos relevantes. Esto se completa partidos, se completa con datos obtenidos de información de fuentes externas, de datos nuevos, de datos enlazados, es decir, con datos externos. Esto es lo que comentábamos el otro día también en la reunión que comunicación hay entre los proyectos Segi y mandada. Ha sido consolidar datos el nuevo central unifica datos, es más explota los datos y, es más, se conecta con ese eje, y esto es lo que dijimos. Entonces. Hubo dos cosas que no dijimos expresamente, que son estas, que ha sido publicar datos abiertos y enlazados, es decir, la esa, esos datos que quedan ahí no solamente quedan ahí almacenados guardados en una caja, sino que se publican, tienen que publicarse de manera abierta y enlazada, y no central, pública datos abiertos y enlazados del sistema universitario español. Es decir, tenemos el sistema este que esto es la comunicación, digamos, las cosas que hace de cierta manera interna. Pero las cosas que hacía fuera entre las cosas que hacían fuera, los dos socios publican datos hacia fuera. Qué quiere decir, que tanto Hércules Asia Central como cada uno de las universidades son servidores el que trata de datos? Había este simbólico que veis aquí lo si lo hubiesen una página de una página por ahí; no con estos colores puede ser con otros, pero en general lo que quiere decir es que de alguna manera permite acceder a datos enlazados, o bien porque hay una descarga o porque los datos enlazados están incrustados. Algo tiene, que quiere decir que esa página permite enlazar datos a máquinas. Estos datos siempre, aunque pueden tener una visión para personas y de hecho suelen tener el objetivo principal, es que se pueda reutilizar, que se puedan reutilizar desde otros programas; es decir, que haya máquinas máquinas en sentido no físico sino lógico; que puedan reutilizar la información; hablábamos de limpieza ayer y decíamos que la rapidez en la publicación de los datos abiertos es un factor de innovación, pero si es incómodo utilizarlo estos frenos. Entonces qué posibles problemas podemos tener al usar datos abiertos según cómo estén hechos? El primer problema es cómo se obtienen. Hay que descargar un fichero, hay una pie; el segundo sería el modelo. Seat. Qué modelo de datos está expuesto es cerrado, es abierto ese estándar expresivos extensible luego la relación, es decir, se pueden los los datos a es posible acceder a datos y hacer relaciones entre ellos o te lo tienes que descargar y luego tuvieras que relaciones acceso está enlazado con fuentes externas o no? . 1096 01:14:07,520 --> 01:14:08,480 Esa es decir, no más que se actualiza, hable quién es el responsable de actualizar el propietario de los datos y cómo se difunden. Entonces decíamos que en el caso del Open Data la obtención de los datos es mediante una pie. El modelo se ha abierto, es público, es estándar, expresivo y extensible se accede a consultas de tipos parques como las que vimos ayer previamente; se enlaza con fuentes externas que íbamos a verlo un poco más en detalle. La actualización es mediante una piensa el usuario que reutiliza los datos. Se conecta a una pie que siempre están actualizados mejor. Se conecta a una pie que ofrece datos que siempre están actualizados, porque la responsabilidad es del propietario de los datos, sino que lo utiliza y los datos se difunden vía web de una manera activa. Es decir, que el Open Data es el mejor medio para publicar datos abiertos, que esa publicación de datos abiertos es un requisito de partida, ya no solo de ha sido sino de los culés en conjunto. Otro asunto que comentábamos ayer respecto a los datos es que los los datos, y esto también es un requerimiento tienen que ser fer, que significa que tienen que ser encontrarles accesibles, interoperable, sí reutilizables- como dijimos ayer. Ser también significa Pues justo bueno, a los estos principios, fer proporcionan una serie de directrices para publicar los datos de una manera correcta. Que permita la reutilización en mayor grado posible sean interoperable; es decir, que sean qué puedan ser reutilizados fundamentalmente por otras máquinas -para mezclarlos combinarlos, explotarlos hacer representaciones gráficas para lo que sea los principios de estos datos. Los principios se refieren tanto a datos metadatos como infraestructura, y de nuevo tenemos que los datos abiertos y enlazados es el mejor medio para hacer cerca. Entonces, tenemos dos requisitos, que los datos tienen que ser abiertos y se tienen que publicar, y además, que tienen que ser entonces la manera de hacerlo como limpieza. La arquitectura se mantiene, vimos que teníamos ya un componente que era el inquieta, Taseer ver este es el componente que permite la publicación de los datos que están en el almacenamiento que vivimos ayer. El textos como datos abiertos y enlazados el servicio tiene estas características, proporciona una interfaz html, porque es bueno digamos es esto es una cortesía hacia las personas, aunque el objetivo del servicio principal tiene que ser la reutilización, la reutilización, por parte de máquinas proporcionar los datos en formato PDF es lo que sirve para que una máquina pueda utilizarlo cumple una recomendación del estándar. Luego nos lo explicará esto, Álvaro un poco más en detalle en la siguiente sesión, y cuenta con un servicio que permite localizar entidades por el nombre. Este sería el interfaz para personas en interfaz para datos. Son los los datos brutos en el formato rnc, modelado por la antología. También teníamos un que permitía interrogar el gestor. Esta es la manera complementaria, digamos para la utilización, y es importante esto sea, digamos que el Parque del Buen permite, a autores y administradores consultar los datos del brazo de conocimiento almacenados en el gestor gestor de la entidad y en otros esto es importante. Es decir, a la hora de reutilizar. Si los datos están lanzados Podemos en la sala, entre repositorios y recuperar información de sitios distintos a la vez y mezclarlos en una misma aplicación. El rdc sorprendentemente esto bueno ya lo vimos ayer insisto más es El componente de la arquitectura que almacena El brazo de conocimiento en El servidor de ese servidor. Pero sí que voy a destacar que proporciona el servicio de datos y consultas a quien quiera hacer ver. Si eso les parque pueden que son las maneras de reutilizarlo. Teníamos un componente que lo citamos ayer brevemente, que era. Hay un componente de la arquitectura, que es el que se encarga de hacer el descubrimiento. Sobre los datos que vienen de este descubrimiento. Tenemos tres fases. La primera tenemos la reconciliación entonces, la reconciliación, y esto es lo que vimos ayer hay un paso en el que utilizamos datos obtenidos en el descubrimiento de enlaces. Utilizamos. Los datos abiertos que hemos obtenido, el descubrimiento enriquece, con las fuentes externas. La detección de equivalencias. Obtenemos los enlaces a entidades de otros no sé si es decir, este es el paso en el que o con el que conseguimos que los datos que están cargados en el cesto estén enlazados hacia fuentes externas de información de una manera más segura y automática. Entonces, vamos a entrenar ahora un poco ya en el detalle concreto de que se hacen. Ha sido lanzado con datos externos, tenemos. Aquí hay que distinguir entre dos tipos de las aduanas, la sala de datos o el enlazado. No es lo mismo hacer tener un link a una web; por ejemplo, en el proceso de descubrimiento Hércules ha sido obtienen la csa, fuentes externas, por ejemplo, la página de un investigador. En esta página voy a acceder. Es la página de Diego López de Ipiña, pero es una página, una página web. Esto es la web de tipo convencional. Sin embargo, sí si lo hacemos con datos. Es decir, si mediante un curro es un comando básico, hacemos una petición a esta web. Le aquí lo que vamos a obtener son. No, no es no es la vista, sino la vista de los datos. Voy a hacerlo un momento. Es decir, si hacemos esta petición. Lo que vamos a obtener no no son, no es el html, sino son unos datos que podemos reutilizar. Esto era bueno, se hace aquí; está haciéndose mediante. Esto entonces lo que ha devuelto aquí pues es son datos datos en qué formato pues en formato XML en el que se lo he pedido aquí. Esto tiene otros formatos de datos que puedan reutilizar en este caso. Bueno, en todos los ejemplos que voy a poner voy a intentar pedir este. Entonces. Digamos que hay una diferencia entre el azar con una web que sirve para una persona, es decir, yo puedo presentarle al usuario un enlace o una ficha, que está en la web de la universidad y ponerle un enlace y decir. Este investigador tiene esta página en esta otra web, eso es el enlazado de la uefa, way web convencional y otra cosa es que hacemos datos con datos, es decir, que el triple o los triples que están en el receptor, definiendo a un investigador tienen un triple, que lo enlaza con los datos rdc, que están en otro. Almacenamiento externo externo, pero no externo la universidad, sino externa del país e incluso que está en Internet y que permite obtener información, que se pueda reutilizar. Entonces, el proceso de descubrimiento, el primer paso que tenemos, el primer enlazado que hay es con y con otros nuevos ha sido ustedes. Este proceso de descubrimiento que hemos comentado antes incluye el enlazado de datos con el nuevo unidad y, por tanto, con otras universidades, es decir, tenemos que vamos a cargar en la Universidad de Murcia, vamos a cargar un triple que va a decir que el investigador con este. Con este identificador es el mismo que un identificador que este, otro, que este otro, que está en el lodo unidad en Reino Unido. Tenemos un triple que dice que este investigador es el mismo que un investigador que está en otro texto diferente, es decir, esto que nos permitiría hacer una aplicación en la que yo mostrase información una aplicación estuviera en Murcia y la que se muestra esa información obtenida desde el gestor de la Universidad de Deusto, automáticamente y con cierta rapidez, porque el dato está directamente directamente accesible, se puede ir navegando entre enlaces y llevará al candidato a ese dato final bale. Entonces tendremos unidad un conjunto de de triples de este estilo, pues tantos como tantos como universidades. Tengan a este profesor entre sus propios datos, es decir, que es lo que va a pasar, que cada universidad se va a cargar una publicación. Imaginemos que hay una publicación, hecha por cinco profesores, cada uno de cinco universidades distintas. Esa publicación estará en cada uno de los aseos, en cada uno de los aseos. Instalan los cinco investigadores, uno de ellos con más datos el que corresponde a la universidad, pero el resto estarán. También tienen que estar como entidades, cada uno de esos de esos cinco a su vez estarán enlazados con unidad, que será donde estén los enlaces a todos ellos, y de esa manera, pues se podría ir navegando por el contenido de un investigador, en cada universidad. Otro dato tenemos con qué otros datos lanzamos con Ortiz, porque dice. Es un sistema de vuelos no sé si conocéis. Es un repositorio que de de contenido científico, que básicamente hace 2, dos cosas tiene proporcionado un identificador único y persistente, acaba investigador único en todo el mundo y recoge información de su producción científica. Entonces una cosa que hace es ofrecer sus datos. Esos datos que hemos visto antes, que tienen una, una, una presentación teme que se está aquí la que estaba haciendo la de Diego tiene una vista en formato. Es decir, podemos acceder a los datos de este investigador, los datos que han ocasionado esta presentación web. En realidad a los datos que están detrás de la web. El tipo de petición que acepta pues es su un gueto, este sea en este caso, digamos, estamos pidiendo la misma hora, pero con un pidiéndole, en este formato y lo que vamos a obtener, es un XML, pues con la información, con toda la información de este usuario. El siguiente que tenemos con el que lanzamos sería de Dembélé es una, es un sitio web, un repositorio de parecidas, pero dedicado solamente a temas de de ti, de Tecnología de la Información, y la comunicación de aquí es un poco diferente. No tenemos así como en aquí teníamos, llevamos, la es la misma. Uri la misma web en la que devuelve html o redes en función de la petición. En el caso de lo que hacen es poner un enlace, poner un punto redes después, es decir, si yo copió. Este enlace, lo que ha hecho es descargar Mel rdc. Pero sí puedo culpables y no puedo copiarla. Este mismo lo devuelves la página de Diego López de Ipiña. Aquí tenemos volviendo a la presentación. Tenemos un punto. Tenemos un asunto similar que, bueno, pues según lo que se pida, da la boda. El tesoro de la Unesco, el de la Unesco, es es bueno no decirlo gracias a una lista, tienen un origen bastante antiguos, del año 70 luego creo está actualizada, pero es una lista controlada, estructural de determinados de tipo temático. Entonces, lo que establece es el tesoro de la unesco. Esto queda aquí digamos, tiene una serie de términos que permiten sistematizar el conocimiento. Hay un proyecto de la Universidad de Murcia, además, que ha transformado el tesoro de la Unesco en una estructura de propias webs. Se mantiene formato, es este proyecto de aquí no sé si lo conocía, eso no. Entonces, bueno, esto tiene una presentación jerárquica que se puede navegar, y esto sí. Esto que vemos aquí es la representación de esta categoría, de la clasificación de esta categoría, del y tenemos aquí el acceso al rbs de esta categoría. Es decir, de nuevo podemos enlazar con datos de qué supone esto que digamos que si alguien tira, digamos que si alguien que conozca el tesoro un un podría desde fuera leer directamente o conectarse directamente aquellos recursos en el gestor de ocio que correspondan con esa categoría e incluso a sus categorías padres, porque esto está en ese formato que permite hacer ese tipo de inferencias hacia arriba. El siguiente enlace que tenemos es con la Oficina Europea de Patentes, la Oficina Europea de Patentes tiene un proyecto de ley que data, que que recoge todas las patentes europeas estaba actualizado al día. La verdad es que está bastante bien, pues aquí se pueden consultar tanto las tanto las patentes como las especificaciones, es decir, todas las entidades que manejan de patentes y de clasificaciones son, se pueden, se pueden consultar en esta web, pide nuevo, tenemos tanto la parte de The, digamos, la parte visual. Como veis, esto es bastante parecido a esa representación que tenemos nosotros en nuestro que luego se explicará Álvaro y yo con más detalle. Esta es la la presentación digamos, de los datos un poco brutos para usuarios no dejan de ser una es una presentación bastante austera, pero tenemos datos que nos podemos descargar. Es decir, tenemos datos, podemos consumir los datos de links Open Data que están en ese formato. Los pueblos nos podemos consumir a través de estas que conseguimos con esto, que una patente que estuviera cargada de Inaxio estaría enlazada a su página web, a sus datos, sus datos y a su página web. En la Oficina Europea de Patentes y por tanto, desde ahí se podría ser, por ejemplo, una aplicación que consultara todos estos datos. Es decir, no haría falta tener estos datos cargados, nació sino que los datos se podrían mostrar a través de estos enlaces. Como decía, esa era la la vista para personas y esta es la misma vista. Para máquinas las máquinas tienen acceso a los datos y bueno, dentro de estos datos hay enlaces a otros datos a su vez. Es decir, los datos enlazados no son solamente datos enlazados hacia fuera, sino también hacia dentro, estarán enlazados entre sí con cada uno con su propio modelo. En el caso de la Oficina Europea de Patentes con el suyo, lógico para patentes en el caso de. Ha sido con el modelo antológico de la red de antologías Hércules. Volvemos un poco a lo que decíamos antes, no el la descripción que hemos hecho de de los de los tres grandes proyectos Hércules. No hay un tercer proyecto, que se esma, es que lo que hace o lo que va a hacer básicamente es enriquecimiento de datos, y eso es la de. A partir de internet y desarrollo de métodos de análisis, que es la de Mila, pero métodos de análisis se entonces es importante, esto sea una parte muy importante, es que completa los datos a partir de la información de fuentes de datos externas, fuente de datos externas entre las fuentes de datos en general ha abierto si está ahí desde Internet. Entonces esto ya es un poco lo que lo que viene en los siguientes proyectos, pero que viene gracias a. Que a que así está desarrollado de una determinada manera, porque ha sido el soporte de todo esto, ese modelo antológico es el que permite hacer estas explotaciones y estas incorporaciones de datos hasta entonces qué datos vamos a tener o vamos a incorporar. Por una parte, vamos a tener datos de estos, son datos de carácter general, que están de carácter enciclopédico, que están extraídos de la Wikipedia. Son dos proyectos distintos, debe, pedía, es un proyecto más con intervención, más humana está un poco más mecanizado. Vamos a verlos de momento. Bale esta sería la página de Murcia, el municipio, porque la provincia va a tener otro. Entonces es el tipo de entidad y además estos son datos. El tipo de datos que te puedes encontrar en. Es que qué tipos de enlazados hay que tener? Pues bueno que si saber este es un poco de tipo trivial, pero si hay alguien que pone que que hay algún dato que está posicionado en Murcia. Si de Murcia ciudad no te hace falta tampoco tener todos los datos de Murcia directamente en tu sistema, sino que pueden recurrir a los datos que están aquí detrás y mostrar información contextual de algún tipo del tipo que te interese, por ejemplo. Pues si disculpa, está por ejemplo lo que comentábamos el otro día de la del posicionamiento. Bueno, esto es, por ejemplo, cuál sería la las temperaturas. Creo que son tío, las temperaturas medias por mes, un día. Si tengo algún dato. Por ejemplo, si se quisiera hacer una aplicación, como comentábamos ayer, de posicionamiento, estos datos se pueden recuperar desde aquí y con esos datos te podrías pintar ya, pues por ejemplo un mapa sin tener esos datos, tu directamente en tu sistema es bueno pero como digo, es de carácter enciclopédico. No sé si miramos por aquí pues bueno. Personajes famosos de Murcia, Rafael Moneo, es murciano. Algunas relación bien en este sería el caso de Grecia. Si nos vamos a ir nota. Vemos una presentación, es un poco distinto, pero bueno, tenemos una cosa parecida. Aquí esto es una representación muy austera, de los datos que en realidad están detrás de un teléfono tenemos estos dos proyectos que son de tipo de tipo general. Tenemos otro, por ejemplo, meses de términos en el ámbito de la medicina, es decir, vamos a enlazar con los resultados de investigación con términos estandarizados que están en una antología; disculpas, que se mes. En este caso, es una puntilla. Estoy contento, he puesto. Esto sería un es un diccionario de términos determinados médicos, por ejemplo. Pues. Esto sería un término médico, con el que el azar y una manera de esa ambigüedad de nuevo te puedes conectar con datos. Tenemos el cese o que son aparecido para. Temas de computación e informática. Tenemos la bne, los datos de la Biblioteca Nacional, en el que tenemos tanto podemos acceder tanto a tantos libros o publicaciones de tipo, también científico-técnico, que hay bastantes que tienen que ver con ámbitos que ya no son tan tecnológicos, que pueden estar más en el ámbito de la sociología, el derecho o similar, y tenemos es bueno estos datos que son de de sexo tanto de publicaciones como de temas. Qué más que más vamos a tener! Vamos a tener un diccionario médico que se meterá de terminología médica. Vamos a tener la terminología clínica integral, que también es una normalización de nombres para medicamentos, y esos puntos suspensivos que dice que vamos a tener más porque, bueno, pues porque va a haber más. Entonces, bueno, esto desde el punto de vista de sistemas vamos a verlo luego en la presentación que va a hacer Álvaro. El asunto es que esto supone un un estrés añadido para los sitios que ofrecen datos. Es decir, ya no es solamente una web que ofrece un html para ser consumido por las personas, sino que ofrece unos datos bueno del html también hay veces que es consumido por las, por las máquinas, porque llegan a indexar, no, pero, pero en el caso de que se ofrezcan datos ya es algo específico, está sufriendo datos directamente, y eso supone un estrés añadido a los sistemas que tienen que conocer, y ese estrés añadido puede venir, además de sitios muy diversos. Pueden ser tanto de gente que estén deseando esta información a saber para qué o de gente que realmente ha enlazado estos datos con los suyos, y eso está provocando una serie de consultas que te van a exigir más a los sistemas que lo que sería una web convencional. Entonces, según vaya creciendo. Esto lo esperable es que ese tipo de tráfico vaya siendo mayor. Entonces es es algo que creo que tenéis que conocer desde el punto de vista de sistemas para pensar, plantear bueno, en función del tipo de cosas que yo estáis haciendo en otros sitios que tenéis que hacer para proteger estos sistemas o para monitorizar estos sistemas y que el uso sea el que nosotros consideramos que tiene que ser y no el que un bote chino ruso, desde donde sea, pues piense que tiene que ser. Entonces con esto acabamos la presentación que era, que creo que era, era un poco el conjunto de Diego y la mía se quedó corta. Entonces, bueno, lo que queríamos era eso que era importante, que conociera esta faceta del proyecto, porque porque bueno, igual no nos afecta directamente en cuanto a uso, pero si afecta en cuanto a sistema, si tienes que saber por qué es decir, va a haber datos, legítimos, saber usos, legítimos, usos no tan legítimos, pero uno de los hechos previstos que tiene ha sido el que la gente se pueda hacer con los datos de Asia y tenéis que estar, tenéis que conocerlo y tener las medidas oportunas de monitorización y de control. Vale? Tienes alguna pregunta. Yo, en principio no van a su compañero, tendrán algo que preguntar por ahí. Se escuchan, se ha escuchado. Qué os parece este asunto? Pensáis que os podéis ver afectados, que nos podéis ver afectados, que es algo de lo que preocuparse igual, no a corto plazo, pero a medio plazo sí que es algo que tenéis que conocer. Creo se van conociendo toda la temática de la punta, que al final se puede, en un momento dado. Sabe por dónde puede venir, mayo, cómo puede ir mejorando la cosa, teniendo un conocimiento global, que no todo boca a la persona de una cosa, sólo teniendo conocimiento global de todo esto, sí creo que, como he dicho, creo que es importante que supiera, y eso, que esta otra faceta del proyecto ha sido que no es. Tiene como tiene 3, no obtiene 2, una de ellas que se viviendas no tiene, por una parte, la lo que sería cargar datos, y se que esa parte nuclear importante, luego tiene una parte que es de publicación de esos datos, y esa parte tiene 2. Una es que es una web convencional en la que los datos se pueden consumir por personas, pero luego tiene esa otra parte. Es que los datos se pueden consumir por máquinas y potencialmente puede ser una explotación que tenga cierta importancia, sobre todo igual no tanto por por usos legítimos, sino por gente que haga cosas raras que se pone a indexar, porque sí o que entonces él, el que se países o que tiene esa naturaleza. Creo que sea una cosa fundamental para no tener sorpresas. Luego. Sí luego, aparte, bueno, como cultura en general está bien. No todo van a ser cómodo, como decía un profesor que tenía yo no todo van a hacer pan galletas también en la informática y otras cosas. Pues si queréis, si no tenéis ninguna duda, a ver, teníamos la siguiente sesión con Álvaro ya la tenemos prevista a las 11 cuarto. Si queréis, hacemos una pausa y seguimos a las 11 cuarto por mi parte. Vale, vale, pues voy a parar la grabación. Momento.

Propietarios

Proyecto Hércules

Comentarios

Nuevo comentario

Serie: Formación miércoles 10 de febrero ASIO Gnoss (+información)

Descripción

Videos