Idioma: Español
Fecha: Subida: 2021-02-22T00:00:00+01:00
Duración: 1h 11m
Lugar: Curso
Visitas: 987 visitas

20210201 2-ROH 1ª Parte

Transcripción (generada automáticamente)

Buenos días a todos. Soy de la honestidad de Deusto presenta un grupo de investigación, y este proyecto hemos trabajado bajo la ute de Deusto, donde nos hemos encargado de hacer el diseño de la fiesta. Bien. Entonces, bueno, esto es un poco lo que lo. En primer lugar, voy a hacer una introducción, cinta a lo que es la voz de los datos y la segunda parte después del descanso, pues básicamente me voy a entrar en lo que es la descripción exhaustiva de la esa Hércules. Empezaremos, por tanto, viendo en qué se diferencia la voz de los documentos a la que estamos habituada. Con la buena con la que soñamos es la web de los datos. Básicamente queremos poder conectar con fastos y poder navegar por ellos para extraer información de sus datos; una manera mucho mejor, tal como precisa las máquinas y que no gozan del intelecto, del juego famoso, los humanos, y lo bueno haré una descripción sucinta de la semántica de que son asunto y veremos pues bueno algunos casos de uso o sistemas de información que han adoptado la semántica, pues con bastante éxito y lo que es el enfoque de exponerlas de manera en la zona. En la segunda parte, y además concreta, aún daremos en lo que es el diseño de la Hércules o tantos explicar el proceso, los diferentes pasos que hemos seguido, la generación de esta antología. Luego veremos más en detalle, pues las entidades fundamental en las relaciones entre ellas las restricciones que hemos ido etc y finalmente simplemente abriendo boca indicando cuál es el proceso que hemos instaurado para poder hacer el mantenimiento. Esto será objeto de discusión en otro curso más sana. Bien, pues, en primer lugar, para vivir un poco de contexto, la cual ya surgió hace tres décadas. En primer lugar, hablábamos de lo que se denomina como como punto 0, donde básicamente la madre tenía un comportamiento como librería podíamos consultar extrae información, y los mortales, la gente general solamente, pues no podían contribuir o cambiar la información. Solamente las organizaciones que publicaba sus miradas web aquellas que tenían potestad para introducir contenidos la uefa punto cero bueno ya tiene también su edad entre dos décadas y una década y media, y básicamente este enfoque, cual la web es una plataforma de entrada y salida de información, no solamente consumimos, sino que también podemos actuar. Como y generar datos, por eso este concepto de webs social colaborativa donde podemos contribuir con nuestras fotos, con sus comentarios, etc. Además, muchas veces damos dos puntos, pero también tiene la excepción de que es una web que ofrece a PiS, que permiten a terceros ensamblar aplicaciones integrando. Las funcionalidades ofrecidas a través de diversas a piso o penaltis, como se entienden en tecnología, y finalmente llevamos a la vuelta al punto cero aquí cómo vais a ver? Pues ahí diferentes visiones. La tradicional es que la la es aquella que debería permitirnos conectar información. Debería ser una web más inteligente, más accesible no solamente a los seres humanos sino también a las máquinas. Valen y es una vez más inteligente, pues, por qué? Porque, aprovechándose del conocimiento que tienen de nuestras preferencias en nuestros hábitos de incluso algunos datos personales, o se nos pueden ofrecer de manera continuada, servicios adaptados, personalizados a nuestras necesidades. Eso es la visión tradicional del buen punto cero que bueno pues está también suscitando lanzando ciertas alertas, porque no todo el mundo está de acuerdo en que a cambio de tener una mayor personalización a cambio de tener una mejor experiencia de usuario tengamos que aportar o leer parte algunos ejemplos stereo típicos de que sería la otra, es junto a cero pues ésta está personificada por estos asistentes personales que nos conocen y pueden acceder como nuestros. Hay información de internet para que para devolvernos respuestas y la grada y se les ocurre en muchos nombres, ya hoy en día utilizamos de estos tipos de asistentes, estamos hablando de Cortana microsoft, está salvando la laxa de Amazon, estamos hablando de un lado, queda por decir y al fin y al cabo lo que han hecho es reemplazar el motor de búsqueda por un motor de preguntas y respuestas. Esto es lo que hacen los asistentes personales y para poder ofrecer respuestas elaboradas, necesitan que detrás haya información adecuadamente anotados, que es en definitiva un poquito lo que estamos intentando hacer en este proyecto, creando un grapo de conocimiento alrededor del mundo. A Cádiz cada usuario dispondrá de un único perfil de internet basada en la historia de navegación del usuario y cómo se consigue esa personalización, con la creación paulatina e incremental de tal perfil? De tal manera, por ejemplo, si los usuarios realizan la misma búsqueda los resultados serán diferentes. Por qué esos usuarios tendrán diferente perfil? Diferente. Está diseñada para aprobar los fallos experiencias barricas irrelevantes muchos bloques funcionales son ofrecidos a través de lo que se denomina opina, gracias a los avances actuales, es posible crear más apps o aplicaciones que básicamente usan funcionalidad de terceros a través de esa saga, y además tenemos interfaces cada vez más amigables, progresivas, etc, que permiten desde cualquier dispositivo no solo o dispositivos con pantalla, sino incluso utilizando audio pues poder interaccionar con estos grasos de conocimiento yacen y que permiten ofrecer esta gran experiencia, el darte la impresión de que Estás interactuando con la gente. Es inteligentes en Está. Este es un gráfico que tiene sus años y que básicamente hacía un pronóstico. decía. Donde Estábamos y hacia dónde íbamos esos pronósticos más o menos se han cumplido. Como podéis ver la revolución de la informática? Pues empezó a finales de los 70 cuando llegaron los peces y, sobre todo un gran espaldarazo generado por el descubrimiento, por la creación de la uer Ortín en 1989. En ese periodo se crearon todas las tecnologías, el agua. Y cómo vais? Pues hasta entonces como organizamos la información bueno, empezamos con más datos y luego teníamos fichero si carpeta no teníamos directorios entonces surgieron lo que se denomina como como la búsqueda basada en palabras clave, aparecieron los primeros buscadores tipo AltaVista, que eran capaces de indexar contenidos en esas páginas web, queríamos llegar más allá entonces, para llegar más allá, pues permitimos en un primer lugar, crear taxi, donde los usuarios, también pudieran contribuir a la creación de la taxonomía y a empezar a aparecer mecanismos buscadores más avanzados que no solamente devolviera a las páginas donde había mayor número de coincidencias con las palabras claves que introducía, sino que iba más allá intentaban interpretar lo que habéis escrito, buscaba sinónimos e intentaban también entender qué es lo que había buscado antes y en base a ello, pues cada vez respuestas más elaboradas, no dejar esta quimera de los agentes inteligentes. Si algo tiene que decir la web semántica, que es básicamente la tecnología base sobre la cual hemos desarrollado la automoción. Antes de adentrarnos la semántica solamente quiero hacer un inciso, diciendo que algunos no coinciden con esta visión de que la web 0. Es. La web más inteligente, basada esencialmente en los principios de la oms semántica, sino para muchos, es una visión actual a la cual también colabora Tim creador de la web, la, la siguiente evolución del aval de la web descentralizada, la cual todos tenemos un mayor control de los datos. Los datos nos han servido siempre desde este punto centralizados. Esta visión Está siendo posible con la irrupción de algunas tecnologías disruptivas, como por ejemplo, las el no hizo, pero hoy estamos aquí para hablar de semántica, de rasgos de conocimiento, y por qué tenemos que dar una falta de conocimiento, porque queremos organizar la información de tal manera que proceso software agentes puedan explotarlos entonces cómo definimos un brazo de conocimiento con el conocimiento? Lo que hace es adquirir información en un vocabulario, odontología, y lo que suele hacer es aplicar razonamiento para generar nuevo conocimiento. Esto es lo que diferencia a los grupos de conocimiento, basados en la web semántica de lo que es una base de datos tradicional. Que lo que lo que aporta la semántica es que permite que se hiciera conocimiento, se genere nuevo conocimiento a partir del que Está explicitado en forma del triplete. Como veremos más adelante, de sentencias que relacionan a los sujetos a través de una relación con un predicador conocen bien que consisten en que consiste. En cuanto a los ingredientes fundamentales del conocimiento, suelen tener una descripción formal de cierto área de conocimiento que puede ser accedido y razonada por los ordenadores, pues básicamente, por ejemplo, si estamos modelando el dominio del vino tendremos un vocabulario que es capaz de modelar, pues los diferentes entidades tienen que ver con el vino subas las bodegas las cubas etc etc y las relaciones que pueden generarse entre formalizar organizar ese conocimiento para que luego los agentes que antes mencionaba los que aparecen aquí si Cortana o él no puedan hacer consultas a les de la justicia, extraer el conocimiento que necesitan para preparar buenas respuestas a los usuarios final, los trabajos de conocimiento que representan dentro son entidades, relaciones y hechos alrededor de tales entidades. Por ejemplo, este es un carajo de conocimiento famoso y mdb permite recoge información sobre actores directores productores escritores de sketches de autores de escribir películas y lo hace de un modelo a través de un modelo semántico crea un vocabulario ordenado para representar esos datos y la información. Pues bueno, es accediendo bien; entonces Estábamos viendo cuáles eran las partes de su vocabulario necesitábamos instancia ese vocabulario y luego esa manera ahora podremos formular preguntas para interrogar se zafó de conocimiento, y corre el accionar, los la información que existe en tales grados y además algo fundamental y muy interesante que luego abordaremos muy rápidamente, será el hecho de que estos grupos de conocimiento se pueden conectar unos con otros. Esos son los principios, el principio que subyace detrás del de eta. Por tanto, puedes generar tus conjuntas que tus vayan a diferentes grupos de conocimiento y luego puedes fusionar esos datos usando un lenguaje declarativo cómodo, como es el desmarque. El Google se cuele de la semana, ha habido gente que no estrictamente al amor semántica han creado ya párrafos de conocimiento destacados como estoy yo hago que eta y luego exploraremos muy brevemente estos dos grupos de conocimiento fundamental. Actualmente, uno lo que hace es básicamente extrae de la Wikipedia la información estructurada encontrado a las páginas, y crea una antología para poder modelar el contenido representado en tales páginas y que data que es un grifo de conocimiento que Está creado continuadamente y contribuido al continuadamente por los usuarios. Bien, y todo es lo de conocimiento pues adquirió cierta notoriedad cuando en 2012, como una de sus mejoras para avanzar en la transformación de su buscador Google en un buscador lo quiere transformar en un motor de preguntas y respuestas elaboradas, pues ellos anunciaron que tenían una base de conocimiento y estaban utilizando para mejorar los resultados. Esta base de conocimiento no es capaz de modelar todas las entidades y dominios que nos podamos imaginar, pero lo que hicieron es con algunas entidades ampliamente consultadas, de tal manera que fueron capaces de ofrecer información estructurada y detallada acerca de ciertos temas, y para conseguir crear tal inicia lo que hicieron fue integrar datos ya existentes en la web, como aquellos que habían sido creadas, por una base de datos que ellos adquirieron, o aquellos que la comunidad ha ido creando a través de la ue. Tal manera que cuando lanzaron su primer vuelo ya tenían 660.000.000 de objetos y más de 18.000 millones de sucesos modelados alrededor de Tabasco. Para acabar, esta teoría sobre grasos de conocimiento, resaltar esto, obviamente, un sistema de información basada en grasas, consistente, un vocabulario, Odontología, con un conjunto de instancias moderadas acordes con el vocabulario y de un Rafa Nador que es el que hace la magia. Es el que es capaz de inferir nuevos hechos a partir de aquellos que explícitamente han sido, declaró. Esto es un ejemplo de lo que hay detrás de un brazo del conocimiento. Por ejemplo, observamos que aquí se está moderando un dispositivo alfons, siete que normalmente se compra con unos cascos que, bueno, que permite datos en diferentes discos duros 128 gigas. Puede ser descrito como un smartphone comunismo antifaz; va, es que este dispositivo es producido por una empresa que se llama por qué está localizada en Estados Unidos. Como veis, un grapo de conocimiento te permite navegar por todos estos enlaces, para conocer en profundidad ciertas cosas de un producto o de cualquier entidad que queramos. Por tanto, acabamos esta introducción a la falta de conocimiento diciendo que los brazos del paciente son otra cosa que enciclopedias aroma. Esto ya lo han desarrollado dentro de Google, pero no hace tanto tú cuando buscabas ciertos conceptos comunes como, por ejemplo, es decir éste información sobre este cuadro lo que ha obtenido teníamos aquí un carrusel con datos relacionados como la Mona Lisa, otros cuadros del Madrid y además todavía hoy a menudo vemos este tipo de recuadros que aparecen en la parte derecha. Básicamente estas son las respuestas elaboradas que se ensamblan porque, aparte de hacer la búsqueda usando métodos un poquito más tradicionales, también hacen una consulta sobre su conocimiento, para intentar hilvanar una respuesta más elaborada. Y después de tanta introducirán de conocimiento vamos a ahondar un poquito en lo que es la web semántica por cierto, son terminó, viene con nosotros, vive con nosotros desde el 2001, e tiene nada más y nada menos que 20 años, y como se define, esta es la definición que dieron. Leí el creador también del agua. Se mantiene entre la web con estos dos coautores, cuando escribieron en América se identifica el primer artículo en el que hablaban de a ser eslabón semántica. Puede ser entendido como una extensión de la web actual en el cual la información a la información se le da un significado, de tal manera que los ordenadores y las personas pueden cooperar, pueden trabajar juntos, la oms, manteca creada, pues porque el agua es más tradicional en la web de documentos y vinculados que navegamos día a día. El significado no es fácilmente comprensible por mar, teníamos que hacer virguerías, tenemos que hacer, es procesar el contenido de las páginas para intentar entender qué están describiendo valen. Cuando lo que hacemos es queremos crear una. En paralelo a estas páginas paralelo queremos formalizar el conocimiento de tal manera que tanto navegadores como sobre todo el proceso, software, sean capaces de interpretar. Lo que hacemos semántica es. Creó un medio universal de intercambio de información, vale, añade significado comprensible a los ordenadores, usa técnicas inteligentes para poder explorar esta semántica, y veremos algunas de esas técnicas, no, pero sí veremos cómo se usan los motores de consultas. La misión fundamental de la web semántica no es otra que transformar las ingentes cantidades de información disponibles en forma de contenidos web que en contenidos, que sean más fácilmente procesales, por las. No lo he dicho. Lo hubieran hecho desde el principio, porque si en cualquier momento queréis interrumpir menos, tenéis más que activar el micrófono y pararme. Básicamente es la pila de tecnologías que hacen posible la voz. Se mantiene la semántica, es un complemento encima de lo normal. Por tanto, hace uso de Boris, como en la vuelta tradicional, hace uso de mecanismos para codificar la información; como yo también hacen uso de Kissimmee. También hacen uso, como veremos, de Harrison también hace uso sobre cómo se ve aquí del protocolo. Http. Es básicamente el motor de la. La base de que está compuesta por un lado, y tecnologías web de hipertexto tradicional, es que todos más o menos conocéis, pero aquí se merece una manera de modelar conocimiento, XML, skiman. Es una manera de crear vocabulario de establecer restricciones, de indicar qué entidades, en qué situaciones, bajo qué restricciones pueden ser utilizadas en un fichero de XML, compatible con este esquí vale, ya que los esquemas restringen la estructura de los documentos es una manera sencilla de crear vocabulario, es para mí r. Rdc también. Puede ser basado en XML y es un modelo de datos que hace referencia a objetos y sus relaciones, permite más allá de XML, pero bueno, esto al final es que es lo que hace. Representa gráficos de conocimiento, representar, tripleta como vamos a ver ahora, los ejemplos que siguen esas transparencias, y eso es lo que hace, rne te permite representar, y agradece skiman restringe en que situaciones como cuando se pueden crear esas tripletes son vocabulario, y otra vez que definen propiedades y clases de recursos, rdc, que luego puedes utilizar para distanciar, para crear triple como skiman, solamente defines relaciones jerárquicas y algunas restricciones básicas fue necesario. Crear otro lenguaje llamado que añade más restricciones, tiene más capacidades que realice, skiman, permite establecer restricciones de carril restricciones de como los valores o las propiedades de tales vocabulario se comporta, por ejemplo, es decir, que una propiedad es inversa de otra, es decir, que las propiedas y se basan esta. Este nuevo lenguaje, en la lógica descriptiva, vale, gracias a poder hacer uso de la lógica descriptiva, se permite la integración con razón, como motores que son capaces de, dados los hechos declarados en rdc, ser capaces de inferir otros nuevos hechos que no se han sido explícita, y la última tecnología muy relevante e importante, necesaria es parte. Básicamente es porque te permite consultar esos grasos que tú has creado usando rne. Entonces, vayamos ingrediente por ingrediente. Entonces agradecido Risoul permitir identificar conceptos como se identifica, un concepto que nombre tiene. Cada concierto. Cada concepto quiere una uvi. Bale es el que identifica unívoca a un concepto y dado ese puntero a ese modo luego podemos describir ese modo con un conjunto de propiedades de enlaces que permiten asociarnos con otros recursos o a veces con valores, con datos fina. Entonces con lo que definimos son tripletes, tenemos un recurso o una entidad, un concepto el cual queremos hablar, por ejemplo, esta es la obra y que corresponde a la página web de El portal número 3, que habla de rdc, y este este recurso o entidad puede tener propiedades, por ejemplo, quién es el autor, por ejemplo, dónde está la página web con los contenidos html de ese recurso y luego puede tener diferentes valores balón para autor. Podría ser, por ejemplo, yo me veía un valor para página web, pues podría ser, por ejemplo, la uefa va a ser Sport. Aquí vemos pues como tenemos, estamos condenando a una persona con esta relación. También está propia Israel. Esta relación con otra persona llamada leyes resulta que por este tipo a persona suelta que por nació en esta fecha que veis, aquí llevamos, le interesa la Mona Lisa. Qué es un cuadro que fue creado por Leonardo Da Vinci? Aquí tenemos un vídeo he hecho, apunta a través de las relaciones con ese cual bale. Sale como queremos buena fe, somos capaces de crear estos trabajos de triple. Es un brazo rnc, lo que hace es crear una web de conceptos distribuidos y realiza acciones o declaraciones sobre tales entidades. Lo bueno que tiene es que estos enlaces pueden ir desde mi en mi máquina hasta otro corazón, otra máquina remota, por tanto, estos brazos son distribuidos usando cierto software no razonables, podemos hacer inferencias y usando este lenguaje especial, llamados parques, podemos consultar entonces es definitiva, rtbf es una tecnología que facilita que permite la declaración de información, de tal modo que sea procesado o las máquinas, de tal modo que los procesos, software, sean capaces de interrogarlo que los procesos, software, sean capaces de razonar sobre todo datos. Los agentes aguas por tanto puedan avanzar, intercambiar y utilizar tal, pero esas tripletes suelen seguir, las restricciones marcadas por las odontológicas, suelen definir jerarquías determinados y suelen formalizar, que meta datos pueden describir a cada uno de los conceptos o entidad pues rdc. Por tanto, no es más que un mecanismo para poder describir brazos de conocimiento hay que guardarlos aquí e intercambiarlos a través de otros protocolos de comunicación; por tanto, hay que seguir antes. Aquí vemos, por ejemplo, Lover Bosso poco inteligible. Qué es, describir en este caso la Universidad de Deusto, usando el formato r? Vamos a ver que esto se va a transformar en un brazo, vale, donde va a haber un nuevo que se llama Deusto puntuales, que tiene un atributo que es la latitud; otro que es la longitud que apuntan a valores, y además está enlazada con una colección de facultades en este caso caso bale, y esto es lo equivalente. No es absolutamente lo equivalente? Le faltaría esta parte para describir lo mismo. Usando otro mecanismo de señalización más cómodo es ln 3, en su conjunto aún más simplificado tarta? Este es el mecanismo de señalización que voy a usar en todos nuestros ejemplos, porque es un mecanismo que es más fácilmente entendible por los seres humanos y observar en este mecanismo lo que se describe en cada línea. Es una tripleta, por ejemplo estaba aquí la línea seis está describiendo que hay un recurso así el texto puntuales que tiene como título, como nombre Facultad de Ingeniería; esta otra es un poquito más complicado, se lo vamos a ir. El punto y Coma qué es lo que significa ese punto coma significa qué dado este sujeto. Hagamos una tripleta con la propiedad, 43, 27, siete creamos otra segunda tripleta; de nuestro punto es geológica y esteban. Como veis, una manera de reducir los caracteres que escribas cuando en este caso estamos notando que comparten su jefe, y esta evaluación que veis aquí es la manera que tenemos de crear, no de los black; nos o no dos vacíos; básicamente son nodos que no tienen una hora y que es dirección; hable desde fuera del trabajo pero que permiten, dentro de ese o modelar información o dependencias de cierta entidad con otras subvenciones, como en este caso, dada la Universidad de Deusto queremos modelar el hecho de que consiste en varias facultades para poder encontrar o acceder a los datos de las facultades, en este caso, obligaría a acceder a través de la correspondiente. Lo mismo en realidad, esto es lo que se representa, esto es lo importante. Esto es lo que hace claro, pero dice humor y de gusto. Punto es asociada con esta latitud, con esta longitud asociado, con este plan no. Qué es de tipo? Van contiene dos elementos adjunto de ingeniería y facultad. Aquí tenéis, por cierto, muy mal por mi parte debería de haber iniciado así la la clase, tenéis accesible. Esta presentación culpa, el agua que voy a primar a vale, siento no haberlo hecho antes, supuestamente es una web pública y confío que todos podáis hacer caso de que alguno no acudiera, por favor, protesta entonces prosiguiendo con la teoría estoy aquí tenemos una herramienta que nos permite dado un brazo transformarlo, bueno, en este caso procesarlo transformarlo, en un, se ha dado un fragmento de realeza XML, transformarlo en correspondiente, y el conjunto de tripletes contenidas dentro, aquellos que quieran administrarse o conocer sus primeros pinitos con la fe es una herramienta muy útil, y esta otra es algo más útil, porque lo que hace este permite convertir entre diferentes. Ahora vamos a hacer un ejercicio y vais a ver de qué estoy. Siguiendo con los mecanismos de señalización en esta zona son donde hay, pues cada vez es menos utilizado. También hay un mecanismo de serie estación compatible con y que todavía permite representar información semántica grasos vale, y se le llama, y eso no les veo, ya vas por ley. Es una manera de codificar, usando bien dolor, hacer un pequeñito ejercicio. Claro que si voy a estar. No. Aquí tengo algunos ejemplos. Por ejemplo, este ejemplo me está describiendo en son, pues ciertas en ciertos lugares está descrito Bueno, en concreto un lugar el este es una leve. Sí quiero exportar esto. Ahora puedo aquí la parte inferior, elegir diferentes formatos de señalización. Vale? Eso yo estoy aquí en quads, básicamente me representan y es como si fuese parte, vale, como si fuese la anotación concisa que antes estábamos utilizando. Si ahora voy al. Otra herramienta que me permite transformar. Este formato en Ecuador triples, a modo de ejemplo rdc XML aquí como ahora son, eleve. He conseguido esta representación, en este caso en rdc. Ahora, si vuelvo por ejemplo, al portal anterior. Este contenido. Pues vais a, me representa lo que he visto antes, no que esto es el país, te veo de que tienen una latitud longitud que tiene una imagen asociada y que tiene esta descripción. Hemos visto cómo estos formatos deseo decisión total, totalmente intercambiables; entre. Muy bien, pero bueno, esto es otro ejemplo de los que están disponibles en esta herramienta que permite jugar con este trabajo. Bueno, es un poquito más complicado, que básicamente describe una tienda y tiene varios productos, son productos de ciclismo, y por cada producto categoría la descripción tiene un precio, un título etc. Bien, entonces hemos visto que es rne, no permite crear grasos. Ahora vamos a ver el segundo, la segunda o otra pieza del puzle de la semántica fundamental sol. Recordamos con Antología al fin y al cabo la caza es definir conceptos de un dominio y las relaciones entre ellos esencialmente lo que modela son clases o conceptos, las propiedades de tales conceptos, describiendo lo bueno, varias características y atributos de los mismos y además una serie de restricciones, de tal manera que cuando alguien quiera, acorde con esta antología crear instancias poblar el párrafo del conocimiento, habrá de asegurarse que estas restricciones se cumplen. Si no, lo que ocurrirá es que mis datos generados, pues no serán válidos, acorde con las restricciones o con lo que marca es tanto, es una antología, es el vocabulario más. Las instancias de sus clases constituyen juntos lo que es una base de conocimiento. Entonces, en qué se diferencia una antología de XML o aunque esa diferencia en la más tener conocimiento de un conjunto de datos en el que se más que un formato aquí en cambio modelo. El significado de lo que hay detrás de esos caracteres, descritos en la odontología, es la gran ventaja, es que tenemos herramientas que nos permiten hacer consultas sobre los datos o que les permiten razonar sobre él. Aún no es otra cosa que una extensión del vocabulario básico de fe para definir antologías y recordamos estos detalles fundamental. Las antologías las antologías, son distribuidas; es decir, yo me creo una antología que describe un ámbito del conocimiento y lo conectó con otras antologías externas, que describen ámbitos complementarios, las antologías, pueden ser importadas y extendidas para crear obras derivadas, y esto es algo que hemos hecho el diseño de, y se pueden, además, alinear una su antología con otras. Quiero decir pues, por ejemplo, decir que esta clase de antología es equivalente a esa otra clase. La antología b -bale, pero para entender por qué es importante esto todas las antologías, veamos el siguiente observar que la parte superior de pantalla lo que tenemos aquí es un fragmento en total que por hace uso de la antología Fred o Faffe, que permite modelar relaciones entre personas, y lo que dice es que el tal y piña org es una uvi. Hay un sujeto bajo el uvi y Pina, que es autora de esta página web derrotada por Luis, ahí luego hay aparentemente otra persona que es autora de otra página web y, finalmente, otra persona que es autora de esta tercera de una página web, como es los seres humanos, y si la isla os dais cuenta que parece que están hablando de la misma persona. Sin embargo una máquina hay un único que ve son. Por tanto, asumen que estamos hablando de tres objetos diferentes. Bien, si cogemos esta tripleta que conforman nuestra base del conocimiento y las aderezamos con lo que veis aquí, pues vamos a poder establecer, mapeo entre entidades, en este caso el prefijo old, que aparece aquí declarado dice que se quieren utilizar construcciones que pertenecen a la antología o aquí básicamente. Lo que estamos diciendo es que este tipo, el Deusto, punto es, es el mismo que el apuntó, que este otro tiene nuestro punto de. Es el mismo que este otro. Entonces, ahora, si mezclamos estos tripletes de aquí con estas otras, hacemos la consulta. Dime todo lo que ha escrito. El tal y piña ahora, gracias a las capacidades de razonamiento, tienen o no devolver a que Ipiña pintor ha escrito tres artículos. Si no hubiéramos introducido esta parte del medio, si no hubiéramos introducido esto, la única respuesta que tendríamos sería este artículo que habla una tecnología que se llama, o si vale, pero gracias a haber hecho uso de esas sentencias dos de estos practicados, pues nuestro motor de consultas que tienen detrás un motor de razonamiento es capaz de darse cuenta y piña. Org es el mismo que Deusto punto es. Baradei Pina, que es el mismo que si, desde nuestro punto es bajo y pinar. Entonces. Esto esta es realmente la función principal de las antologías y su capacidad de razonamiento avanzamos ahora por tanto a describir un buen ejemplo de una antología ampliamente utilizada es una antología muy ampliamente utilizada y que hemos usado sobre manera también es la antología llamada Skopje sin impone no le sistema vale y para qué sirve es tan bueno estas ésta sirve para representar vocabulario taxonomía y libros de sinónimos o tres euros para eso sí vale entonces cuando decimos control vocabulario y aquí nos referimos nos referimos a conjunto de términos que una comunidad organización pues ha convenido pues por ejemplo cómo es decir que días de la semana es la colección estos valores que avisan hemos creado un vocabulario llamado días de la semana donde existe esa enumeración de valores lo que lo conocemos como enumeración puede ser un control vocabulario y descrito gracias aquí que es lo que tenemos la manifestación quizás más común la taxonomía que básicamente es un vocabulario que puede organizar sus conceptos de modo jerárquico. Un ejemplo en el ámbito de la informática una tableta, un lapso, un ordenador, pueden ser ordenados de una manera jerárquica porque compiten ordenador. Será el padre de tablet y acto son subtipos de ordenador y además también podemos crear libros de sinónimos o tres euros que no son solamente tan que pueden ser, también taxonomía, pero que además incluyen un conjunto de términos alternativos en diferentes idiomas, o determinados relacionados de tal manera que fácil tenemos, por ejemplo, las búsquedas en un portal de compraventa. Cuando alguien mete la palabra tableta bueno o anualmente ordenador, no solamente los resultados de artículos bajo la palabra clave del ordenador, si no, pues de todos los tipos subtipos de ordenador, que podemos encontrarnos como portátiles. Entonces, en uno tabletas, aquí vemos en la parte inferior algunos pequeñitos ejemplos de cómo se puede modelar conocimiento usando aquí estamos diciendo que ordenador. Eso es un concepto, no, básicamente es una de las entidades que definen a que estamos diciendo que en inglés claro, es cómo se denota los idiomas. Entonces, pues que se llama completar en castellano se llama computador y además hay veces que en castellano alternativo la ley le llama. Es. Tiene algunos hijos, como, por ejemplo, la acto y está relacionado con sol. Bien, pues vamos a jugar con Scouts y. Importa esta herramienta que permite visualizar tan sólo mías. Pues una. De. Las taxonomía es que hemos creado en la antología que es aquella que categorizar los códigos unesco de conocimiento bale momento aquí en esta herramienta. Si voy aquí a esta página se generan automáticamente pues ya me ha establecido, ha creado este templo? Donde se ve qué conceptos habla y cuál es su distribución gerard Otra manera? Quizás más elegante de ver y que habla de ramas o disciplinas de conocimiento. Eso. Es lo que define. Esta taxonomía es verlo en formato argo que aquí tenemos, por ejemplo, en matemáticas, pues que son disciplinas, hay álgebra Sainz. Concluyó vale, así vemos, bueno, como se ha creado una jerarquía de conceptos, de áreas de conocimiento, que por ejemplo, permitirán etiquetar pues no son objetos de investigación. En general, la Universidad, un grupo de investigación, un departamento, lo que fue. Entonces es cosa, es un maravilloso ejemplo de a deontología que, como digo repito, hemos utilizado muchísimo en el diseño o en la instalación de me al Che y habéis por bueno sencillo, que es trabajar con él. El último elemento del puzle de herramientas esenciales para poder trabajar con la web semántica está conformado por el lenguaje de consultas es parqués, me permite consultar sus Gracias, agradece a través de un lenguaje sencillo que se parece sobremanera a ese cuele mucho informático. Conoce que entiendo todos los presentes en esta sala pues nominal es un lenguaje que está diseñado para extraer consultar, información mantenida por aplicaciones. Servicios o repositorios bajo no solamente permite extraer datos una parte o derivada llamada; ese cuele a nuestro emite. También, actualizar los datos o crear consta de tres elementos. El lenguaje de consultas propiamente dicho, que es lo que vamos a ver nosotros esencialmente, pero además incorpora mecanismos para poder transmitir la consulta y para indicar cómo queremos de vuelta los resultados e incorpora mecanismos, ayudan en el diálogo con los. Básicamente es un servidor, que es compatible con el protocolo y que no solamente entiende consultas es porque sino que también es capaz de negociar con el cliente relativo a los tipos de salidas de resultados. En qué formato se van a generar? Vienen aquí Luis una consulta que en este caso observar parte superior de la pantalla, opción. Básicamente. Aquí hay una antología que describe la tabla periódica de los elementos de Bale y lo que queremos es hacer una búsqueda para aquellos elementos por símbolo y número atómico. Esa tabla de los elementos de vender ellas que cumpla asienta restricciones claro es que las restricciones se especifican critican como tripleta estamos diciendo que hay un elemento esto es una variable, lo que denota la interrogación cuyo número de limbo, cuyo símbolo es otra variable llamada Simon, que además es elemento, tiene un número atómico que lo guardamos en otra variable, con 2, la llamada, y finalmente esto es algo concreto. Decimos que estos elementos que yo recupere tienen necesariamente que pertenecer al grupo 17, además opcionalmente. Esto es un honor bale. Puede que tenga un color. Ese elemento químico vale, pero no es obligatorio. Habrá algunos que estén denostados por la propiedad desgracia, antiguo colores y otros no. Entonces, devuélveme todos los elementos que, opcionalmente tienen color del grupo 17, me veo esas tripletes con aquellos que son del grupo 18 algo menos listas. En orden descendiente por número atómico y me muestras solamente, 10 resultados y además no me muestran los 10 primeros empiezas desde el resultado. 11 Nadal vale. Eso es lo que significa esta consulta a muchos de vosotros. Bueno, os resulta, sobre todo familiar, porque es la parte inicial, la parte final, la parte de restricciones, pues observar que una vez más hace uso de vale, que es el mecanismo de selección agradece, que hemos venido, he venido mostrando en todos los ejemplos anterior. Pero la verdad que algunos habéis preguntado cómo es posible que si llevamos 20 años con la semántica esto no sea una rotunda realidad, y todos los sistemas de información del mundo usen la web semántica bueno, pues lamentablemente la base de la curva de aprendizaje importante también hay que replicar, hay que anotar contenidos que ya existían, y entonces lo que ha ocurrido es que su nivel de adopción es notablemente inferior a lo que estoy, pero entre tanto se han ido creando una serie de facilidades o mecanismos para ser matizar los contenidos en forma de documentos ya existen. Entonces en esta transparencia básicamente muestro tres opciones para poder empotrar meta datos de las páginas web. La modalidad uno r básicamente lo que hace es inserta código rtbf, dentro de una página, haciendo que ese código todavía se ve perfectamente en un navegador y aquellos navegadores que tengan un plan que es capaz de extraer rtbf o de entender la erradicación, o, mejor dicho, pues también es capaz de incluso formular consultas, Sparks contra lo que haya. Dentro de esa página formatos fue el primer intento que se hizo de intentar se un poquito las páginas web. Es un enfoque no estandarizado básicamente pues más, más gente empezó a utilizar, pero que es una manera no muy ortodoxa no muy extensible de añadir metanol con la irrupción de html5 y con el afán de reemplazar a los formatos, introdujo lo que son los micros, datos vale, que además son soportados por los navegadores, actuales por los buscadores actuales, bien currado, y otros muchos bale, y entonces fijaron que en mitad del html aquí véis negrita cómo podemos decorar con algunos atributos adicionales para que lo que de otra manera decía Android y una web ahora sepamos que se fragmenta está describiendo una aplicación, software de nombre que funciona para, para Android y que pertenece a la categoría juego vale con un poquitín más de trabajo. Si integramos estos módulos en estos meses podemos enriquecer lo que necesitamos y también facilitamos el seo la capacidad de búsqueda con estas tecnologías. Podemos aproximarnos a la visión de una web con más significado, pero todavía comprensible tanto por humanos como máquinas. Esto es lo que hacen los metadatos. Empotrados los diferentes mecanismos nos harían crear mucho más ricas, no con gran experiencia de usuario con gran contenido, estructura y encima bueno con el relleno que permitiría mucho mejor. Esa información por agentes. La industria no es ajena a esta tendencia y por eso los grandes buscadores se aliaron para que, para crear un conjunto vocabulario común es que ellos, con los cuales, ellos educan a sus motores de búsqueda a sus voces, que van navegando por todas las páginas web de todos los portales para intentar indexar. Entonces tiene bastante acepción y lo que permite es bueno que lo que nosotros vemos en la página html aquí este moderado, tal como veis aquí con James bien, la mejor manera de ver esto es que sí vamos. Por ejemplo, a mí me gusta. Página web, año. La página web, ni siquiera tan moderna, ni bonita, pero sí voy a tengo un o y aquí escondido en este tema. Todos estos datos tengo grapo que representa a alguien que trabaja en una organización que está en ciertas dirección y que esa dirección tiene ciertas coordenadas, y todo esto, como se ha conseguido aproximadamente esta página se teme con un poquito de microondas, bale. Total, que la labor de datos ofreció demasiada información con muy poca estructura. Ese es el colofón a la conclusión de todo esto y que además está diseñada sobre todo para ser inteligible, entendible, por humanos, es un aval sin táctica no es una voz semántica, la búsqueda continuó hasta ahora, pues bueno, ha sido simple o a costa de tener voz cada vez más inteligentes, que cada vez hacen procesamientos más sofisticados de los contenidos. La realidad actual es que los continuos son muy heterogéneos en cuanto a su contenido. Estructura, la manera de comunicarse, los idiomas en los que aparecen y de alguna manera tenemos que arreglar esto ofreciendo información inteligente, y por esa razón mas también ha estado promocionando esta visión de crear datos enlazados, que como se define como un conjunto de buenas prácticas son recomendadas, para exponer compartir y conectar datos, información y conocimiento en la web semántica usando y usando herramienta, básicamente es una manera de sacar partido, de la innovación tecnológica que supone la oms. Su misión es facilitar el descubrimiento, facilitar la conexión, la inscripción y la adquisición de todo tipo. De esta manera, pues hubo un intento durante varios años de intentar crear algo. Graba, fotógrafos, conectando unos con otros; ahora sí empezaba a dirigir búsquedas más a este grapo de que a la web. Entonces, si queremos adoptar las prácticas de eta, con los datos que nosotros generamos en nuestras empresas en nuestras organizaciones, pues podemos hacerlo siguiendo las recomendaciones que nos da y dependiendo de lo bien que abramos nuestros datos, pues esos datos gozarán de un o una calificación de uno a cinco estrellas, entonces serán nuestros datos publicados como una estrella, cuando simplemente los hagamos disponibles en cualquier formato, pero obviamente con una licencia abierta, con letras esto puede ser un PDF, por ejemplo, dos estrellas. Los datos disponibles son estructurados y elegibles. Por las máquinas, por ejemplo, podría ser un éxito. Los extranjeros no solamente son elegibles por las máquinas. Encima hacemos un esfuerzo de usar formatos abiertos, como Matas y Seúl. En cuanto a estrellas ya empezamos a hacer uso de las herramientas y mecanismos de la voz semántica como rmc y Spa cinco estrellas. Cuando publicamos no queremos que cuando alguien venga hago una búsqueda o explore nuestro trabajo, se quede ahí en nuestro siglo, queremos conectarlo con otros hilos de información. Por esa razón deberíamos siempre que publiquemos datos e introducir enlaces, datos externos de otras organizaciones. Entonces si queremos publicar datos siguiendo las premisas de eta, pues es una cosa bastante sencilla. Tenemos que usar un hispano en las cosas, queremos que los agentes, software e incluso los navegadores sean capaces de de referencia lo que hay detrás de esas entidades a través de las cuando accedemos a los contenidos la información que se presente. Pasó 3, debían ser datos, auto descriptivos y además nuestro tantos enlaces. De esa manera podremos llegar a hacer conectados, tal como el simple ejemplo que vemos aquí no observar que tenemos a una persona identificada por 11 cada vive en esta ciudad en Estados Unidos, importante ahora otro color, además éste está en otro grapo telégrafo de la deuda y este es un estreno objeto vinculado directamente a a esta entidad o persona. Esta persona tiene identidades en otros lugares. Entonces claro, es que estoy trabajando cada día en su página web en esta obra de Lewis aquí pues también es el libio ver con el código 327 lo que sea en un portal de revisión vale, nos debemos el azar, esa presencia digital de Juan Secada en diferentes trabajos o lugares usando propiedades de aol como este nuevo revisor. Pues fijarnos en lo que puedes, además hacer una revisión de que de un libro ese libro está en otro. Donde hay una entrada por cada día se ve cada libro tiene en definitiva, escenógrafo manera rápida. Lo que está mostrándonos es que fáciles a través de eta, el azar, nosotros, una persona con diferentes actividades que hacen, por ejemplo, revisar artículos o libros y con los artículos o libros que ha revisado los datos y para al fin y al cabo hacemos todos estos procesos de trabajo para que pues para para permitir a los mortales no aquellos que saben mucho de Estadística, que son científicos de datos, entender lo que se esconde detrás de esa información. Por ejemplo, aquí vemos un ejemplo de un proyecto que existe un grupo de investigación donde, básicamente lo que intentamos fue integrar datos públicos sobre los kilos de residuos de plástico, botellas, vidrio, don basura. Normal que en diferentes municipios en Bizkaia generaba y en base a ello, pues básicamente nos hemos el cual se se se veían, cómo debían, no se los diferentes municipios y en aquellos lugares que aparecieran enrojecidos, haya oportunidad y buzos y determinar cómo resolver esos problemas. Entonces, para acabar antes del descanso, si ya hay dos rasgos conocidos y ampliamente utilizados en esos son última hora y media, data observar que es una base de conocimiento creada por voluntarios a, básicamente lo que hacen es crear nuevos aires y crean sentencias o tripletes asociados a esos agentes a través de una interfaz gráfica muy sencillo. Hasta esa cada día que describe les identifica, le un identificador o Paco, es decir, algo que empieza por cuyo mérito vale, y luego lo vamos a añadir cosas para hacerlo más legible. Como las descripciones, alias y luego un conjunto de sentencias que básicamente son más que tripleta, tal como han comentado. Por ejemplo, si voy a que que observa como agua líquida tan se describe información relativa al monte bienes, nosotros podemos editar esta página y enriquecerlo. Claro que dice que esto es de tipo montaña. Hay un montón de imágenes, hay un montón de maneras de referirse, haga este monte en diferentes idiomas. Cómo es todo esto? Son tripleta que describen exhaustivamente este concepto y que este concepto, la la comunidad, lo bueno es que tiene un montón de consultas, salones Parker. Te permite pues explorar, por ejemplo no sé a. No. Ya lo hizo títulos artículos de pueblos ucranianos, en la Wikipedia rumano, una consulta no, muy útil, pero lo bonito, lo que quería mostrar es que al fin y al cabo, pues hay un usa, el lenguaje que acabamos de ver, para extraer toda esa información de esta base de datos colaborativa que es la wiki Data. Hay otra muy importante base de datos, se mantiene, que debe pagar ya que básicamente lo que ha creado es un grado de conocimiento, a partir del 1, 2, que existe en la Wikipedia, concretamente, acogido lo que somos, esas tablas que aparecen en la parte derecha, superior, de las páginas de Wikipedia, donde hay una síntesis de concepto, y esa síntesis pues es un formato o unas plantillas. Por eso es posible, que es lo que ha pedido hacer una gente que extrae esos datos y acorde con la antología que han creado o sean capaces de modelar, modelar a ver si tenemos el Sport que también de materia, y aquí por ejemplo un ejemplo sencillo. Nos permitiría, permitiría. Un error en la consulta, pero. Un segUndo. No ha hecho bien, pero también se tendría información. Bien, con eso acabamos esta primera parte y ahora descansamos un cuarto de hora y media continuaría. Vamos ya hablando, muy concretamente, de cómo toda esta teoría ha comentado que esta primera hora y cuarto la hemos puesto en práctica para arrollar en antologías más. Sé si alguien quiere decir algo, en ese momento. Pero no hemos dormido o de otro momento, no es bueno, pues podamos un cuarto de hora y y vamos a ver algo de esas cosas. Todos se vuelven más sanas. Encima tenía. Entonces eso les ponga de acuerdo. Si quieres puedes pasar lo de grabación o la noche. Ya lo he pasado. Yo no sé si ahora ahora.

Propietarios

Proyecto Hércules

Comentarios

Nuevo comentario

Serie: Formación lunes 1 de Febrero ASIO Gnoss (+información)

Descripción

Videos