Aug 19
2007

Web 3.0 – Semantični splet

14:06, published in category: user Experience

Sanjam o spletu, v katerem bodo računalniki sposobni analizirati vse podatke, ki krožijo po internetu: vsebino, povezave in interakcije med ljudmi in računalniki. Semantični splet, ki bi to omogočal, še mora nastati, a ko bo prišel na dan, bodo v vsakodnevnem življenju, prometu, birokraciji, stroji komunicirali s stroji.

Prevod: Sir Tim Berners-Lee, soizumitelj svetovnega spleta, direktor W3C konzorcija in oče semantičnega spleta

O semantičnem1 spletu, kot »spletu prihodnosti« (Web 3.0), je vedno več slišati. Do nedavnega še s tem področjem nisem bil podrobneje seznanjen, zanimanje za natančnejšo študijo pa mi je vzbudilo predavanje Roda Petrovića, enega izmed redkih strokovnjakov za semantični splet pri nas, ki sem ga poslušal nedavno na Interi. Nekaj njegovih misli ter primerov povzemam tudi v članku.

V svetu ima najvidnejšo vlogo pri pospeševanju uporabe in razumevanja semantičnega spleta gibanje v okviru konzorcija W3C. Leta 2004 je W3C izdal RDF (Resource Description Framework) in OWL (Web Ontology Language) kot W3C standarda.

1. Web 1.0, Web 2.0, Web 3.0,…

Včeraj: Splet 1.0 je množica datotek, ne podatkov. Dokumenti so distribuirani po spletu, podatki so še pa vedno centralizirani. Gre za splet z mnogimi uporabniki in le nekaj ponudniki vsebin. Oglaševanje je nekontekstualno.

Danes: Splet 2.0 je kot pojem deležen neštetih marketinških zlorab. Gre za splet, v katerem so podatki centralizirani, ponudniki vsebin pa so lahko tudi uporabniki. Dostop do podatkov je olajšan s pomočjo tehnologij RSS in API. Pomanjkljivosti? Splet 2.0 je še vedno zgolj spletišče posameznih dokumentov in aplikacij, ki centralizirane podatke hranijo samo zase.

Jutri: Splet 3.0 (Semantični splet) je baza podatkov oz. podatkovni svetovni splet. Podatki so distribuirani, razdrobljeni, vseprisotni na spletu. To je splet za ljudi in končno tudi inteligentne stroje (agente), ki znajo te podatke razumeti, analizirati in ponuditi ljudem.

2. SEMANTIČNI SPLET ~ »Web 3.0«

Googlov CEO dr. Eric Schmidt je nedavno na Seoul Digital Forum bil naprošen definirati Web 3.0:

Web 3.0 bodo povezane aplikacije, majhne, hitre, zmožne teči na različnih platformah, distribuirane viralno (social networks, e-pošta, itd.), podatki pa raztreseni na medmrežju.

Semantični splet ni ločen splet, ampak nadgradnja obstoječega. Semantični splet niso spletne strani in povezave, temveč odnosi med podatki. To je skupek tehnoloških standardov (Unicode, URI, XML, RDF, RDFS, OWL, …), ki omogoča strojem razumeti semantične dokumente in podatke.

Poenostavljeno lahko razložimo tole s preprostim primerom:

Če je A je prijatelj B-ja, potem je B prijatelj A-ja.
Boris je Alešev prijatelj.
Potemtakem je Aleš tudi Borisov prijatelj.

S pomočjo jezikovnih standardov, kot je na primer RDF, lahko takšne logične stavke objavimo na internetu, pametni »agenti« pa jih bodo znali prebrati in »razumeti« ter primerjati z drugimi podatki na spletu.

3. KAKO DELUJE SEMANTIČNI SPLET?

Srce semantičnega spleta predstavlja tehnologija, ki uporabnikom omogoča iskanje želenih informacij ter korelacij med njimi, ne glede na to kje na spletu se iskani podatek nahaja. Gre za pomensko in ne sintaksno označevanje in povezovanje podatkov, s čemer le-ti lahko postanejo uporabni za strojno obdelavo.

Elementi:

1. Ontologije so slovarji znanja o določenih področjih. Vsebujejo definicije pojmov: razrede, lastnosti, odnose med njimi, … Ustvarjajo jih lahko vsi in objavijo na spletu.

Primer ontologije:

Razred LCD_zaslon, vsebuje lastnosti:
- diagonala
- cena
- prodajalec (tip: Trgovec)

Razred Trgovec, vsebuje lastnosti:
- naziv
- telefonska številka

2. Meta-podatki so podatki, ki opisujejo druge podatke, so reference do pojmov, ki so definirani v ontologijah ter tako ustvarjajo globalni pomen meta-podatkov.

Primer:

Moj_LCD_zaslon je tipa LCD_zaslon in ima naslednje vrednosti:
- diagonala: 24”
- cena: 800 EUR
- prodajalec: Matrix_Trade

Matrix_Trade je tipa Trgovec in ima naslednje vrednosti:
- naziv: Matrix Trade, imaginarna družba za prodajo, d.o.o.
- telefonska številka: +38625550011

3. Inteligentni programi (agenti) analizirajo meta-podatke in uporabljajo ontologije, ki so dostopne na spletu, da bi te meta-podatke razumeli.

Primer inteligentnega iskalnika:

Uporabnikov zahtevek: Najdi mi telefonsko številko med vsemi Trgovci, ki ponujajo LCD_zaslon, ki ima diagonalo 24” in ceno manjšo kot 1.000 EUR.

Odgovor iskalnika: +38625550011

4. ZAKLJUČEK IN NADALJNJO BRANJE

Semantični splet lahko pomeni prihodnjo evolucijo spletne izkušnje. Sam predvsem menim, da lahko korenito revolucionira predvsem področji spletne prodaje in oglaševanja. Kakšno informacijsko prihodnost nam napovedujejo »semantični« vizionarji? Kakšne so možnosti, da dejansko zavladajo inteligentni agenti, ki bodo ustregli vsaki želji uporabnika? Zelo zanimivo prihodnost opisuje Paul Fordov članek, ki je bil – zanimivo – spisan že leta 2002.

Za nadaljnjo branje:


  1. Semantičen: pomenosloven, orientiran na pomen, … ()

Comments

Tomaž, 19. August 2007, ob 16:08:

Zelo dober članek – hvala morphix!

Prelc, 19. August 2007, ob 23:46:

Ja, res dober članke. Vprašanje le kdaj bo prišlo do web 3.0.

Luka, 20. August 2007, ob 01:15:

ja web 3.0 so trenutno samo sanje. Predvsem bo potrebno po moje poskrbeti za določene standarde. Recimo samo pri iskanju prave cene se že zatakne. Kaj pa če ima to trgovec navedeno kot “vrednost”..

Tadej, 20. August 2007, ob 09:58:

Pridružujem se komentarju Tomaža, zares gre za dober uvodni članek t.i. teaser da preberemo še kaj več o tej temi.

Strinjam pa se tudi z Luko, kajti najbrž bo največji problem Web 3.0 ravno problem standardizacije, s katerim se bojujemo že vseskozi…

Rod, 20. August 2007, ob 10:19:

Standardizacija je že rešen problem. Kot piše v članku, W3C je že leta 2004. izdal RDF in OWL. Pred tem pa so že obstajali URI, Unicode in XML.

RDF in OWL že omogočata ogromen napredek v smeri Semantičnega Spleta, vendar je njuna uporaba v praksi odvisna od volje posameznikov, predvsem spletnih razvijalcev. To žal pomeni, da proces ne bo hiter…

sekundek, 21. August 2007, ob 08:53:

Odličen članek in lepo razloženo. Sem prvič tukaj in definitivno ne zadnjič.

Davorin, 27. August 2007, ob 14:44:

Morphix, zelo fajn članek, le ena napakica. Tim Berners-Lee ni soizumitelj ampak izumitelj, oče svetovnega spleta ;)

Morphix, 27. August 2007, ob 16:09:

Hi Davorin, hvala za opombo. “Soizumitelj” sem napisal zato, ker se kot soavtorja smatra tudi njegov takratni sodelavec Robert Cailliau (vsaj Wikipedia pravi tako).

Davorin, 4. September 2007, ob 17:17:

In 1989 he invented the World Wide Web, an internet-based hypermedia initiative for global information sharing while at CERN, the European Particle Physics Laboratory. He wrote the first web client and server in 1990. His specifications of URIs, HTTP and HTML were refined as Web technology spread.

… tole pravijo na W3C -> http://www.w3.org/People/Berners-Lee/ … za tegale Roberta nisem slišal, ampak Wikipedia pa res pravi tako. Hmmm!?!

V vseh teh letih so me vlekli za nos!

Davorin, 4. September 2007, ob 17:20:

Aha, tule je omenjen …

… The underlying ideas of the Web can be traced as far back as 1980, when, at CERN in Switzerland, Tim Berners-Lee built ENQUIRE (referring to Enquire Within Upon Everything, a book he recalled from his youth). While it was rather different from the system in use today, it contained many of the same core ideas (and even some of the ideas of Berners-Lee’s next project after the World Wide Web, the Semantic Web).

In March 1989, Tim Berners-Lee wrote a proposal,[2] which referenced ENQUIRE and described a more elaborate information management system. With help from Robert Cailliau, he published a more formal proposal for the World Wide Web on November 12, 1990.[3] …

Očitno je pomagal pri proposalu in že je soizumitelj. No, ja …

Srđan Prodanović, 25. September 2007, ob 08:31:

Lepa obnova. Del te iskane standardizacije so tudi mikroformati. Zgoraj navedeni primer problema pri poimenovanju je tudi rešljiv z bolj fleksibilnim parseanjam vsebine, ali celo natural language searchem, kot je Powerset. Zanimiv koncept je tudi Freebase, ki sicer primarno podaja vsebine v JSON obliki, vendar se jo da spremenit v RDF kar s Triplrjem, YahooPipes, ali s kako domačo skripto.

Tudi Slovenci igramo veliko vlogo v semantičnem spletu. Na ogled priporočam videolectures.net

P.s.: Tale komentar objavljam že tretjič. CAPTCHA recimo NI del Web2.0 :-P

Igor, 27. September 2007, ob 22:33:

Odličen članek, rad bi samo nekaj popravil. Google je zelo web 2.0, zlasti po O’Reillyevi kompaktni definiciji, ki se konča s koriščenjem kolektivne inteligence. Z Googlovim algoritmom so brskajoči uporabniki(resda sicer nehote) soustvarjali najbolj relevantne zadetke in tako dobili najboljši iskalnik na spletu. Web 2.0 se je zato začel globoko v web 1.0 (tudi z Amazonom in Ebayem, ki sestavljajo trojko velikih iz weba 1.0 – ker so v bistvu po naravi web 2.0).

semantični splet, 26. March 2011, ob 09:56:

hvala, potreboval sem en tak povzetek!

semantični splet, 26. March 2011, ob 10:03:

no glede strojev ni problema, težava je vmesnik človek stroj, primer: kaj mislim (semiotično), ko vtipkam “moška moda” kot iskalno frazo.

Respond now!