eVe - vizuální vyhledávání v praxi - Grafika.cz - vše o počítačové grafice

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:



Software

eVe - vizuální vyhledávání v praxi

24. ledna 2002, 00.00 | Jaká je momentálně asi nejprogresivnější technologie na poli vizuálního vyhledávání? A jaké si dělá plány do budoucna? Znamenají vizuální vyhledávače skutečný průlom nebo jde jen o příjemnou pomůcku?

V článku Vizuální vyhledávání jsou budoucností práce s obrazem jsme si představili základní trendy, kterými se dnes společnosti na poli vizuálního vyhledávání ubírají. Dnes si popíšeme konkrétní řešení.

První pokusy o implementaci vizuální vyhledávací engine se objevily už hluboko v devadesátých letech. První generace vyhledávačů zpracovávala obraz jako celek - srovnávala tvary, textury a barvy obrázku rozloženého na RGB pixely. Problémem byly vysoké nároky na výpočty, a vysloveně slabým místem bylo rozpoznávání toho, co na obrázku "skutečně" je - bez ohledu na podobnost barevnou či tvarovou. Pro takto postavený engine nebyl problém označit jako "podobné" obrázky západu slunce a plápolajícího ohně.

O něco později se objevila technologie, která dělila obraz na jednotlivé bloky a ty následně analyzovala (příklad tohoto přístupu je na stránce Ermitáže). Výhodou tohoto přístupu je relativní rychlost a přesnost, její Achillova pata jsou však změny proporcí a pozice objektu, které mohou vést až k nerozpoznání.

Poslední generace technologie vizuálního vyhledávání se snaží zohlednit způsob, jak s vizuální informací nakládá lidské oko a především mozek. Obraz totiž vnímáme především jako soubor objektů, které mají nejrůznější prioritu. A právě na rozkladu obrazu na objekty obdařené nejrůznějšími parametry, je tato technologie postavena.

eVe - technologie, která "vidí"

Právě takovou technologií je eVe, z líhně společnosti eVision. Nejde o samostatný vyhledávač - společnost distribuuje toolkit pro vývojáře, kteří mají možnost tuto technologii implementovat do svých projektů. Některé ze vzorových programů, které toolkit obsahuje, však mohou samostatně posloužit docela dobře. Na platformě je eVe nezávislý - funguje pod Windows, na Unixech i Macích.

Základním principem eVe je rozklad obrázku na logické komponenty - objekty - kterým jsou rovněž přiřazeny další atributy (barva, textura, tvar).

V praxi je potřeba nechat obrázek programem zanalyzovat. Na základě získaných dat pak eVe vytvoří vytvoří deskriptor (vizuální signaturu), který obsahuje informaci o hodnotách barev, tvarů, textur, stínů a velikosti objektu. Poslední dvě zmíněné hodnoty mají velký význam v případech, kdy jsou objekty na obrázku nezřetelné (napůl skryté ve stínu apod.). Velkou výhodou při hledání podobných obrázků je možnost definovat objekt, o který nám jde (auto, květina)...

Při analýze eVe obrázky roztřiďuje podle podobnosti do skupin. Obrázek, který skupinu dostatečně "reprezentuje" se pak může stát zástupcem ve Visual Vocabulary. Kromě toho že tenhle obrázkový slovník usnadňuje orientaci, pomáhá i jinak: skrze něj je možné obrázkům hromadně přiřazovat klíčová slova (Visual Meta Tagging™).

Budoucnost pro svého nadějného chráněnce vidí eVision v dalším zdokonalování a prohlubování technologie. V současné době pracuje na vylepšeních, která by umožnila vybírat z více obrázků různé objekty - a nakonec nechat vyhledat obrázek, který tyto objekty obsahuje všechny najednou.

Ze tří fotografií jsou vybrány tři objekty. Fotografie, kterou vidíte vpravo dole, je výsledkem vyhledávání zaměřeného na kombinaci těchto tří objektů.
Ze tří fotografií jsou vybrány tři objekty. Fotografie, kterou vidíte vpravo dole, je výsledkem vyhledávání zaměřeného na kombinaci těchto tří objektů.

Využití této technologie v masovějším měřítku už je pomalu na spadnutí. V závěru loňského roku uzavřela eVision dohodu s mamutím "digitálním nakladatelstvím" Corbis. Podle této domluvy poskytne Corbis na 60 000 obrázků eVision, aby mohli společně demonstrovat výhody nové technologie. Jistě v tom nejsou jen altruistické motivy; převážnou většinu zákazníků Corbisu tvoří výtvarníci, grafici a další umělečtí profesionálové, kterým je vizuální myšlení blízké (viz http://www.footage.net/newswire/news1781.html).

Bude-li se vývoj ubírat tímto směrem, dá se očekávat, že vliv na společnosti, které se vizuálnem profesionálně zabývají, bude značný. Domluva se zákazníkem (zejména pokud si není jist, co přesně si přeje, ale má určitou představu) by byla výrazně snazší - definováním "závazných" objektů a následným vyhledáním podobných obrázků by měl klient k dispozici celou kolekci možností. Lze předpokládat, že s výkonným vizuálním vyhledáváním by se rozšířila i působnost "databanek" grafických objektů. A s možností kombinace objektů z různých obrázků by se možnosti ještě zvýšily.

Jiné výhody přináší tato metoda kupříkladu fotoamatérovi s rozsáhlým archivem, který má jedinou vadu - těžko říci, kde co je. Pokud jsou obrázky zindexované, je hledání hračka: na požádání je možné mít všechny fotografie určité osoby nebo pro změnu všechny fotografované na dovolené na Bali nebo... možností je nepřeberně.

Je pravděpodobné, že systémy umožňující správu, vyhledávání a orientaci ve vizuálních datech budou nabývat čím dál tím víc na důležitosti. I když - jak bude vypadat budoucnost se dá někdy odhadnout jen obtížně. O tom by mohli duchovní otcové a matky projektu WholeImageNet vyprávět...

Tématické zařazení:

 » Rubriky  » Go verze  

 » Rubriky  » Sazba  

 » Rubriky  » Software  

 

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: