Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!
Zadejte Vaši e-mailovou adresu:
Kamarád fotí rád?
Přihlas ho k odběru fotomagazínu!
Zadejte e-mailovou adresu kamaráda:
-
5. září 2024
Matrixmedia - Obsluha a tisk na velkoformátových digitálních tiskárnách
-
30. září 2024
-
4. října 2024
-
14. listopadu 2024
Software
eVe - vizuální vyhledávání v praxi
24. ledna 2002, 00.00 | Jaká je momentálně asi nejprogresivnější technologie na poli vizuálního vyhledávání? A jaké si dělá plány do budoucna? Znamenají vizuální vyhledávače skutečný průlom nebo jde jen o příjemnou pomůcku?
V článku Vizuální vyhledávání jsou budoucností práce s obrazem jsme si představili základní trendy, kterými se dnes společnosti na poli vizuálního vyhledávání ubírají. Dnes si popíšeme konkrétní řešení.První pokusy o implementaci vizuální vyhledávací engine se objevily už hluboko v devadesátých letech. První generace vyhledávačů zpracovávala obraz jako celek - srovnávala tvary, textury a barvy obrázku rozloženého na RGB pixely. Problémem byly vysoké nároky na výpočty, a vysloveně slabým místem bylo rozpoznávání toho, co na obrázku "skutečně" je - bez ohledu na podobnost barevnou či tvarovou. Pro takto postavený engine nebyl problém označit jako "podobné" obrázky západu slunce a plápolajícího ohně.
O něco později se objevila technologie, která dělila obraz na jednotlivé bloky a ty následně analyzovala (příklad tohoto přístupu je na stránce Ermitáže). Výhodou tohoto přístupu je relativní rychlost a přesnost, její Achillova pata jsou však změny proporcí a pozice objektu, které mohou vést až k nerozpoznání.
Poslední generace technologie vizuálního vyhledávání se snaží zohlednit způsob, jak s vizuální informací nakládá lidské oko a především mozek. Obraz totiž vnímáme především jako soubor objektů, které mají nejrůznější prioritu. A právě na rozkladu obrazu na objekty obdařené nejrůznějšími parametry, je tato technologie postavena.
eVe - technologie, která "vidí"
Právě takovou technologií je eVe, z líhně společnosti eVision. Nejde o samostatný vyhledávač - společnost distribuuje toolkit pro vývojáře, kteří mají možnost tuto technologii implementovat do svých projektů. Některé ze vzorových programů, které toolkit obsahuje, však mohou samostatně posloužit docela dobře. Na platformě je eVe nezávislý - funguje pod Windows, na Unixech i Macích.
Základním principem eVe je rozklad obrázku na logické komponenty - objekty - kterým jsou rovněž přiřazeny další atributy (barva, textura, tvar).
V praxi je potřeba nechat obrázek programem zanalyzovat. Na základě získaných dat pak eVe vytvoří vytvoří deskriptor (vizuální signaturu), který obsahuje informaci o hodnotách barev, tvarů, textur, stínů a velikosti objektu. Poslední dvě zmíněné hodnoty mají velký význam v případech, kdy jsou objekty na obrázku nezřetelné (napůl skryté ve stínu apod.). Velkou výhodou při hledání podobných obrázků je možnost definovat objekt, o který nám jde (auto, květina)...
Při analýze eVe obrázky roztřiďuje podle podobnosti do skupin. Obrázek, který skupinu dostatečně "reprezentuje" se pak může stát zástupcem ve Visual Vocabulary. Kromě toho že tenhle obrázkový slovník usnadňuje orientaci, pomáhá i jinak: skrze něj je možné obrázkům hromadně přiřazovat klíčová slova (Visual Meta Tagging™).
Budoucnost pro svého nadějného chráněnce vidí eVision v dalším zdokonalování a prohlubování technologie. V současné době pracuje na vylepšeních, která by umožnila vybírat z více obrázků různé objekty - a nakonec nechat vyhledat obrázek, který tyto objekty obsahuje všechny najednou.
Ze tří fotografií jsou vybrány tři objekty. Fotografie, kterou vidíte vpravo dole, je výsledkem vyhledávání zaměřeného na kombinaci těchto tří objektů.
Využití této technologie v masovějším měřítku už je pomalu na spadnutí. V závěru loňského roku uzavřela eVision dohodu s mamutím "digitálním nakladatelstvím" Corbis. Podle této domluvy poskytne Corbis na 60 000 obrázků eVision, aby mohli společně demonstrovat výhody nové technologie. Jistě v tom nejsou jen altruistické motivy; převážnou většinu zákazníků Corbisu tvoří výtvarníci, grafici a další umělečtí profesionálové, kterým je vizuální myšlení blízké (viz http://www.footage.net/newswire/news1781.html).
Bude-li se vývoj ubírat tímto směrem, dá se očekávat, že vliv na společnosti, které se vizuálnem profesionálně zabývají, bude značný. Domluva se zákazníkem (zejména pokud si není jist, co přesně si přeje, ale má určitou představu) by byla výrazně snazší - definováním "závazných" objektů a následným vyhledáním podobných obrázků by měl klient k dispozici celou kolekci možností. Lze předpokládat, že s výkonným vizuálním vyhledáváním by se rozšířila i působnost "databanek" grafických objektů. A s možností kombinace objektů z různých obrázků by se možnosti ještě zvýšily.
Jiné výhody přináší tato metoda kupříkladu fotoamatérovi s rozsáhlým archivem, který má jedinou vadu - těžko říci, kde co je. Pokud jsou obrázky zindexované, je hledání hračka: na požádání je možné mít všechny fotografie určité osoby nebo pro změnu všechny fotografované na dovolené na Bali nebo... možností je nepřeberně.
Je pravděpodobné, že systémy umožňující správu, vyhledávání a orientaci ve vizuálních datech budou nabývat čím dál tím víc na důležitosti. I když - jak bude vypadat budoucnost se dá někdy odhadnout jen obtížně. O tom by mohli duchovní otcové a matky projektu WholeImageNet vyprávět...
-
14. května 2014
Jak vkládat snímky do galerií a soutěží? Stručný obrazový průvodce
-
23. dubna 2014
Konica Minolta přenesla výhody velkých zařízení do kompaktních modelů
-
12. června 2012
-
9. dubna 2014
-
29. listopadu 2013
-
6. září 2004
OKI snižuje ceny barevných laserových tiskáren C3100 a C5200n
-
13. května 2004
-
19. ledna 2004
QuarkXPress Passport 6: předvedení nové verze na konferenci Apple Forum 27.1.2004
-
6. února 2001
-
30. listopadu 2014
Nový fotoaparát α7 II: první plnoformát s pětiosou optickou stabilizací obrazu na světě
-
8. září 2024
-
14. října 2024
-
5. listopadu 2024
-
14. listopadu 2024