Recenze: Data warehousing – návrh a implementace

číslo 7/2002

Recenze: Data warehousing – návrh a implementace

Humphries, M. a kol.: Data warehousing – návrh a implementace. Praha, Computer Press 2002, ISBN 80-7226-560-1, 257 stran, náklad neuveden, cena 395 Kč /569 Sk.
Překlad z anglického originálu Mark Humphries – Michael W. Hawkins – Michelle C. Dy: Data Warehousing: Architecture and Implementation. Prentice Hall Europe 1999.

V předmluvě, zřejmě převzaté z originálu, je tato kniha určena odborníkům „z oblasti informačních technologií, kteří slyšeli o technologii datových skladů, či by se s nimi měli seznámit“. Lze tedy očekávat, že zprostředkuje základní přehled o dané problematice. Že vývoj automatizace jednoznačně směřuje k řešení úloh, které přesahují tradiční požadavky a způsoby řešení, dokládají současné požadavky na integraci ostrovů automatizace v jeden celek a na jejich začlenění do vyšších řídicích struktur. Dalším impulsem, který nás, zatím snad spíše intuitivně, vede k zájmu o danou problematiku, je směřování k hlubší analýze řízených a řídicích procesů. Důkladná a efektivní analýza se musí, mimo jiné, opírat o obsáhlé soubory dat shromážděné za dostatečně dlouhá časová období. Současné technické prostředky umožňují realizovat tyto požadavky v dosud netušeném rozsahu.

Z uvedených důvodů považujeme uvedenou knihu za užitečnou i pro odborníky v automatizaci.

Kniha jim sice není primárně určena a při jejím studiu se budou prokousávat některými pro ně poněkud odtažitými problémy. Ani to však nebude ztrátou času. V nastávající éře integrace je velmi užitečné – a v blízké budoucnosti bude nezbytné – seznámit se s přístupem a způsobem myšlení odborníků v oblasti, která se stala, pro mnohé náhle, oblastí s automatizací bezprostředně sousedící.

V knize jsou datové sklady definovány jako nástroj rozhodování, čímž se odlišují od nástrojů operativního řízení. Automatizaci jsou bližší, zejména odhlédneme-li od již naznačených perspektiv, sklady operativních dat. I o nich však kniha pojednává, přičemž není pochyb, že oba druhy datových skladů nelze striktně oddělovat a jejich vlastnosti jsou v lecčem společné.

Kniha je členěna do šesti částí a v jejich rámci do šestnácti kapitol. V části s názvem Úvod nacházíme kapitoly Podniková IT architektura a Pojetí datových skladů. Následující část Lidé se zabývá organizačními záležitostmi projektování a provozování datových skladů. Čtyři kapitoly třetí části, nazvané Postupy a procesy, jsou věnovány projektu datového skladu. Nalezneme zde však také zajímavé údaje o základních principech jejich architektury a využití. Čtvrtá část se nazývá Technologie a vedle popisu hardwarových a softwarových problémů realizace datových skladů obsahuje i popis některých jejich základních principů a vlastností. Příkladem je kapitola Metadata a popis vývoje použití datových skladů v kapitole Aplikace datových skladů. Část pátá, nazvaná Co dál?, je věnována správě datového skladu, ale také perspektivám dalšího rozvoje této oblasti informatiky. V šesté části jsou soustředěny čtyři přílohy obsahující průvodce dvěma produkty souvisejícími s datovými sklady. Jde o produkt s názvem BUSINESSOBJECTS a další nástroje, vesměs explicitně blíže nespecifikované. Dále je uveden produkt firmy Microsoft nazvaný Data Warehousing v produktu SQL Server 2000. Tato příloha je doplněna instalačním kompaktním diskem produktu Microsoft SQL Server 2000 Enterpise Edition. Jde o testovací verzi s činností omezenou na 120 dnů, do recenze nazahrnutou. Třetí příloha shrnuje odkazy na internetové zdroje informací o datových skladech a čtvrtá je seznamem s tématem souvisejících produktů od různých firem s uvedením odkazů na jejich webové stránky.

Které z částí a kapitol knihy jsou důležité pro automatizační aplikace, nelze jednoznačně určit. Informace jsou rozptýleny v celém textu. Ani úvod není hutným shrnutím základních problémů. Menší pozornost lze věnovat snad jen třetí a páté kapitole, umístěným ve druhé části knihy, nazvané Lidé. To ovšem neznamená, že jde o podružné problémy, které může realizátor a provozovatel datového skladu pominout. Neobsahují však klíčové informace pro pochopení základních principů.

Vcelku kladné hodnocení publikace jako zdroje informací pro automatizační obor poněkud snižují nedostatky, se kterými se při čtení knihy setkáme. Některé můžeme přičíst na vrub originálu a česká verze je poté odráží. Kniha je mnohomluvná a systematičnost a jasnost výkladu nejsou jejími přednostmi. Na zajímavé a přínosné informace narážíme při četbě spíše náhodou. Obsah a název kapitoly se příliš často kryjí jen částečně. Malým příkladem je dílčí kapitolka s názvem Systémy pro rozhodování již vyhovují potřebám pro rozhodování, kde se dočteme, že „Většina systémů pro podporu rozhodování nicméně selhala a nesplnila do nich vkládaná očekávání“.

Určitý méně příznivý dojem velmi zesílil překladatel. Překlad není dobrý. Až příliš často jsou voleny nevhodné české termíny, které jsou navíc používány nesystematicky. Určitému pojmu je bez důvodu přiřazeno několik rozdílných termínů. Překladatel si nedal mnoho práce ani s respektováním skutečnosti, že české termíny se jen zřídka přesně kryjí s termíny anglickými. Příkladem je systematická náhrada anglického business českým obchod. Tento ekvivalent je zde vhodný jen ve velmi malém počtu případů. Podobných příkladů lze v knize nalézt mnoho.

Někdy má čtenář dojem, že překlad byl pořízen pomocí nějakého automatického překladače. Původní anglická věta často přímo vystupuje z jejího českého ekvivalentu. Některým větám lze správně porozumět jen tak, že si čtenář představí jejich původní anglickou podobu. Nezávisle na tom je i stylistická úroveň textu velmi nízká.

Jen namátkou lze uvést tyto příklady. Na str. 93 dole: „Jelikož až osmdesát procent každého projektu datového skladu může být věnováno na stranu back-end skladu, může být role manažera projektu jednou z nejvytíženějších rolí v projektu.“ Na str. 30: „...vyžadují pohled skrz obchodní data za účelem rozpoznání příležitostí, které mohou být zužitkovány“ a dále na téže stránce: “...obchodní manažeři zapadají zpět do frustrujících a časově náročných provozních dotazů výstupů již podporovaných provozními systémy ...“ Oříškem pro věcný i jazykový rozbor je příklad ze str. 35: „Pokusy sloučit jak rozhodovací, tak transakční informace vyžadující stejný systém správy či stejnou systémovou architekturu zvyšuje křehkost architektury IT a vede z hlediska správy systémů ke vzniku mnoha nočních můr.“ Hustota podobných „perel“ není v celém textu stejná, avšak nějaký jazykový nebo překladatelský prohřešek lze nalézt téměř na každé stránce.

Na vrub nakladatele lze připsat i dosti podstatná opomenutí. V knize např. není uveden seznam literatury. Odkazy na literaturu, s výjimkou internetových odkazů uvedených v příloze, jsou umístěny přímo v textu, a nelze si tedy o pramenech udělat ucelený obraz. Dále je opomenuto, že daný obor je již tradičně zatížen množstvím zkratek. Některé zkratky jsou vysvětleny na místě prvního použití. Avšak není tomu tak vždy; srozumitelnosti výkladu i orientaci v textu by velmi prospěl seznam použitých zkratek a jejich výstižné vysvětlení. Pro knihu tohoto typu je nezbytný také přehled použitých odborných výrazů s jejich stručným vysvětlením, tedy jakýsi stručný slovník použitých pojmů. Tím by se alespoň omezila snížená srozumitelnost výkladu, ovlivněná nadměrným používáním převzatých odborněslangových termínů (podlehneme-li beznaději a na kritiku tohoto nešvaru rezignujeme). V knize je i rejstřík, který by mohl alespoň z části kompenzovat zmíněné nedostatky. Není však sestaven příliš pečlivě. Odkazy často vedou na místa, kde se daný termín sice vyskytuje, ale nevysvětluje. Příkladem je zkratka OLAP: odkaz z rejstříku zájemce o vysvětlení směruje na její téměř nic neříkající výskyt, třebaže srozumitelný výklad je uveden na jiném místě (a má-li čtenář šťastnou ruku, může ho nalézt). Některé položky rejstříku jistě upoutají čtenářovu pozornost, jako např. měření výsledků. Na str. 58 se dočteme, že se zřejmě jedná o vyhodnocení přínosu datového skladu. A kruh se uzavírá – jsme opět u kvality překladu.

Po přečtení knihy se můžeme tázat, zda na světovém trhu informací o datových skladech není kvalitnější publikace, která by si zasloužila převedení do češtiny. Jestliže tomu tak není, naskýtá se otázka, zda prospějeme věci, když nedokážeme knihu převést do našeho jazyka alespoň tak, jak byla předložena anglickému čtenáři. Zcela mimo diskusi je otázka, jak tím prospějeme našemu rodnému jazyku a v úzké souvislosti s tím i odborné a nakonec i jazykové úrovni jeho uživatelů.

Uvedená kritika nemá za cíl překrýt základní přínos uveřejnění recenzované knihy. Specialista v oboru IT jistě snáze přehlédne mnohé nedostatky a vyrovná se s nimi. Pro specialistu v automatizačním oboru je kniha potřebným zdrojem informací nezbytných alespoň pro tuto chvíli. Můžeme mu pročtení knihy doporučit a ujistit ho, že se úskalími, na která jsme se ho snažili touto recenzí upozornit, vyplatí proplout. Pokud se nad našimi připomínkami zamyslí překladatel s nakladatelem, bude účel recenze splněn dvojnásobně.

doc. Ing. Jiří Cendelín, CSc.

Inzerce zpět