Rendszerintegráció fogalma
A rendszerintegráció szó jelentése az adatbázis kezelés, programozás témakörében merül fel és egy mára már rendszeres igény nagyobb adatbázisok kezelésénél. Adva van két heterogén rendszer a saját adataival, ezek infrastruktúráját kapcsoljuk össze a rendszerintegráció folyamán. Ez persze leírva sokkal könnyebben hangzik, a valóságban ez egy gondosan tervezett és olykor igen hosszas folyamat. Az integrációt magát megelőzi az infrastruktúra pontos felmérése, miféle adatokról van szó, ezeket hogyan tárolják, mi a felépítés, stb. Az integrációt tervezése a következő fázis, ahol kitalálják egyrészt a végcélt, hogyan épül fel, mi módon lesz hozzáférhető, másfelől ennek megvalósítását is, mik lesznek azok a lépések, amelyek végeredményeképp elérhető a teljes integráció. Ezt persze végül tesztelni is kell, csak azután következhet az üzemi próba. A rendszerintegrátor feladata ezeket a folyamatokat végigvinni és kivitelezni.
A rendszerintegráció szükségessége
A nyolcvanas évek táján kezdett egyre gyakrabban felmerülni az igény az üzleti életben, hogy nagyobb rendszereket kapcsoljanak össze. Például, ha két cég adatbázisát szeretnénk egyesíteni, a két infrastruktúrát rendszerintegráció révén tudjuk csak egy platformon vizsgálni. Ez előfordulhat, mondjuk olyan csatolt szolgáltatások esetén, amiket valójában két külön cég két külön forrásból bocsát rendelkezésünkre, de egyben értékesítik nekünk. Mondjuk egy utazási csomag, ami repülőjegyet és szállásfoglalást is tartalmaz. A másik terület, mikor a rendszerintegráció nagy szolgálatot tehet, az a tudományos élet. Adva van két kutatási terület vagy pusztán csak két kutatási rendszer, és a kettő eredményeinek együttes vizsgálatával szeretnénk nagyobb összefüggéseket vizsgálni. Szükségszerű ebben az esetben az adatok összekapcsolása, hogy aztán a felhasználók egyetlen egységes platformon és megjelenítésben férhessenek hozzá az adatbázishoz. A rendszerintegráció tehát az elmúlt harminc évben egy alapigénnyé nőtte ki magát, s noha történtek előrelépések az eljárások egyre fejlettebbé váltak, mégis újabb és újabb problémákba ütköznek bele a szakma legjobbjai.
A rendszerintegráció első szárnypróbálgatása
Az amerikai Minnesotai Egyetem volt az első, aki nekiveselkedett a rendszerintegráció akkor még feltérképezetlen feladatának. Integrated Public Use Microdata Series, azaz IPUMS néven fejlesztettek ki egy rendszert, amely a mára adatraktározásként elhíresült eljárást alkalmazta. A fejlesztés sikeresen bebizonyította, hogy a rendszerintegráció igenis lehetséges korlátlanul nagy adatbázisok esetén is és ezek az infrastruktúrák nem elszigetelt elemek, átjárhatóságuk révén új megközelítést nyerhetnek az eddigi kutatási eredmények is. A „warehousing” azaz adatraktározás az úgynevezett ETL folyamat szerint épül fel: extract, transform, load. Magyarul tehát: adatok kinyerése, átformálása és feltöltése. Ez nagyvonalakban az első rendszerintegráció eljárása, amely nagy lépés volt ugyan, de hamar megmutatkoztak a korlátai is. Mivel a folyamat részeként az adatokat magukat is átmozgatjuk, így az tagadhatatlan, hogy azonnal elérhetők és kikereshetők az integrált rendszerben. Viszont kifejezetten rugalmatlanok. Valahányszor az eredeti adatbázis frissül, az egész ETL folyamatot újra végig kell vezetni. Ez időigényes és esetenként költséges szélmalomharc lehet. A másik szembetűnő hátránya, ha az eredeti adatbázis nem bocsáthat teljes hozzáférést a rendelkezésünkre. Pláne idén, mikor a GDPR kifejezés berobbant a köztudatba, könnyen el tudunk képzelni olyan adatokat, amiket a cég nem bocsáthat harmadik fél rendelkezésére, sőt, ha mi azt kérjük, képesnek kell lennie, frissíteni és törölni az adatainkat. Ez egy adatraktározás elvén alapuló rendszerintegráció esetén kifejezetten sziszifuszi feladat. A fenti árukapcsolásnál maradva, ha egy repülőtársaság és egy utazási iroda akarja egyesített adatbázisaikat a felhasználók rendelkezésére bocsátani egy csomagajánlat formájában, annak a rendszernek rugalmasnak kell lennie. Az árak és kapacitás naponta többször változik, ezt nem lehet ETL folyamatokkal megoldani.
A rendszerintegráció napjainkban
Ezekre a problémákra érkezett válaszként az a 2009 óta megfigyelhető trend, mikor az infrastrukturális elemeket sokkal lazábban kapcsolják össze, és inkább az adatok valós idejű hozzáférhetőségén alapszik az új felület fejlesztése. A fő különbség tehát, hogy az adatokat nem szükséges átmozgatni a rendszerintegráció során egy teljesen új platformra. Ehelyett a felület „visszanyúl” a heterogén rendszerekben és mindig az éppen friss adatokat bocsátja rendelkezésre. Ez sok lehetőséget nyújt a rendszer formálására, a különböző elemeket váltogathatjuk, frissíthetjük, a fontos csak az, hogy a kapcsolódás rendben legyen, és ne vesszen el. Ezzel a módszerrel már egészen új kihívások jelentek meg, és ez általában az adatok milyenségéből ered már, nem a strukturális elrendezésből. Az összemérendő adatok ugyanabban a formátumban kell legyenek és egy egy fogalmat következetesen kell megválasztanunk, hogy a két adatbázis összehasonlítható maradjon. Ennek érdekében előfordul, hogy a rendszerintegráció során bizonyos bázis számokat keresnek két rendszer között és ezekhez képest állapítják meg a mérési eredményeket. Ugyanez a probléma fogalmak terén is előfordul. Azonos kifejezések eltérő értelmezése esetén úgynevezett ontológiákat állapítanak meg, hogy a szemantikai problémák kikerülhetők maradjanak. Az adatkezelések azonban a mai napig újabb és újabb megoldatlan kihívásokba ütköznek, így ez a folyamatosan fejlődő szakma mindig nyitott az új megoldásokra.