|
A szövegbányászat a tudásmenedzsment egyik
leghatékonyabb információtechnológiai eszköze. Tudásalapú
technológia, amely képes a mesterséges intelligencia, a gépi
tanulás, a természetes nyelvi feldolgozás, a
nyelvtechnológia, a többváltozós matematikai statisztika, a
valószínűségszámítás, a tartalomelmélet és még jónéhány
tudományág legfrissebb eredményeinek produktív
hasznosítására. A szövegbányászat segítségével olyan rejtett
ismeretanyag nyerhető ki strukturálatlan szöveges dokumentum
állományokból, amelyek kinyerése egyrészt emberi erővel
kivitelezhetetlen lenne, másrészt pedig olyan tudásvagyont
képvisel, amelyből rövid úton üzleti versenyelőny
kovácsolható. Az adatbányászat analógiájára a
szövegbányászat nem pusztán információ visszakeresési
kihívásokkal küzd meg (mindamellett természetesen a szöveges
információ visszakeresés is jelentős részterülete), hanem
alkalmazásával látens összefüggések, rejtett ismeretanyag és
újdonságérték birtokába juthatunk. Míg az adatbányászat
esetében alapvetően struktúrált számszerű információk
alapján tárunk fel trendeket, összefüggéseket, addig a
szövegbányászat során strukturálatlan szöveges
dokumentumokból nyerünk ki olyan ismereteket, amelyet ember
számára érthető formában kell tudnunk megjeleníteni.
A szövegbányászat portál célja, hogy a
szövegbányászat elsősorban de nem kizárólag hazai
vonatkozásait összefoglalva naprakészen, hitelesen és
kellően informatívan tájékoztatást adjon az érdeklődők
számára a tudományterület helyzetéről és lehetőségeiről.
Hazánk innovációs lehetőségeit figyelembevéve a
szövegbányászat egy olyan terület lehet, amelyben képesek
lehetünk nemzetközi szinten is kiemelkedő teljesítményt
nyújtani. A terület meglehetősen tudásintenzív, igen mély
matematikai, statisztikai, nyelvtechnológiai és mesterséges
intelligencia irányú ismeretek szükségesek műveléséhez. Nem
véletlen, hogy eddig még nem terjedt el széles körben az
üzleti alkalmazása. A trendek viszont már Magyarországon is
mindenképpen érzékelhetőek. A tudásmenedzsment fontosságát
felismerő vállalatok a szövegbányászat kezdetleges
részterületeit már jelenleg is alkalmazzák mindennapi
üzletmenetük során, és a piac további jelentős bővülésnek
néz elébe, elsősorban a szövegbányászat tudásintenzívebb és
nagyobb hozzáadott értéket produkáló funkcióinak
bevonásával.
A szövegbányászat gyakorlati alkalmazási
területei közül néhány álljon itt példaként:
- automatizált online üzleti hírszerzés
és versenytárs elemzés;
- online piacfigyelés és felmérés;
- blog elemzés fogyasztói magatartás
modellezése céljából;
- perszonalizált online hírfigyelés;
- automatikus nagyvállalati dokumentum
klaszterizáció;
- online fogyasztói magatartás
modellezés és predikció weblog elemzés alapján;
- intelligens könyvtári és elektronikus
könyvtári rendszerek;
- természetes nyelvi felismeréssel
támogatott automatizált CRM;
- újdonság detekció és verzió tracking
szöveges verzióláncokban;
- szemantikailag támogatott ismeret
kinyerés;
- intelligens, jelentés orientált és
szakértői keresőrendszerek;
- szakértői rendszerek automatizált
tanítása szövegből történő ismeretkinyeréssel;
- tartalom szempontú veszteségmentes
információ tömörítés (lényegkiemelés).
A szövegbányászat kínálta lehetőségek
tárháza igen széles. A szövegbányászat portál üzemeltetői
arra vállalkoztak, hogy ezeket a lehetőségeket és a
szövegbányászat témájú hasznos információkat az érdeklődők
számára egy ismeretterjesztési szerepet felvállalva
naprakészen elérhetővé teszik.
Vázsonyi Miklós
BME
Információ- és Tudásmenedzsment Tanszék |