|
Настройки: Разшири Стесни | Уголеми Умали | Потъмни | Стандартни
ЗАКЛЮЧЕНИЕ Сия Колковска web | Модели на концептуално-семантичните отношения... Поради приложния характер на работата постигнатите в нея резултати са измерими и оценими главно с оглед на непосредственото им практическо приложение. В този смисъл основното постижение на работата е създаването на методика за автоматично разпознаване на концептуално-семантични отношения в химически текстове в българския език. Това е най-значимият и важен резултат от работата поради няколко причини. На първо място, поради актуалността на автоматичното разпознаване на концептуално-семантични отношения, обуславяща се най-вече от възможните многобройни приложения на автоматично разпознати отношения в различни области. На второ място, поради факта, че този проблем не е разработван по отношение на българския език. Приложената тук методика е първата методика за автоматично разпознаване на концептуално-семантични отношения в българския език и една от малкото, предназначена за автоматично разпознаване на лексикални единици в нашия език1. Ядро на методиката представлява модулът от 88 групи модели на концептуално-семантичните отношения (прилагани като регулярни изрази). Най-важният показател за ефективността на тези модели (респ. на методиката) са постигнатите много добри резултати на автоматичното разпознаване чрез тях: точност 94,7 %, пълнота 80,3 %, средна ефективност 86,7 %. Тези данни са обективни и достатъчно красноречиви, така че не се нуждаят от коментар. Като постижение на работата може да се посочи и това, че създаденият модул от модели на концептуално-семантични отношения е ориентиран към широко приложение и същевременно е достатъчно гъвкав, за да го позволи. В него влизат както модели, общи за много специални области, така и специфични модели, приложими само в химическата област. Възможно е този модул да бъде използван за автоматично разпознаване на концептуално-семантични отношения и в други специални области, различни от химическата - най-вече свързаните с природните науки. За тази цел е достатъчно да бъдат отстранени моделите със специфично приложение. Възможностите за по-широко приложение на модула от конструирани модели се определят и от това, че той може да бъде пригоден за автоматично разпознаване на концептуално-семантични отношения в електронни речници. Сред важните резултати, постигнати в работата, се нарежда и създаденият оригинален подход за конструиране на моделите на концептуално-семантичните отношения. Като основа са използвани два известни в компютърната лингвистика метода за разпознаване на концептуално-семантични отношения: 1) лингвистичните методи, базирани на модели (правила) и 2) метод за предварително конструиране на моделите. За да доведат обаче тези методи до конструиране на модели на концептуално-семантичните отношения, е приложен собствен подход, изразяващ се 1) във въвеждане на три типа модели: типови, първични и вторични, и 2) в създаване на конкретни процедури за извеждане на всеки един от типовете модели. Тези процедури почиват на обективни основания (а не на интуиция). Конструираните чрез тях модели отразяват, от една страна, същността на съответното отношение (при типовите модели), а от друга - лексикалните и граматични възможности на българския език за създаване на вариантни и производни конструкции (при първичните и вторичните модели), следствие от които е формалното разнообразие от езикови изкази на КСО. Чрез създадения подход се постига не само конструиране на моделите на обективна основа, но и се гарантира обхващането на типичните и най-честите вариации в езиковия изказ на концептуално-семантични отношения, което от своя страна е условие за разпознаването на голяма част от техните появи в текста. Въпреки приложния характер на работата в нея се получават и някои резултати с теоретичен характер. Успоредно със създаването на методиката се достига до нови знания за самите отношения, които са обект на разпознаване. При следвания подход за конструиране на типовите модели неизбежно се засяга въпросът за същността на разпознаваните тук концептуално-семантични отношения. Така се хвърля светлина върху природата най-вече на някои от по-малко изследваните отношения като напр. каузативните и функционалните. В работата се въвежда и ново концептуално-семантично отношение - източник-продукт, което се отнася към отношенията, специфични за отделни специални области. С въвеждането му се обогатява инвентарът от отношения, разграничавани в терминологията. Автоматичното разпознаване на КСО ни дава възможност за интересни наблюдения върху проявите на отделните отношения в текста, на базата на които може да се достигне до заключения, значими в теоретичен план. Едно от тези заключения, направено въз основа на регистрираната честота на отделните концептуално-семантични отношения, се отнася до значимостта на всяко едно от тях в химическата област. Наблюденията върху проявите на концептуално-семантичните отношения в химическата подсистема ни дават възможност да вземем отношение по един важен въпрос, поставен от Сейгър. Той се отнася за това, дали има други отношения освен общоизвестните (родово-видовите и партитивните), които са общи за всички специални области. Опитът ни с химическите текстове ни убеждава, че такива отношения има и сред тях са функционалните и каузативните. Разбира се, с казаното дотук не се изчерпват възможностите за теоретично осмисляне на извършените тук наблюдения. Това осмисляне е въпрос на бъдещето. И накрая трябва да се подчертае, че създадената методика е само едно начало. Тя подлежи на усъвършенстване и доразвиване. На първо време, както се каза, тя ще бъде интегрирана в методиката за автоматично разпознаване на термини, която е обект на следваща разработка. Възможно и дори желателно е усъвършенстването й и в още едно отношение - чрез комбиниране с други (статистически и др.) методи, което несъмнено би довело до подобряване показателите на автоматичното разпознаване. Надяваме се, че представената тук работа ще бъде последвана и от други разработки върху българския език в тази много перспективна и обещаваща научно-приложна област.
БЕЛЕЖКИ 1. Както се каза, тя се предшества от създадената в рамките на проекта Бултрибанк методика за автоматично разпознаване на собствени имена (вж. Осенова, Колковска 2002). [обратно]
© Сия Колковска
|