Лексикографічна структура семантичного словника в моделях класу "Смисл -> текст", Детальна інформація
Лексикографічна структура семантичного словника в моделях класу "Смисл -> текст"
Для позначення парадигматичних варіантів та синтагматичних партнерів слова ще використовується термін “лексичні кореляти”.
Залежності, які зв’язують слова з їх лексичними корелятами описується за допомогою лексичних функцій. Лексичні функції, як правило, позначаються абревіатурами, що утворюються від латинських слів.
Наприклад, функція, що відповідає смислу “дуже”, позначається Magn – від латинського magnus – “великий”, функція Syn – синонім слова.
Magn (брюнетка) = жагуча. Syn (арештовувати) = затримувати.
Magn (знати) = напам’ять.
Тлумачно-комбінаторний словник.
Тлумачно-комбінаторний словник (ТКС), який буде розглядатися, є складовою частиною системи автоматизованого перекладу. Будемо розглядати спрощений варіант моделі “Смисл (Текст”. В цьому варіанті буде всього три рівня формального представлення речень: морфологічний, поверхово-синтаксичний та глибинно-синтаксичний.
Морфологічний компонент системи забезпечує перехід (встановлення відповідності) “Речення ( МС”. Під МС розуміємо послідовність імен лексем, що входять в речення, при цьому імені кожної лексеми приписана певна граматична характеристика.
Поверхнево-синтаксичний компонент забезпечує перехід “МС ( ПСС”. Під ПСС розуміємо дерево залежностей, вузли котрого відмічені іменами лексем, які забезпечені наборами семантично змістовних граматичних характеристик, стрілки котрих відповідають одному з специфічних для даної природної мови поверхнево-синтаксичних відносин.
Глибинно-синтаксичний компонент забезпечує перехід “ПСС ( ГСС”. Під ГСС розуміємо дерево залежностей, вузли котрих можуть бути відмічені іменами конкретних лексем чи фразем та двох типів фіктивних лексем: іменами потенційних (фіктивних) слів, які у данній мові неможливі, та іменами глибинно-синтаксичних слів, які репрезентують на глибинному рівні смисл семантично змістовних поверхнево-синтаксичних відносин.
Весь процес перекладу складається з таких основних етапів:
Речення => МС
МС => ПСС аналіз
ПСС => ГСС
ГССвхід => ГССвихід власне переклад
ГССвихід => ГССпохід перефразування
=> ПСС
ПСС => МС синтез
МС => Речення
На всіх етапах, за винятком першого та останнього, необхідно звертатися до ТКС, який, таким чином, виявляється вельмисуттєво зв’язаним з граматичним компонетом системи, являючи з нею один (інтегральний) опис мови. Тому для успішної роботи системи необхідно мати максимально узгоджені один з одним граматику і словник. Це дуже складно зробити, бо цей словник має вміщувати, як можна більше інформації про мову, але без такого словника автоматизований переклад (саме ПЕРЕКЛАД) буде неможливий.
Словарна стаття ТКС являє собою підмножину деякої множини зон, у котрих записується інформація про відповідні властивості лексичних одиниць. Кожна зона, за винятком першої, вводиться своєю поміткою – абревіатурою з прописних латинських букв, з двокрапкою. Ось ці зони:
Вхід – порядковий номер та ім’я лексичної одиниці, з номером омоніма та номером значення;
TRANS – переклад:
DEF – тлумачення лексичної одиниці в термінах лексичних функцій;
POR – частина мови;
LIM – морфологічні, синтаксичні та обмеження, що поєднуються, на дане значення слова, на безумовний зворот чи на слово у складі фраземи;
SYNT – синтаксичні ознаки;
DES – дескриптори (семантичні ознаки);
GOV – синтаксичні ознаки та дескриптори типового синтаксичного власника;
MG – модель чи моделі керування;
Залежності, які зв’язують слова з їх лексичними корелятами описується за допомогою лексичних функцій. Лексичні функції, як правило, позначаються абревіатурами, що утворюються від латинських слів.
Наприклад, функція, що відповідає смислу “дуже”, позначається Magn – від латинського magnus – “великий”, функція Syn – синонім слова.
Magn (брюнетка) = жагуча. Syn (арештовувати) = затримувати.
Magn (знати) = напам’ять.
Тлумачно-комбінаторний словник.
Тлумачно-комбінаторний словник (ТКС), який буде розглядатися, є складовою частиною системи автоматизованого перекладу. Будемо розглядати спрощений варіант моделі “Смисл (Текст”. В цьому варіанті буде всього три рівня формального представлення речень: морфологічний, поверхово-синтаксичний та глибинно-синтаксичний.
Морфологічний компонент системи забезпечує перехід (встановлення відповідності) “Речення ( МС”. Під МС розуміємо послідовність імен лексем, що входять в речення, при цьому імені кожної лексеми приписана певна граматична характеристика.
Поверхнево-синтаксичний компонент забезпечує перехід “МС ( ПСС”. Під ПСС розуміємо дерево залежностей, вузли котрого відмічені іменами лексем, які забезпечені наборами семантично змістовних граматичних характеристик, стрілки котрих відповідають одному з специфічних для даної природної мови поверхнево-синтаксичних відносин.
Глибинно-синтаксичний компонент забезпечує перехід “ПСС ( ГСС”. Під ГСС розуміємо дерево залежностей, вузли котрих можуть бути відмічені іменами конкретних лексем чи фразем та двох типів фіктивних лексем: іменами потенційних (фіктивних) слів, які у данній мові неможливі, та іменами глибинно-синтаксичних слів, які репрезентують на глибинному рівні смисл семантично змістовних поверхнево-синтаксичних відносин.
Весь процес перекладу складається з таких основних етапів:
Речення => МС
МС => ПСС аналіз
ПСС => ГСС
ГССвхід => ГССвихід власне переклад
ГССвихід => ГССпохід перефразування
=> ПСС
ПСС => МС синтез
МС => Речення
На всіх етапах, за винятком першого та останнього, необхідно звертатися до ТКС, який, таким чином, виявляється вельмисуттєво зв’язаним з граматичним компонетом системи, являючи з нею один (інтегральний) опис мови. Тому для успішної роботи системи необхідно мати максимально узгоджені один з одним граматику і словник. Це дуже складно зробити, бо цей словник має вміщувати, як можна більше інформації про мову, але без такого словника автоматизований переклад (саме ПЕРЕКЛАД) буде неможливий.
Словарна стаття ТКС являє собою підмножину деякої множини зон, у котрих записується інформація про відповідні властивості лексичних одиниць. Кожна зона, за винятком першої, вводиться своєю поміткою – абревіатурою з прописних латинських букв, з двокрапкою. Ось ці зони:
Вхід – порядковий номер та ім’я лексичної одиниці, з номером омоніма та номером значення;
TRANS – переклад:
DEF – тлумачення лексичної одиниці в термінах лексичних функцій;
POR – частина мови;
LIM – морфологічні, синтаксичні та обмеження, що поєднуються, на дане значення слова, на безумовний зворот чи на слово у складі фраземи;
SYNT – синтаксичні ознаки;
DES – дескриптори (семантичні ознаки);
GOV – синтаксичні ознаки та дескриптори типового синтаксичного власника;
MG – модель чи моделі керування;
The online video editor trusted by teams to make professional video in
minutes
© Referats, Inc · All rights reserved 2021