Людина та Компьютеp, Детальна інформація

Людина та Компьютеp
Тип документу: Реферат
Сторінок: 9
Предмет: Комп`ютерні науки
Автор: фелікс
Розмір: 53.9
Скачувань: 1010
Специфіку цього підходу складає його семантичне спрямування: при автоматичному перекладі необхідно з самого початку добувати з тексту і фіксувати певним чином його смисл, який потім повинен виражатися засобами вихідної мови. В якості основного засобу зображення смислових зв’язків між словами пропонується кореляція, або зв’язок. Кореляційний синтаксис відрізняється від традиційного головним чином тим, що вся увага в ньому зосереджується на окремих словах, а не на класах слів. В кореляційному синтаксисі слову приписується набір індексів, кожний з яких відображає здатність даного слова утворювати певну кореляцію з іншим словом, що має той самий індекс кореляції. Це дозволяє відразу ж відкинути багато комбінацій слів і словосполучень, які можуть бути правильними з точки зору граматики, але безглузді з точки зору семантики. Метод кореляційного аналізу використовує багато різних “синтакисчних функцій”. Як наслідок цього синтаксичних індексів при кожному слові більше, ніж ознак традиційної класифікації. При такому збільшенні вихідних даних кількість елементарних операцій, потрібних для синтаксичного аналізу, дуже зростає. Наприклад, нехай деякому слову приписано 50 кореляційних індексів. Для того, щоб скласти кореляцію, машина повинна порівняти кожний індекс першого слова з кожним індексом другого, тобто виконати 2500 порівнянь. Якщо тепер пара слів, вже пов’язаних в кореляцію, буде рекласифікована, тобто отримає нові можливості вступати в кореляції, то їй буде приписана нова серія з 50 індексів. Така пара потребує в свою чергу 2500 порівнянь з наступним словом або такою ж парою. Для аналізу речення середньої довжини при такому підході знадобилось би сотні тисяч порівнянь кореляційних індексів. Проте попередні дослідження показали, що можна досягти значного зменшення кількості порівнянь, якщо враховувати, наприклад, порядок слів в кореляціях. Намагання зменшити кількість операцій і породило систему “Мультістор”.





Кореляційний аналіз.

Корелятор – мовний вираз деякого відношення. Слова будь-якої мови можна розподілити на два типи: 1) слова, що позначають певні смислові відношення між об’єктами та 2) слова, що позначають самі ці об’єкти. Слова першого типу називають єкспліцитними кореляторами, а слова другого типу – простими словами або кореляндами. Коли відношення не має для свого виразу спеціального слова, говорять про імпліцитні корелятори. Кореляція з імпліцитним корелятором складається з двох слів. Наприклад, “дівчинка співає” – тут смислові відношення виражені за допомогою морфологічних характеристик , а саме, особова форма дієслова показує, що дія, позначена дієсловом, виконується в даному випадку дівчінкою. Кореляція з експліцитним корелятором повинна містити щонайменше три слова. Наприклад, в словосполученні “червоний та чорний” експліцитним корелятором виступає сполучник та. Перше та третє слово називаються корелятами.

Для зображення кореляцій використовується графічне представлення.

1 – місце першого корелята, 2 – місце другого корелята, 3 – місце корелятора.

Кореляція “green bottle”.

521 – індекс того імпліцитного корелятора, якому в традиційній граматиці відповідає синтаксична функція “прикметник, що є означенням іменника”.

В кореляціях дуже важливим є порядок слів, тому недостатньо в словарних статтях вказувати лише індекси кореляцій, в яких слово може приймати участь, необхідно вказувати також порядкове місце слова в кореляції. Так, словарні статті слів bottle та green повинні містити таку інформацію:

Корелят Ic – індекс кореляції CF – значення кореляційної функції

Bottle Ic 521 CF2

Green Ic 521 CF1



При експліцитному корелятору графічне представлення буде таке:

Фрагмент словника для цих двох словосполучень буде мати вигляд:

Корелят Ic – індекс кореляції CF – значення кореляційної функції

Bottle Ic 521 CF2

Green Ic 521

Ic 014

Ic 014 CF1

CF1

CF2

And Ic 014 CF3

Blue Ic 521

Ic 014

Ic 014 CF1

CF1

CF2



The online video editor trusted by teams to make professional video in minutes