Кому и зачем нужен «Лексикограф»?
Система «Лексикограф» – это семантический словарь, представленный в виде базы данных.
Современная лингвистическая семантика исходит из того, что лексика (как и другие уровни – грамматика, фонетика языка) устроена как система. В основе лексической системы языка лежат повторяющиеся смысловые компоненты (такие как ‘знать’, ‘видеть’, ‘двигаться’, ‘причина’, ‘предмет’) и параметры лексического значения – такие как категория, тематический класс, участник обозначаемой ситуации, таксономический класс участника.
Ни одно слово в языке не равно другому – ни по смыслу, ни по сочетаемости или каким-либо другим признакам. Однако большая часть этих индивидуальных различий определяются смысловыми компонентами и параметрами, которые повторяются – одни в десятках, другие в сотнях и тысячах слов.
Языковое поведение слова – возможные сочетания с другими словами, наличие тех или иных грамматических форм и значение этих форм, ударность /безударность во фразе – в существенной степени предопределено его значением. Скажем, у несов. вида глагола тереть есть актуально-длительное значение, а у терять – нет; грамматическая форма повелительного наклонения трите! от тереть имеет нормальное значение побуждения к действию, а теряйте! от терять – нет. И это объясняется различием в категории: тереть – действие, а потерял – это происшествие, то, что с человеком случилось. Параметры и компоненты задают классы слов, сходных в своем языковом поведении.
Осознав зависимость языкового поведения слова от значения, лингвист сталкивается, однако, с тем, что у слова, как правило, бывает не одно значение, а несколько: многозначность в природе языка. Причем именно параметры и повторяющиеся компоненты являются теми аспектами значения, которые в наибольшей степени подвержены изменению. Поэтому разные значения одного и того же слова часто различаются параметром. Так, застилать стол скатертью – действие, а слезы застилают глаза – состояние; глагол требовать, который относится к речевым, в контексте Машина требует ремонта переходит в класс модальных, т.е. меняет тематический класс; стучать в Ветер стучит ставней – глагол звука, а в Открой, кто-то стучит – информационный.
Эта двоякая роль параметров закономерна. Дело в том, что многозначность (имеется в виду регулярная многозначность по Ю.Д.Апресяну, т.е. полисемия) представляет собой (или может быть представлена как) сдвиг значения; и сдвиги значения тоже происходят системно: слова с одинаковым значением тех или иных параметров подвержены одинаковым сдвигам. Поэтому параметры различают не только разные слова, но и разные значения одного слова.
Традиционные словари указывают для слова список отдельных значений. Современная семантика тоже работает, в основном, с отдельными значениями, пренебрегая семантическим единством слова. Возникает задача воссоздать это единство. Исходя из этого, система «Лексикограф» ставит перед собой две связанные между собой задачи:
- представить каждое данное значение слова так, чтобы получили объяснение особенности языкового поведения слова в данном его значении;
- показать, как значения слова связаны друг с другом, т.е. построить иерархию значений слова или даже парадигму значений, общую для определенного класса слов. «Лексикограф» – не просто словарь, а база данных.
Это соответствует исходной установке на формализацию представления значения. Параметры и смысловые компоненты – это основные инструменты формализации. Система «Лексикограф» имеет экспериментальную направленность. Словник ни в коей мере не претендует на полноту. Система предлагает форматы представления основных типов значений слов, и пользователь может, имея базу в своем распоряжении, пополнять ее новыми словами, опираясь на имеющиеся форматы как образцы. Мы предлагаем не только данные, но и инструменты, предназначенные для использования на новом материале.
Готовая версия системы посвящена русскому глаголу.


