Версия для печати

Словари пересортированной лексики (обратные, частотные)

Главная > Лингвистика > Лексикология > Лексикография > Пересортированные словники

Сортировки слов - их виды (морфологическая, статистическая...) и цели.

Разделы страницы о составления словарей различных видов сортировки:


Статистическая сортировка словофонда

Сортировка слов по употребляемости и назначение частотных словарей

Словарный формат описания приложим не только к области значений слов, но и к другим сторонам функционирования лексической системы. В частотных словарях указывается частота употребления слов в специально сформированной представительной выборке текстов.

Часто́тный слова́рь (или частотный список) — набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости. Словарь может быть отсортирован 1) по частоте, 2) по алфавиту (тогда для каждого слова будет указана его частота), 3) по группам слов (например, первая тысяча наиболее частотных слов, за ней вторая и т. п.), 4) по типичности (слова, частотные для большинства текстов), и т. д.

Частотные списки используются для 1) преподавания языка, 2) создания новых словарей, 3) приложений компьютерной лингвистики, 4) исследований в области лингвистической типологии, и т. д.

Частотные словари широко используются в сфере прикладной лингвистики. Данные о частотности употребления необходимы, например, при установлении авторства текста. Важны данные о наиболее частотных словах и при разработке компьютерных программ проверки орфографии.

Обычно частотные словари строятся на основе корпусов текстов: берется набор текстов, представительный для языка в целом, для некоторой предметной области или данного автора (см. Частотный словарь Грибоедова) и из него извлекаются словоформы, леммы и части речи (последние извлекаются в случае, если корпус имеет морфологическую разметку).

Наиболее очевидной задачей частотного словаря яляется его вспомогательная роль при составлении двуязычного словаря различного объёма, в первую очередь, базовых словарей и словарей языковых минимумов (различных "топов" - Top'500, Top'1000 ...). Также частотный словарь может понадобиться для начального этапа составления идеографического словаря, т.к. сначала нужно семантически расклассифицировать базовый словарь языка.

Примером частотного словаря является Словарь Шарова.

Сетевые ресурсы о частотных словарях

Библиография по методам составления частотных словарей

Также смотрите литературу о частотных словарях русского языка.

Морфологическая сортировка словофонда

Обратная сортировка слов и обратные словари

Алфавитная сортировка слов в обратном порядке позволяет выделить окончания и суффиксы родных и заимствованных слов. Это помогает составлению морфологических схем - реляционных (словоизменительных) и деривационных (словообразовательных), что необходимо для создания морфологических словарей.

Примером морфологического является Словарь Тихонова. А вот - пример обращённого словаря Зализняка.


Главная > > Лексикография:

Авторская | Историческая | Пересортированная | Семантических классов | Семантических отношений | Морфемная Толковая

Семантика | Терминология | Этимология | Ономастика | Фразеология | Книги по ономастике | Книги о слове и смысле | Иностранные словари

На правах рекламы (см. условия): [an error occurred while processing this directive]    


© «Сайт Игоря Гаршина», 2002, 2005. Автор и владелец - Игорь Константинович Гаршин (см. резюме). Пишите письма (Письмо И.Гаршину).
Страница обновлена 22.03.2024
Яндекс.Метрика