Версия для печати

Авторские решения по компьютерной лингвистике

Главная > Лингвистика > Прикладная лингвистика > Авторские алгоритмы и структуры

Научные статьи автора: Галактические года | Золотоносная сеть | Ритм миграций | Геофизика пассионарности | Дуплетный генкод | Законы орбит | Небесные теонимы
Технологические разработки автора (см. CV): Репликация распределённой БД Oracle | Рубрикация сетевой информации | Веб-мониторинг трубопровода по SCADA


Алгоритмы

Авторский список необходимых алгоритмов анализа текста и речи:


Алгоритмы машинного разбора и дешифровки текста

Системный анализ текста

Системный анализ текста необходим для более точного определения количества знаков и фиксации их разновидностей. Если бы существовали такие программы, давно бы было расшифровано карийское письмо.

Благодаря таким программам мы бы продвинулись и в расшифровке этрусских текстов, т.к. имеется вероятность, что часть их написана не на этрусском языке, а, например, на обычном греческом, но трудно читаемым из-за неприспособленности этрусского алфавита к греческому и из-за традиционных сокращений, присущих предыдущим слоговым эгейским системам (критское линейное письмо Б, кипрские слоговые письменности).

Морфологический и синтаксический разбор текста

Грамматический разбор текста эффективен при наличии больших текстов. В частности, поможет при дешифровке многих эгейских слоговых письменностей, а также письменности острова Пасхи (кохау-ронгоронго).

Фонетический разбор текста

Программы комплексного анализа текстов

Алгоритмы сравнения/опознавания единиц текста и речи

[Данные процедуры могут быть основаны на алгоритмах нечеткого сравнения, необходимых для распознавания слуховых, зрительных и ментальных образов.]

Нечёткое сравнение подстрок для выявления морфем

Обработка наборов слов пакетом Оракла UTL_MATCH

Компаративистские алгоритмы (сравнение лексики разных языков)

[Это направление КЛ занимается созданием обработчиков как этимобаз, так и корпусов текстов.]

Этимологические базы и методы компаративистики смотрите на странице Компаративистика.

Автоматизация сравнения и опознавания знаков и образов (лингвистическая кибернетика)

Анализ формы знаков (визуальное опознание и сравнение)

Сравнение звучания слов (акустическое распознавание, анализ и синтез речи)

Алгоритмы поиска информации по смыслу

Однажды хотел в подарок купить книгу, которая уже у меня была, но название подзабыл. Обращался в книжные магазины с запросом "Корейский алфавит легко и просто" - результат нулевой. Пришёл домой и посмотрел название: "Корейская азбука легко и весело". Мне, действительно, стало весело,а, главное, поучительно, т.к. извлёк целых 2 урока для будущего семантического механизма поиска:

  1. при поиске нужно учитывать синонимы (и, при необходимости, менять согласование слов) - в нашем примере не "алфавит", а "азбука", не "корейский", а "корейская";
  2. при перечислении слов одной части речи (в нашем случае - наречия "легко" и "весело") нужно учитывать, что одно из них может быт другим - и не обязательно синонимичным (хотя удалённая синонимичность более вероятна).

Главная
Прикладная лингвистика: Компьютерная лингвистика | Структурная лингвистика | ИС по матлингвистике | Авторские задачи по лингвистике текста | О рубрикации электронных ресурсов
Применение в лингвистике: Дешифровка письменностей | Сравнение этимобаз |
Привлекаемые разделы информатики: Алгоритмы | Языки программирования | Кибернетика
Привлекаемые дисциплины: Математика | Когнитивистика | Эвристика
На правах рекламы (см. условия):    


© «Сайт Игоря Гаршина», 2002, 2005. Автор и владелец - Игорь Константинович Гаршин (см. резюме). Пишите письма (Письмо И.Гаршину).
Страница обновлена 11.06.2021
Яндекс.Метрика