Алгоритм, алгорифм (от algorithmi, algorismus, первоначально —
латинская транслитерация имени математика аль-Хорезми) -
способ (программа) решения вычислительных и других задач, точно предписывающий,
какие процедуры необходимо выполнить и в какой последовательности,
чтобы получить результат, однозначно определяемый исходными данными.
Алгоритм — одно из основных понятий математики
и кибернетики.
В вычислительной технике для описания алгоритма используются
языки программирования.
На этой странице публикуется информация об яинформационных технологиях
в лингвистике - направлениях, подходах, теориях, программах, алгоритмах...
Основными направлениями современной компьютерной лингвистики (вычислительного языкознания),
в порядке от алгоритмически менее сложных ко все более интеллектуальным, являются:
Компьютерная лексикография
Гипертекстовые технологии представления текста
Информационно-поисковые системы
Машинный перевод
Компьютерное моделирование общения или системы обработки естественного языка
(NLP - Natural Language Processing):
вопросно-ответные системы
диалоговые системы решения задач
обработка связных текстов
Моделирование структуры сюжета
Порталы по вычислительной лингвистике
Лингвистический алгоритм.
С каталогом лингвистических программ и ресурсов в сети версии 1.6 (2002 г.)
(имеется также более читабельная копия):
1.Программы анализа и лингвистической обработки текстов.
2.Психолингвистические программы.
3.Программы преобразования текстов.
4.Генераторы текстов и "говорящие" программы.
5.Системы обработки естественного языка (NL-Processing).
6.Коллекции ресурсов.
7.Словари и тезаурусы.
Международная конференция по компьютерной лингвистике "Диалог".
Междисциплинарный семинар ДИАЛОГ проводится в России (г. Наро-Фоминск Московской области) ежегодно (обычно в июне).
Общая тема: компьютерная лингвистика и интеллектуальные технологии.
Направления конференции: Теоретическая и компьютерная лексикография·
Корпусная лингвистика. Создание, применение, оценка корпусов·
Лингвистическая семантика и семантический анализ·
Формальные модели языка и их применение·
Извлечение и представление знаний. Тезаурусы и онтологии ·
Интернет как лингвистический ресурс. Лингвистические технологии в Интернете·
Вопросно-ответные системы·
Модели общения. Коммуникация, диалог и речевой акт·
Анализ и синтез речи·
Компьютерный анализ документов: реферирование, классификация, поиск·
Машинный перевод.
SoftCraft - Технологии информационного поиска.
Сайт преподавателя информатики и заведующего кафедрой НейроЭВМ Красноярского государственного технического университета
Легалова Александра Ивановича о теории и технологиях транслирования, кодирования, параллельных вычислений, нейроинформатики и др.
Определение семантики текста и формирование семантических ключей
Семантический модем.
Машинный перевод
Он-лайн программы автоматического перевода в сети Вы можете найти
на странице "Порталы для переводчиков".
Компьютерное моделирование общения [интерактивные и экспертные системы]
О нейропрограммировании, искусственном интеллекте и экспертных системах
смотрите страницу "Кибернетика".
Системный анализ текста необходим для более точного определения количества знаков и фиксации их разновидностей.
Если бы существовали такие программы, давно бы было расшифровано
карийское письмо.
Выделение стилевых знаковых систем. (Когда тексты в разных стилях,
например, разными шрифтами или региональными разновидностями алфавита).
Выделение в тексте независимых знаковых систем. (К примеру, разбор текста из русских и латинских букв).
Выделение диалектных и хронологических пластов. (К примеру, комплекс русских, украинских и древне-русских текстов).
Морфологический и синтаксический разбор текста
Грамматический разбор текста эффективен при наличии больших текстов.
В частности, поможет при дешифровке многих эгейских слоговых письменностей,
а также письменности острова Пасхи (кохау-ронгоронго).
Выделение в тексте морфологических единиц.
(Определение реляционных аффиксов и основ, а затем выделение из основ корней и деривационных аффиксов).
Выявление соответствия аффиксов разных слов предложения. (Определение систем спряжения и склонения).
Выделение в тексте различных языковых систем. (Например, разбор текста из русских и латинских слов, но алфавит русский).
Деление сплошного текста на предложения.
Деление сплошного текста на слова.
Разделение иероглифов на тематические области. (Рыба-удочка-река, кактус-пустыня-змея...).
Для облегчения последующего выявления возможных детерминативов и классных показателей,
а также других аффиксов и корней.
Ключевые слова для поиска сведений о компьютерной лингвистике:
На русском языке: компьютерная лингвистика, квантитативная, вычислительная, лингвистическая кибернетика,
машинный перевод, программная обработка текстов, распознавание и синтез речи,
информационно-поисковые системы и алгоритмы, семантический анализ ключевых слов,
алгоритмы дешифровки, дешифровочные алгорифмы, машинная расшифровка,
разбор текста на ЭВМ, морфологический анализ, сравнение лексики на компьютере, автоматизация лингвистических расчетов,
статистическое исследование надписей, подсчеты лингвистических индексов и коэффициентов,
Гипертекстовые технологии представления текста, Компьютерное моделирование общения, модель структуры сюжета,
ИПС;
На английском языке: computional linguistics. text analys, translation algorythm, Nature Language Processing, NL-Processing, NLP.