Название: Введение в прикладную лингвистику (Соснина Е.П.) Жанр: Гуманитарный Просмотров: 4039 |
Лекция 2План I. Семиотика. Знак и теория знаков. Язык как языковая система. П. Информация. Информатика. III. Компьютерная лингвистика.
I. Семиотика (sema - значение) - это наука об общей теории знака, исследующая любые знаковые системы как средства обозначения и передачи значения или информации. Как наука, семиотика оформилась лишь в 1974 году. Лингвистику интересуют общие положения семиотики о знаках, различительные признаки знаков, способы классификации знаков, комбинация их в систему для конкретных задач. Среди многочисленных определений знака выберем наиболее понятное для первоначального объяснения. «Знак - это некое В, преднамеренно поставленное кем-то вместо некоторого А с целью информировать кого-то об этом А». Например, значок z) (Copyright) на книге поставлен, чтобы сказать о защите прав того, кто написал и издал эту книгу. Знак материален и обладает направленным значением. В знаке выделяют 2 основных аспекта (или «плана»): тан выражения (материальный, как выглядит); тан содержания (что-то обозначает, смысл). Знак - это член определенной знаковой системы. Существует несколько основных типов знаковых систем [2]: 1) натуральные или естественные; 2) икони-ческие; 3) системы художественных образов; 4) системы речевых знаков; 5) системы письменных знаков; 6) формализованные или кодовые знаковые системы. Например, всем известны такие знаковые системы как дорожные, телеграфные коды, сигнальные (флажки), чертежные обозначения, шифры, компьютерные пиктограммы и т.д. Теперь логично перейти к тому, почему же, определяя язык, говорят, что «Язык - это система знаков». Здесь как раз и просматривается четкая связь лингвистики и семиотики. Возьмем любое слово, например, «дом». Это слово и есть «некое А», преднамеренно поставленное вместо натурального дома («некоего В»), чтобы нам сказать о том или ином доме. Причем, слово «дом» имеет план выражения (оно или произнесено, или написано) и план содержания (обозначает дом). Знаковыми единицами языка считают морфемы и лексемы, т.к. они несут информацию и значение в отличие от единиц низшего уровня языка - звуков и букв (так называемые знаки 1 -го рода ). В речи выделяют 3 семиотических аспекта знака: Синтактика (изучает отношения между знаками). Семантика (отношения между знаком и значимым). Прагматика (отношения между знаками и теми, кто их использует). Вернемся к определению семиотики, где специально были выделены курсивом 3 слова (см. выше). Показав, что язык - это некоторая система знаков, и говоря, что язык - это средство коммуникации (основное определение в прикладной лингвистике), или средство передачи значения (определение семиотики), мы находим еще одну связь лингвистики и семиотики. Кроме того, отсюда следует, что язык есть средство передачи информации, тем самым мы устанавливаем связь с такой перспективной наукой, как информатика. В следующем параграфе мы рассмотрим эту взаимосвязь наиболее детально.
II. Первоначально дадим несколько определений понятию информации. «Информация - сведения, данные, несущие значения для конкретного человека». Под информацией [7] понимаются не сами предметы и процессы, а их значения и характеристики (их отображения в виде чисел, текстов, формул, таблиц, графики), т.е. говорят о текстовой, графической информации. Интересно и такое определение, что «информация есть средство устранения неопределенности в знаниях». Вопросами информации занимается «Теория информации», обоснованная Р. Шенноном в 50-х гг. Основной проблематикой теории информации является процесс передачи информации по каналам связи от отправителя до получателя. Эти вопросы стали наиболее актуальны в наше время с развитием всевозможных средств связи, в т.ч. компьютерных и телекоммуникационных. отправитель Ь передатчик ]| канал ^ приемник получатель
• информационный : i шум : Информация доступна: восприятию (распознавание образов, текстов и т. д.); передаче (по каналам связи) в виде сигналов (аналоговых/цифровых); обработке (преобразование в удобную форму); представлению (для демонстрации человеку). В середине XX века в связи с возрастающими объемами информации и с появлением новых информационных технологий и сред сложилась и стала активно развиваться такая наука, как информатика. Под информатикой понимают науку о закономерностях записи, хранения, переработки, передачи и использования информации с помощью технических средств. Основные понятия в информатике - это код, система условных знаков или символов; алфавит - набор знаков кода, текст - последовательность знаков данного сообщения, вероятность - частота появления какого-либо кода в сообщении. В информатике существует такой термин, как «кодирование информации» - это представление сообщения в форме, удобной для передачи по данному каналу. Большинство кодов для кодирования информации основано на тех или иных системах счисления. Любому дискретному сообщению, букве сообщения можно приписать какой-либо порядковый номер. Передача и хранение информации при этом - это работа с числами. Числа выражаются в какой-либо системе счисления. При сравнении систем счисления эффективной оказалась двоичная (1; 0). Логические элементы должны иметь 2 устойчивых состояния (включено/выключено). Таким образом, с технической точки зрения, информация - это сигнал (1,0) или элементарное событие «да» - «нет», измеряемое в двоичных единицах - битах (мера Хартли). Однако, числа хотя и удобны для передачи и хранения в компьютере, они не удобны для восприятия и представления информации для нужд человека. Универсальным же хранилищем и средством передачи информации является естественный человеческий язык. Кроме того, преобладающая часть информации существует в виде письменных и устных текстов на естественном языке.
III. Современный человек живет в огромной информационной среде -масс-медиа (телевидение, радио, газеты и т.п.), WWW (World Wide Web -всемирная компьютерная сеть). Объемы информации возрастают на порядок ежегодно. Современные информационные технологии включают растущее число автоматизированных информационных систем, средств массовой коммуникации, систем информационного поиска, систем машинного перевода. Общение с компьютером развивается в сторону использования удобного для человека языка. Компьютер - это сложная техническая система, в которой все должно быть жестко формализовано и запрограммировано, но естественный язык (ЕЯ) -слишком сложная структура, поэтому работа с информацией на ЕЯ в современных компьютерных средах ограничивается недостатком знаний о языке. Проблемы языковой коммуникации «человек - компьютер - человек» и моделирования языка лежат в области исследований такой молодой науки как компьютерная лингвистика, которая образовалась на стыке информатики и лингвистики. Компьютерная лингвистика, будучи одним из направлений прикладной лингвистики, изучает лингвистические основы информатики и все аспекты связи языка и мышления, моделирования языка и мышления в компьютерной среде с помощью компьютерных программ. Интересы компьютерной лингвистики лежат в области: создания общих языков для представления информации; усовершенствования языков доступа к информации; создания естественного языкового интерфейса для общения человека с машиной (одна из основных проблем Искусственного Интеллекта); создания и моделирования информационных систем.
Семинар План I. Семиотический треугольник. П. Лингвистический символ. III. Информация — понимание в разных науках. Домашнее задание Дать толкование лингвистического символа (5). Системы счисления (язык цифр, язык математики). Информация - что это такое в разных науках.
Список литературы Горелов И.Н. Разговор с компьютером - психолингвистический аспект проблемы. М., 1987. С. 34-57, 92-104, 117-126, 230-249. Звегинцев В.А. Теоретическая и прикладная лингвистика. М., 1968. С. 235-248, 275-288. Лингвистический энциклопедический словарь /Гл. ред. В.Н. Ярцева. М., 1998. С. 618-623. Маслов Ю.С Введение в языкознание. М., 1997. С. 7-32. Пиотровский Р.Г. Текст, машина, человек. М., 1975. С. 6-10. Реформатский А.А. Введение в языковедение. М., 1997. С. 15-59. Темников Ф.Е., Афонин В.А., Дмитриев В.И. Теоретические основы информационной техники. М., 1971. С. 4-25.
|
|