«»»возможности применения ит в лингвистике»» 5″

Использование информационных технологий в лингвистике

"""возможности применения ит в лингвистике"" 5"

Белорусский государственный университет

Выпускная работа по предмету

«Основы информационных технологий»

ИСПОЛЬЗОВАНИЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В ЛИНГВИСТИКЕ

Аспирант

филологического факультета

кафедры теоретического и славянского языкознания

Руководители:

доктор филологических наук, профессор

старший преподаватель

Минск − 2011 г.

Оглавление

Оглавление.. 2

Реферат на тему «Использование информационных технологий в лингвистике». 3

Введение.. 4

ГЛАВА 1 ЗНАЧЕНИЕ КОРПУСНОЙ ЛИНГВИСТИКИ В СОВРЕМЕННых исследованиях по ЯЗЫКОЗНАНИю… 6

1.1. Ключевые понятия корпусной лингвистики: корпуса текстов, корпусный анализ. 6

1.2. Универсальные и специальные корпуса текстов. 8

Глава 2 Использование интернет-ресурсов в Лингвистическом исследовании.. 10

2.1. Современное состояние ресурсов Интернет, посвященных проблемам лингвистики.. 10

2.2. Контент-анализ ресурсов Интернет, посвященных вопросам лингвистики.. 12

Заключение.. 15

список литературы к реферату.. 16

Предметный указатель.. 18

ИНТЕРНЕТ РЕСУРСЫ В ПРЕДМЕТНОЙ ОБЛАСТИ ИССЛЕДОВАНИЯ.. 19

Действующий личный сайт в сети Интернет.. 21

Граф научных интересов.. 22

Презентация кандидатской диссертации.. 23

Тестовые вопросы по Основам информационных технологий.. 24

Приложение.. 25

Реферат на тему «Использование информационных технологий в лингвистике»

На современном этапе развития таких, на первый взгляд, непересекающихся дисциплин как лингвистика и информационные технологии, с уверенностью можно говорить о зависимости лингвистики от технических возможностей современной компьютерной науки. С другой стороны, информационные технологии заимствуют некоторые методы лингвистики.

На стыке двух дисциплин появилась наука компьютерная лингвистика, а также была создана лингвистическая база знаний, которая составляет основу «лингвистического компонента» некоторых компьютерных систем [2, 225]. К числу таких систем относятся системы искусственного интеллекта, машинного перевода, автоматического порождения текстов и др.

К области компьютерной лингвистики относится практически все, что связано с использованием компьютеров в языкознании.

Огромную роль информационные технологии (далее ИТ) стали играть при обучении иностранным языкам, в процессе алгоритмизации лингвистических задач, при обработке лингвистических текстов и т. д. (см. Зубов 2004). Использование информационных технологий в лингвистике стало необходимостью.

Однако в реальности для лингвистических задач используется лишь небольшая часть всего объема ИТ: электронные словари и справочники, некоторые программы пакета Microsoft Office.

Наиболее распространенной лингвистической задачей в нашей стране является поиск информации в сети Интернет [3, 239].

К сожалению, значительный потенциал современных информационных технологий остается незадействованным, вследствие недостаточной компьютерной грамотности филологов, отсутствия финансирования научно-исследовательских проектов по прикладным вопросам лингвистики, узкоспециальных интересов исследователей и ряда других причин.

Цель данной работы – выявить основные способы и области применения информационных технологий в лингвистическом исследовании.

Настоящая работа состоит из введения, двух глав, заключения, списка использованных источников в количестве 13 наименований, а также предметного указателя.

Во введении обосновывается актуальность исследуемой темы. В первой главе освящаются основные понятия корпусной лингвистики, а также пути ее применения в языковом исследовании. Во второй главе характеризуется современное состояние Интернет-ресурсов, анализируются проблемы лингвистического поиска в Сети, проводится контент-анализ некоторых сайтов в Интернет.

Глава 1
значение корпусной лингвистики в современных исследованиях по языкознанию

1.1. Ключевые понятия корпусной лингвистики: корпуса текстов, корпусный анализ

Корпусная лингвистика занимается разработкой общих принципов построения и использованием лингвистических корпусов, т. е. коллекций текстов, специально отобранных и размеченных по различным лингвистическим параметрам и обеспеченных системой поиска.

Впервые мысль о том, что достоверные данные о фонетической, морфологической, синтаксической и семантической структуре языка и речи могут быть получены только из большого массива текстов, были высказаны в докладе «Статистическое исследование лексики и грамматики текста с помощью электронной машины» [12].

С помощью корпусов текстов могут решаться самые различные задачи, поэтому работа с ними стала одним из ведущих методов лингвистических исследований [6, 68-77].

Так, на основе анализа множества текстов можно сделать вывод об интересующем исследователя языковом явлении, например, о поведении грамматической или синтаксической конструкции, использовании выразительных средств в естественной языковой среде, т. е. в реально существующих, а не искусственно сконструированных контекстах.

Кроме того, корпусные исследования позволяют, используя статистические методы, сформулировать, подтвердить или опровергнуть гипотезу о том или ином языковом явлении на большом объеме материала.

При этом, если исследователь пользуется уже существующим корпусом, он полностью минует долгий и трудоемкий этап сбора материала (опрос информантов, работа со словарными картотеками или письменными текстами). Таким образом, возможность широкого применения электронных ресурсов, с одной стороны, значительно облегчила филологам и лингвистам процесс сбора информации, с другой же стороны, ужесточила требования к доказательной базе лингвистических исследований.

Центральным понятием корпусной лингвистики является письменный текстовый массив или корпус текстов. В лингвистической литературе существует несколько определений корпуса текстов.

Например, рассматривает корпус текстов как вид корпуса данных, единицами которого являются тексты или их достаточно значительные фрагменты, включающие, например, какие-то полные фрагменты макроструктуры текстов данной проблемной области.

При этом под корпусом данных понимается сформированная по определенным правилам выборка данных из проблемной области, т. е. из области реализаций языковой системы, содержащей феномены, и которая подлежит лингвистическому описанию [1, 112-113].

рассматривает корпус текстов «как совокупность текстов, являющихся достаточной основой для обеспечения надёжных научных выводов о некотором языке или ином другом подмножестве языка»[4, 64]. Вслед за D. Biber, S. Conrad, R. Reppen под корпусным анализом понимает использование корпусов текстов для проведения лингвистического анализа и выделяет следующие особенности этого вида анализа:

1. Он является исключительно эмпирическим, так как опирается на анализ реальных примеров, использованных в естественных текстах.

2. Его основой является специальным образом построенное большое собрание текстов естественных языков.

3. Он широко использует компьютерный анализ, в том числе автоматические и интерактивные приемы.

4. Он опирается на количественный и качественный аналитический прием [4, 64].

Существует несколько требований, предъявляемых к составу и структуре корпуса. Во-первых, это требование полноты. Любое языковое явление, сколь бы редким оно ни было, должно найти отражение в корпусе. Во-вторых, требование репрезентативности.

Корпус должен отражать те или иные параметры исследуемого языкового явления в той же пропорции, что и в языке вообще. Важным параметром корпуса также является его объем.

Так, если первые корпуса достигали миллиона словоупотреблений, то объем современных корпусов исчисляется сотнями миллионов или даже миллиардами (известно, что объем корпуса английского языка Bank of English превышает 2,5 млрд. слов).

1.2. Универсальные и специальные корпуса текстов

Выделяют два основных типа корпусов: универсальный и специальный, и в зависимости от этого разрабатываются критерии и процедуры отбора текстов в корпус. Универсальный корпус текстов создается для отражения внешней по отношению к нему речевой деятельности и может быть использован для всестороннего исследования.

Примерами универсальных корпусов текстов могут служить корпусы того или иного естественного языка. Например, Британский национальный корпус (http://www. natcorp. ox. ac. uk), Национальный корпус русского языка (**). Существуют также национальные корпуса для немецкого, китайского, финского, чешского и других языков.

Специальный корпус составляется для решения определенной задачи и может быть использован исключительно в тех целях, для которых он создан (к примеру, для обучения иностранному языку и т. д.).

Современные средства позволяют быстро сформировать весьма обширный корпус текстов практически по любой тематике, причем, сделать это может каждый, кто владеет основными навыками работы с ПК и Интернетом.

Большинство современных корпусных менеджеров (т. е. программ, обеспечивающих сортировку результатов поиска, статистические подсчеты, составление конкордансов и словников на основе корпуса) позволяют осуществлять поиск различного рода информации.

Например, поиск конкретных словоформ, поиск словоформ по лемме (т. е. поиск всех форм одного и того же слова, встретившихся в тексте), поиск неразрывных и разрывных словосочетаний.

Более того, благодаря наличию специальной метаразметки, пользователь имеет возможность создавать свой подкорпус текстов, отобранных по жанру, тематике, времени написания и т. д. Каждый из примеров выдачи снабжается информацией об источнике, откуда взят пример.

В некоторых корпусах также возможно получать статистическую информацию о том или ином языковом явлении; его относительную частоту, распределение по жанрам или временным срезам, частоту его сочетаемости.

Глава 2
Использование интернет-ресурсов в Лингвистическом исследовании

2.1. Современное состояние ресурсов Интернет, посвященных проблемам лингвистики

Интернет как глобальная компьютерная сеть, использующая стандартизованные протоколы (TCP/IP) и объединяющая более 50000 сетей, стал не просто «вершиной человеческой мысли», но развивающимся механизмом, непосредственным прототипом которого является человеческий мозг.

В настоящее время сеть Интернет, а также наиболее популярный сервис данной сети – WWW (World Wide Web), созданный в 1991 г.

, позволяют пользователям обмениваться практически любой информацией, получать доступ к разнообразным источникам информации, не расположенным в непосредственной близости.

Отходя от чисто утилитарного бизнес-применения сети Интернет, современное общество начало грамотно, а главное – также стремительно – применять сервисы мировой сети в научных целях.

Ресурсы сети Интернет в значительном объеме задействованы и для решения ряда лингвистических задач. Так, развиваются сайты, созданные группами исследователей по определенной проблеме (http://**/; http://www. mapryal. org/), членами филологических кафедр на базе вузов (http://slavic. princeton.

edu/events/calendar/detail. php? ID=1921; http://. ru/zaslugi. htm), либо пользователями-любителями, интересующимися современными лингвистическими проблемами (http://www. *****/). На данных сайтах в свободном доступе имеются тексты статей различных ученых, список имеющихся у них публикаций.

Наиболее популярным ресурсом последних лет стали так называемые «живые журналы» – онлайновые блоги (или дневники) пользователей, на страницах которых также организованы сообщества филологов (http://community.

/philologist_ru/profile, http://community. /terra_linguarum/profile).

Ценность данного ресурса не только в том, что с его помощью можно общаться со своими коллегами, но также и в том, что живые журналы служат источниками самой новой информации по различным тематическим разделам.

По сравнению с большим количеством разнообразных сайтов и живых журналов по лингвистике, использование других ресурсов Интернет незначительно. К их числу можно отнести базы данных (в том числе электронные словари и корпуса текстов) и системы машинного перевода он-лайн.

Для пользователя-лингвиста наличие словарных источников в Сети позволяет решить сразу несколько задач: быстрый доступ к источнику; качественно новый уровень работы с источником вследствие удобного интерфейса словаря online; одновременная работа с несколькими источниками и др.

Кажущиеся простыми, данные задачи невозможно было бы решить, используя словари на бумажных носителях. На данном этапе развития лингвистики большинство специальных и переводных словарей имеют электронный формат, снабжены удобной системой поиска, позволяют не только просматривать, но и прослушивать отдельные компоненты словаря.

Среды одноязычных словарей одним из первых был запущен словарь английского языка Merriam-Webster Online Dictionary (http://www. ). В сети Интернет особой популярностью пользуется ресурс «Словари и энциклопедии online» (http://dic.

*****/), а также официальный сайт AskOxford, на котором возможен поиск лексических единиц английского языка (http://www. /dictionaries/?view=uk) в различных словарях одновременно.

Для филологов-белорусистов доступен полноформатный сайт, на котором пользователи имеют доступ к ряду специальных словарей в режиме он-лайн.

Данный продукт представляет интерес и в том отношении, что содержит корпус текстов на белорусском языке (http://).

Не меньшую значимость в исследовательских целях имеют корпуса текстов на русском (**) и английском языках (http://www. natcorp. ox. ac. uk).

Этот краткий обзор ресурсов Интернет позволяет признать, что объем сайтов, наличие большого числа форумов, словарей и энциклопедий может служить хорошим инструментом для исследователя-лингвиста.

Однако не только количество веб-сайтов, сколько качество их содержания необходимо для того, чтобы считать их достаточно пригодными для исследовательской работы, в том числе, при написании диссертационного исследования.

2.2. Контент-анализ ресурсов Интернет, посвященных вопросам лингвистики

Прибегая к Интернет-ресурсам в работе над диссертационным исследованием, совершенно естественно, что первым шагом является поиск информации. Наиболее популярными поисковыми системами являются Google, Yandex, Yahoo, Rambler и некоторые другие. Правильная формулировка запроса неизменно приведет к искомому источнику. Выделяют следующие преимущества использования систем Интернет:

1) Быстрый поиск информации;

2) Идентификация источника информации;

3) Получение свежей информации;

4) Получение важных данных [3, 239].

Существует также ряд статей, помогающих пользователю искать необходимую информацию в Сети (например, Интернет ЛикБез). Однако, как совершенно справедливо отмечает , «полезной информации становится все больше, но найти что-либо необходимое – все сложнее» [3, 240].

В настоящее время некоторую трудность представляет поиск книг либо статей как отечественных, так и зарубежных лингвистов. Большинство авторов не «выкладывает», то есть не публикует свои статьи в Интернете.

Для приобретения подобных работ необходима регистрация на сайте, оплата определенных взносов и только после этого пользователь получает доступ к статьям. Очевидно, что несколько иначе дело обстоит в России и в Беларуси.

Многие лингвисты понимают преимущества Интернета и публикуют свои статьи на персональных сайтах, что, несомненно, облегчает доступ к ним широкого числа пользователей.

С другой стороны, появляются специальные сайты, содержащие многочисленные ссылки на источники в определенной предметной области (http://orus. slavica. org/taxonomy/term/12).

Следует также отметить, что не все сайты одинаково полезны для исследовательских целей. Интересным примером может служить форум «Международная конференция по компьютерной лингвистике» (http://www. *****/forum/actualtopics. aspx? bid=16).

Внимание к данному ресурсу привлекает тот факт, что основными ведущими данного форума являются известные языковеды. Так, раздел «Лингвистическая семантика» возглавляет известный лингвист Ирина Кобозева (г. Москва). На форуме каждый пользователь имеет возможность задавать вопросы ведущему форума.

Но очевидно, что самым информативным в данном случае являются именно ответы лингвиста.

В этом, с одной стороны, недостаток форумов (они притягивают некомпетентных в области людей), а с другой стороны, благодаря быстрой обратной связи, специалисты могут ответить на вопросы большому количеству пользователей сразу, что было бы невозможно в иных случаях.

Кроме того, что до настоящего момента малодоступной в Сети является лингвистическая литература в виде монографий, диссертаций и проч. В популярных библиотеках, например, в Библиотеке Максима Мошкова (www.

*****) и некоторых других несмотря на имеющуюся литературу по экономике, физике, кибернетике отсутствует раздел, посвященный вопросам языкознания.

И хотя многие библиотеки имеют свои он-лайн каталоги, саму работу получить через Интернет почти невозможно.

Все перечисленные ресурсы сети Интернет активно используются нами при написании диссертационного исследования. Особую значимость имеют корпуса текстов на различных языках и электронные словари. Не менее важными являются и банки лингвистических статей, которые размещены на сайтах вузов и ассоциаций лингвистов.

Заключение

В настоящее время область информационных технологий переживает мощнейший технологический бум. Сами информационные технологии приобретают новый статус и становятся инструментом в руках исследователя.

Так, практически все лингвистические исследовании, включая даже такие масштабные как работы по составлению словарей и грамматик, так или иначе ориентированы на использование представительных корпусов текстов.

Например, словари издательства Collins создавались на базе электронного языкового корпуса Bank of English, насчитывающего более 2,5 миллиардов слов. В поле зрения лингвиста имеется также огромное число сайтов, форумов, виртуальных библиотек. Приведенный нами обзор Интернет-источников по теме исследования далеко не полон.

Однако он дает некоторое представление о количестве источников информации и ресурсах, представляющих интерес для исследователя. Интернет способен, как никакой другой ресурс, объединить исследователей из разных стран, организовать конференцию участников в Сети, сделать возможным их виртуальное общение.

Совершенно очевидно, что пройдет немного времени до момента, когда появятся заказы на компьютерные программы, призванные обеспечивать лингвистические цели и задачи. В частности, насущной остается проблема статистического подсчета и обработки лексических единиц, которая традиционно выполнялась вручную, но без чего немыслимо ни одно исследование в области языкознания.

Таким образом, на современном этапе развития техники компьютерная грамотность для филолога является уже не требованием, а необходимым условием и одной из составляющих профессионального успеха.

список литературы к реферату

1.  Баранов, в прикладную лингвистику / . – М.: Эдиториал УРСС, 2001. – 360с.

2.  Голубева, база знаний для генерации интернет-текстов / // Вестник МГЛУ. Сер. 1, Филология. Мн.: МГЛУ, 2006а. – №3 (23). – С. 225–239.

3.  Голубева, проблемы поиска информации в сети Интернет и способы из разрешения / // Вестник МГЛУ. Сер. 1, Филология. Мн.: МГЛУ, 2006б. – № 3 (23). – С. 239–249.

4.  Зубов, перевода терминологических словосочетаний с использованием параллельных текстов / // Теория и практика перевода. – 2005. — №1. – С.64-66.

5.  Зубов, технологии в лингвистике: Учеб. пособие / , . – М.: Издательский центр «Академия», 2004. – 208с.

6.  Зубов, лингвистика: возможности и проблемы / // Актуальные проблемы компьютерной лингвистики: Сб. научных ст. Отв. ред. . – Минск: МГЛУ, 2005. – С.68-77.

7.  Кравченя, информатики, компьютерной графики и педагогические программные средства / . – Мн.: ТетраСистемс, 2004. – 319 с.

8.  Могилев, . пособие для студ. пед. вузов / , , ; Под ред. . – 3-е изд., перераб. и доп. – М.: Издательский центр «Академия», 2004. – 848 с.

9.  Основные понятия и определения информационных технологий [Электронный ресурс]. – Режим доступа: http://*****sedu. info/Article581.html. – Дата доступа: 01.02.2011.

10.  Острейковский, : учеб. для вузов / . – Мн.: Высш. шк., 1999. – 511 с.

11.  Перепелкин, В. Пользователь персонального компьютера. Соверменный курс / В. Перепелкин; под ред. . – Ростов н/Д: Феникс, 2002. – 704 с.

12.  Пиотровский, исследование лексики и грамматики текста с помощью электронно-вычислительной машины / // Проблемы синхронного изучения грамматического строя языка: Материалы науч. конф. – М.: МГПИИЯ, 1965. – с.144-146.

13.  Вавилонское столпотворение в Интернете // КомпьютерПресс [Электронный ресурс]. – Режим доступа: http://*****/Archive/CP/2005/2/2/. – Дата доступа: 01.03.2011.

14.  Microsoft Manual of Style for Technical Publications / Third Edition. – Microsoft Press, 2003. – 352 p.

15.  Microsoft Press Computer Dictionary / Third Edition. – Microsoft Press, 1998. – 336 p.

Предметный указатель

M

Merriam-Webster Online Dictionary, 11

W

World Wide Web, 10

Б

Библиотеке Максима Мошкова, 14

Ж

живые журналы, 11

К

компьютерная сеть, 10

корпус текстов, 12

корпус текстов на английском языке, 12

корпус текстов на русском языке, 12

Корпусная лингвистика, 6

П

поисковые системы, 12

преимущества использования систем Интернет, 12

Р

ресурсы сети Интернет, 10

С

сайт AskOxford, 11

сообщества филологов, 11

Специальный корпус, 8

У

Универсальный корпус, 8

Ф

форум, 13

http://president. Сайт Президента Республики Беларусь

http:// Сайт белорусского государственного университета. Содержит в числе других разделов направления научной работы, объявления о научных конференциях.

http://. ru Сайт кафедры теоретического и славянского языкознания Белорусского государственного университета

http://** На этом сайте помещен корпус современного русского языка объемом более 140 млн. слов.

http://www. *****/ Это Корпус русского литературного языка, который отражает употребление слов, словоформ, грамматических конструкций, словосочетаний русского языка, начиная с середины 20в. и до настоящего времени.

http://www. natcorp. ox. ac. uk/ Здесь помещен Британский национальный корпус (BNC), включающий более 100 млн. слов.

http://www. americannationalcorpus. org/ Это Американский национальный корпус (ANC)

http://dic. ***** На этом сайте можно найти словари и энциклопедии в режиме online по различным предметным областям

http://www. Это официальный сайт AskOxford, на котором возможен поиск лексических единиц английского языка.

http://www. scientificjournals. org На этом сайте в открытом доступе размещены англоязычные журналы практически по всем научным дисциплинам, в том числе и гуманитарным, например, Journal of Literature, Language and Linguistics.

http://www. hnu. edu/ishs/ Это сайт Международного общества по изучению юмора (International Society for Humor Studies)

Граф научных интересов

аспиранта

филологический факультет

Специальность 10.02.19. – Теория языка

Смежные специальности

Источник: https://pandia.ru/text/78/541/8332.php

Применение информационных технологий в лингвистике. Основные задачи

"""возможности применения ит в лингвистике"" 5"

Применение информационных технологий в лингвистике. Основные задачи.

Ставрополь,2018г

Применение информационных технологий в лингвистике. Основные задачи.

На современной стадии формирования таких непересекающихся дисциплин как лингвистика и информационные технологии, с уверенностью можно заявлять о том, что лингвистика, с одной стороны, зависит от технических возможностей современной компьютерной науки. В свою очередь, информационные технологии также заимствуют определенные приемы лингвистики.

Так, на стыке двух дисциплин возникла компьютерная лингвистика, кроме того была сформирована лингвистическая база знаний, формирующая основу «лингвистического компонента» определенных компьютерных  концепций. К их числу можно отнести системы искусственного интеллекта, машинного перевода, автоматического порождения текстов и др.

К сфере компьютерной лингвистики принадлежит почти все, без исключения, что связано с применением ПК в языкознании.

Немаловажную роль информационные технологии сейчас имеют в обучении иностранным языкам, в ходе алгоритмизации лингвистических задач, при обработке лингвистических текстов и т. д. (см. Зубов 2004). Применение информационных технологий в лингвистике является необходимостью.

Однако в действительности, с целью решения лингвистических задач применяется только незначительная доля всего объема информационных технологий: электронные словари и справочники, определенные программы пакета Microsoft Office.

Более распространенной лингвистической задачей у нас считается поиск информации в сети Интернет.

К сожалению, значительный потенциал современных информационных технологий остается незадействованным, по причине недостатка компьютерной грамотности филологов, отсутствия финансирования научно-исследовательских проектов по вопросам прикладной лингвистики, узкоспециальных интересов ученых и многое другое.

Анализируя определение понятия «информационные технологии» в лингвистике, следует отметить что информационные технологии в лингвистике — это совокупность законов, способов и средств получения, хранения, передачи, распространения, преобразования информации о языке и законах его функционирования с помощью компьютеров. Если сопоставить данное определение с теми вопросами, какие решает современная прикладная лингвистика, можно сказать, что понятие «информационные технологии» в лингвистике принадлежит в основном к задачам прикладной лингвистики. К таковым следует отнести формирование:

  1. Систем искусственного интеллекта.

  2. Систем автоматического перевода.

  3. Систем автоматического аннотирования и реферирования текстов.

  4. Систем порождения текстов.

  5. Cистем обучения языку.

  6. Cистем понимания устной речи.

  7. Cистем генерации речи.

  8. Автоматизированных информационно – поисковых систем.

  9. Создание систем атрибуции и дешифровки анонимных и псевдоанонимных текстов.

  10. Разработка различных баз данных (словарей, карточек, каталогов, реестров и т.п.) для гуманитарных наук.

  11. Разработка различного типа автоматических словарей.

  12. Разработка систем передачи информации в сети Интернет и т.д.

Данные комплексные задачи содержат полный ряд наиболее мелких вопросов. В том числе к таковым принадлежит автоматизация следующих процессов:

  1. Построение словарей текстов.

  2. Морфологический анализ слова.

  3. Определение значения многозначного слова.

  4. Синтаксический анализ предложения.

  5. Поиск слова в словаре.

  6. Порождение предложения и т.д.

Решение рассмотренных выше задач невозможно при отсутствии репрезентативных и качественных информационных массивов. Такие массивы следует постоянно дополнять различными справочными материалами и ресурсами: библиографии, справочники, словари, энциклопедии, биографии и другую вспомогательную информацию, которая необходима для полноценной работы ученого-лингвиста и лингвиста-студента.

В настоящее время один из основных источников профессиональной информации для лингвиста считается сеть Интернет, где есть различные ресурсы в виде массивов (баз) информации:

  1. Электронные энциклопедии (feb-web. ш).

  2. Сети словесных ассоциаций (wordassociations.net).

  3. Электронные библиотеки (eLIBRARY. RU, КиберЛенинка, Арбикон).

  4. Базы данных университетов.

  5. Авторские сайты.

  6. Форумы.

  7. Текстовые процессоры (MicrosoftWord, LotusWordPro OpenOffice Writer)

  8. Ментальные карты (ultra outliner).

Достаточно существенную часть интернет-массива занимают образовательные и научные ресурсы. Они составлены в виде интернет-библиотек: словари, энциклопедии, базы данных, архивы и проч.

 В связи с мобильностью и доступностью представляемой информации они пользуются широким спросом в научном и образовательном сообществе.

Основная их отличительная черта — абсолютная доступность электронного информационного ресурса: книги, учебники, пособия, сборники, исторические источники, статьи и авторские монографии. Подобные ресурсы упрощают и ускоряют работу в обучении и научном исследовании лингвистов.

Базовой основой каждого лингвиста считается работа с энциклопедическими источниками с целью извлечения нужной информации. По этой причине, в век информационных технологий, многотомные энциклопедии немного утратили свое значение.

Электронные энциклопедии сейчас дают возможность быстро получить необходимую в работе информацию. Так как речь идет цифровой информации, которая хранится на серверах, следует сказать что значительное превосходство, имеют электронные энциклопедии: динамическое пополнение базы данных, ее доработка и корректировка в реальном времени. В то время как классические печатные издания лишены такой возможности.

Философы, психологи и прочие эксперты утверждают, что в будущем социально защищенным может являться только тот человек, который может хорошо изменять направление и содержание своей деятельности, в следствии смены технологий либо условий рынка.

Чтобы привести в готовность такого человека, следует сменить традиционную технологию получения новых знаний на эффективную организацию познавательной деятельности учащихся в учебном процессе. Совершить это возможно при помощи использования современных информационных технологий.

Именно они смогут показать учащимся, что информационный источник представляет настоящую значимость только в том случае, если у него имеется соответствующий доступ. С их помощью будущих специалистов возможно обучить правильной организации хранения информации и выбору адекватных форм ее представления.

«Интеллектуальная собственность, представленная в цифровом формате, станет главной «валютой» XXI века».

Технология получения и распространения новых знаний уже сейчас

неотделима от Internet. Создается инфраструктура соединяющая в единое целое глобальные и местные телекоммуникационные каналы, радиовещание, телевидение, телефонные линии связи.

Все это не просто формирует сверхинтеллект, а создает новые измерения сознания, феномен сверхпсихологических изменений в личности человека.

Большое распространение приобретают видеоконференции и дистанционное обучение.

К концу XXI века служители науки исследуют принципы работы мозга на уровне отдельных нейронов и научатся обращаться с ним, как с непростым электронным объектом. Это обеспечит рывок к формированию систем искусственного интеллекта, систем автоматического порождения текстов, их перевода, реферирования и т.д.

В настоящее время сфера информационных технологий проходит сильнейший технологический подъем. Сами информационные технологии обретают новый статус и становятся инструментом в руках исследователя.

Таким образом, почти все без исключения лингвистические исследования, в том числе и масштабные, такие работы как составление словарей и грамматик, так или иначе нацелены на применение представительных корпусов текстов.

К примеру, словари издательства Collins формировались на основе электронного языкового корпуса Bank of English, насчитывающего более 2,5 миллиардов слов. В поле зрения лингвиста также огромное число сайтов, форумов, виртуальных библиотек.

Вышеприведенный мной обзор дает определенное понимание о количестве источников информации и ресурсах, которые предоставляют интерес для исследователя. Интернет способен, как никакой другой ресурс, объединить исследователей из разных стран, организовать конференцию участников в Сети, сделать возможным их виртуальное общение.

Абсолютно очевидно, что пройдет немного времени до момента, когда появятся заказы на компьютерные программы, призванные обеспечивать лингвистические цели и задачи. В частности, существенной остается проблема статистического подсчета и обработки лексических единиц, которая традиционно выполнялась вручную, но без чего немыслимо ни одно исследование в области языкознания.

Таким образом, на нынешней стадии формирования техники компьютерная грамотность для филолога считается уже не требованием, а необходимым условием и одной из составляющих профессионального успеха.

Список литературы:

  1. Баранов, в прикладную лингвистику / . – М.: Эдиториал УРСС, 2001. – 360с.

  2. Зубов, технологии в лингвистике: Учеб. пособие / , . – М.: Издательский центр «Академия», 2004. – 208с.

  3. Зубов, лингвистика: возможности и проблемы / // Актуальные проблемы компьютерной лингвистики: Сб. научных ст. Отв. ред. . – Минск: МГЛУ, 2005. – С.68-77.

  4.  Могилев, . пособие для студ. пед. вузов / , , ; Под ред. . – 3-е изд., перераб. и доп. – М.: Издательский центр «Академия», 2004. – 848 с.

  5. Острейковский, : учеб. для вузов / . – Мн.: Высш. шк., 1999. – 511 с.

  6. Кравченя, информатики, компьютерной графики и педагогические программные средства / . – Мн.: ТетраСистемс, 2004. – 319 с.

  7. https://studwood.ru

  8. https://cyberleninka.ru

  9. Голубева, проблемы поиска информации в сети Интернет и способы из разрешения / // Вестник МГЛУ. Сер. 1, Филология. Мн.: МГЛУ, 2006б. – № 3 (23). – С. 239–249.

  10. Зубов, перевода терминологических словосочетаний с использованием параллельных текстов / // Теория и практика перевода. – 2005. — №1. – С.64-66.

Источник: https://infourok.ru/primenenie-informacionnih-tehnologiy-v-lingvistike-osnovnie-zadachi-3614512.html

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Выпускная работа по

«Основам информационных технологий»

Магистранта

кафедры теоретического

и славянского языкознания

Прижитомской Татьяны Петровны

Руководители:

доктор филологических наук

профессор Мечковская Н.Б.

старший преподаватель

Апанасевич Т.А.

Минск 2010

ОГЛАВЛЕНИЕ

список обозначений к выпускной работе.. 3

реферат «возможности применения ит в лингвистике». 4

Введение. 4

глава 1. обзор литературы.. 7

глава 2. основные лингвистические программы и ресурсы, представленные в сети интернет. 12

2.1. Программы анализа и лингвистической обработки текстов. 12

2.2. Программы для автоматической обработки текстов. 13

2.3. Программы преобразования текстов. 13

2.4. Психолингвистические программы.. 14

глава 3. использование некоторых лингвистических программ в исследовании русскоязычных и англоязычных искусствоведческих текстов. 17

заключение. 26

список литературы к реферату. 27

предметный указатель к реферату. 29

интернет-ресурсы в предметной области исследования.. 30

действующий личный сайт в WWW… 33

граф научных интересов.. 34

тестовые вопросы по основам информационных технологий.. 36

презентация магистерской диссертации.. 37

список литературы к выпускной работе.. 38

приложение.. 41

список обозначений к выпускной работе

АОТ – автоматическая обработка текста

АПТ – автоматическое понимание текста

БД – база данных

ДО – дистанционное обучение

ИТ – информационные технологии

КЛ – компьютерная лингвистика

МП – машинный перевод

ПЛ – прикладная лингвистика

реферат
«возможности применения ит в лингвистике»

Введение

Становление современного информационного общества приводит к коренным изменениям во всех сферах жизни и деятельности человека. В сознании людей все больше утверждается мысль о том, что «будущий стратегический потенциал общества будут составлять не вещество и энергия, а информация и научные знания» [4, с.

3], что «мощь любого государства будет определяться не уровнем развития промышленности, новизной и эффективностью ее технической базы, а уровнем информатизации общества» [5, с. 9].

В недалеком будущем реально защищенным в социальном плане может быть лишь только широкообразованный человек, способный гибко перестраивать направление и содержание своей деятельности в связи со сменой технологий или требований рынка.

В наши дни владение ИТ становится в один ряд с такими качествами, как умение читать и писать. Сегодня специалист с высшим образованием должен «свободно ориентироваться в мировом информационном пространстве, иметь необходимые знания и навыки поиска, обработки и хранения информации с использованием современных ИТ, компьютерных систем и сетей» [4, с. 3].

С вступлением общества в век компьютерных технологий появилась возможность более эффективной обработки и представления информации. Это позволило эффективно хранить и обрабатывать большие потоки информации.

Но на современном этапе развития информационной культуры общества знания устаревают очень быстро, и человек вынужден учиться всю жизнь.

Огромный объём знаний, накопленный человечеством, заставляет искать иные подходы к организации процесса обучения.

Как отмечают в своей статье «Филология и современные информационные технологии (К постановке проблемы)» К.В. Вигурский и И.А.

Пильщиков, «осознание фундаментальной роли информации в общественном развитии и огромные темпы роста ИТ обусловили необходимость формирования особой информационной культуры личности.

Для использования новых компьютерных технологий в жизни требуется новое мышление, которое должно воспитываться у ребёнка с младших классов. Развитие и широкое внедрение информационных технологий воздействует на все сферы современной жизни, включая экономику, политику, науку и образование» [2].

ИТ – «это совокупность методов и программно-технических средств, объединенных в технологическую цепочку, обеспечивающею сбор, обработку, хранение, распределение и отображение информации с целью снижения трудоемкости процессов использования информационных ресурсов» [6].

Сегодня использование ИТ значительно увеличивает эффективность функционирования любой сферы человеческой деятельности. Лингвистика не является исключением.

Какими бы далекими областями, на первый взгляд, ни казались ИТ и лингвистика, неоспоримая связь между ними подтверждается хотя бы фактом существования компьютерной лингвистики (КЛ) – «направления в прикладной лингвистике, ориентированного на использование компьютерных инструментов – программ, компьютерных технологий организации и обработки данных – для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах и т.д., а также всей сферы применения компьютерных моделей языка в лингвистике и смежных дисциплинах» [7]. Более того, если учесть, что главным предметом исследования в лингвистике являются тексты и что именно современные ИТ открывают новые возможности для обработки и анализа текстов и предоставляют разнообразные средства создания, распространения, поиска и учета текстовой информации, связь и взаимодействие этих двух сфер становятся еще более очевидными.

Сказанное выше объясняет актуальность темы данной работы. Ее целью является анализ возможностей и эффективности применения ИТ в лингвистике в целом и в исследовании автора, связанном с изучением искусствоведческих текстов на английском и русском языках, в частности. Для достижения поставленной цели необходимо решить следующие задачи.

· Сделать обзор литературы, посвященной применению ИТ в лингвистике.

· Охарактеризовать основные лингвистические программы и ресурсы, представленные в сети Интернет.

· Рассмотреть те программы и ресурсы, которые целесообразно использовать при исследовании искусствоведческих текстов.

В связи с тем, что в ходе исследования необходимо изучить разнообразную литературу, делая при этом определенные выводы из прочитанного, освоить специфику использования различных программ обработки текстов, показывая их эффективность на конкретных примерах и сравнивая между собой, в работе применяются методы анализа, синтеза, дедукции, индукции, сравнения.

Общая концепция работы состоит в том, чтобы, ознакомившись с литературой по теме и основными лингвистическими программами, понять, каким образом и насколько эффективно можно использовать ИТ непосредственно при обработке текстов искусствоведческой проблематики, и выяснить, имеют ли полученные с помощью ИТ языковые данные научную ценность для магистерской диссертации.

глава 1. обзор литературы

Среди существующих литературных источников, посвященных применению ИТ в лингвистике, стоит отметить следующие: «Информационные технологии в лингвистике» А.В. Зубова [4], «Основы искусственного интеллекта для лингвистов» А.В. Зубова и И.

И Зубовой [5], «Автоматическое понимание текстов: системы, модели, ресурсы» Н.Н. Леонтьева [8], «Новые информационные технологии и лингвистика» Р.К. Потаповой [12], «Компьютерная обработка лингвистических данных» А.В. Всеволодовой [3].

В учебном пособии «Информационные технологии в лингвистике» А.В.

Зубов определяет прикладную лингвистику (ПЛ) как особую область лингвистики, «которая осуществляет реализацию лингвистических знаний с целью решения всякого рода практических задач» [4, с.

6], а также как «раздел языкознания, в котором разрабатываются методы решения практических задач, связанных с оптимизацией использования языка как важнейшего средства человеческой коммуникации» [4, с. 7].

Затем автор дает определение ИТ как «совокупности законов, методов и средств получения, хранения, передачи, распространения, преобразования информации с помощью компьютеров» [4, с. 8]. Кроме того, А.В.

Зубов конкретизирует определение понятия «ИТ» по отношению к лингвистике и замечает, что ИТ в лингвистике «это совокупность законов, методов и средств получения, хранения, передачи, распространения, преобразования информации о языке и законах его функционирования с помощью компьютеров» [4, с. 8].

Далее автор перечисляет задачи прикладной лингвистики, среди которых:

· создание систем искусственного интеллекта;

· создание систем автоматического перевода;

· создание систем автоматического аннотирования и реферирования текстов;

· создание систем порождения текстов;

· создание систем обучения языку;

· создание систем понимания устной речи;

· создание систем генерации речи;

· создание автоматизированных информационно-поисковых систем;

· создание систем атрибуции и дешифровки анонимных и псевдоанонимных текстов;

· разработка различных баз данных для гуманитарных наук;

· разработка различного типа автоматических словарей;

· разработка систем передачи информации в сети Интернет и т.д.

Интересно отметить, что А.В. Зубов также вводит понятия «лингвистической информации» и «лингвистической информатики».

Так, под лингвистической информацией он понимает множество определенным образом связанных сведений, данных, понятий о языке и правилах его функционирования, отраженных в нашем сознании и влияющих на наше речевое поведение.

А лингвистическая информатика – это «наука, изучающая законы и методы организации и переработки с помощью компьютера лингвистической информации» [4, с. 12].

Источник: https://mirznanii.com/a/281310/vozmozhnosti-primeneniya-it-v-lingvistike-5

Refy-free
Добавить комментарий