МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение высшего образования
«Алтайский государственный университет»

Работа переводчика в мобильных компьютерных сетях

рабочая программа дисциплины
Закреплена за кафедройКафедра лингвистики, перевода и иностранных языков
Направление подготовки45.03.02. Лингвистика
ПрофильПеревод и переводоведение
Форма обученияОчная
Общая трудоемкость3 ЗЕТ
Учебный план45_03_02_Лингвистика_ПиП-2021
Часов по учебному плану 108
в том числе:
аудиторные занятия 26
самостоятельная работа 55
контроль 27
Виды контроля по семестрам
экзамены: 6

Распределение часов по семестрам

Курс (семестр) 3 (6) Итого
Недель 17,5
Вид занятий УПРПДУПРПД
Практические 26 26 26 26
Сам. работа 55 55 55 55
Часы на контроль 27 27 27 27
Итого 108 108 108 108

Программу составил(и):
к.ф.н., доцент, Савочкина Елена Александровна

Рецензент(ы):
д.ф.н., профессор, Карпухина Виктория Николаевна

Рабочая программа дисциплины
Работа переводчика в мобильных компьютерных сетях

разработана в соответствии с ФГОС:
Федеральный государственный образовательный стандарт высшего образования - бакалавриат по направлению подготовки 45.03.02 Лингвистика (приказ Минобрнауки России от 12.08.2020 г. № 969)

составлена на основании учебного плана:
45.03.02 Лингвистика
утвержденного учёным советом вуза от 27.04.2021 протокол № 6.

Рабочая программа одобрена на заседании кафедры
Кафедра лингвистики, перевода и иностранных языков

Протокол от 11.05.2022 г. № 10
Срок действия программы: 20222024 уч. г.

Заведующий кафедрой
к.ф.н., доцент Саланина Ольга Сергеевна


Визирование РПД для исполнения в очередном учебном году

Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2023-2024 учебном году на заседании кафедры

Кафедра лингвистики, перевода и иностранных языков

Протокол от 11.05.2022 г. № 10
Заведующий кафедрой к.ф.н., доцент Саланина Ольга Сергеевна


1. Цели освоения дисциплины

1.1.Целью дисциплины является формирование у студентов способности эффективно решать профессиональные задачи с использованием теоретических знаний и практического опыта в области информационно-коммуникационных технологий, развитие навыков работы с корпусами текстов, интернет-ресурсами.

2. Место дисциплины в структуре ООП

Цикл (раздел) ООП: Б1.В.01

3. Компетенции обучающегося, формируемые в результате освоения дисциплины

ПК-5Способен оформлять текст перевода в компьютерном текстовом редакторе
ПК-5.1 Знает основные правила размещения и корректировки информации соответственно заданным параметрам в текстовом редакторе
ПК-5.2 Умеет грамотно использовать электронные двуязычные и одноязычные словари для работы в онлайновом и офлайновом режиме
ПК-5.3 Владеет методикой составления специализированных терминологических словарей и глоссариев
В результате освоения дисциплины обучающийся должен
3.1.Знать:
3.1.1.Виды электронных лингвистических ресурсов: офлайн-и онлайн-словари, языковые форумы, порталы, корпусы.
Правила регистрации и работы на информационных порталах.
Особенности корректуры с помощью функций вставки, правки, перемещения и т.д.
3.2.Уметь:
3.2.1.Верифицировать и классифицировать информацию, найденную в офлайн-и онлайн-словарях, на языковых форумах, порталах,в корпусах текстов.
Работать с основными машинными переводческими программами.
Пользоваться текстовыми и графическими редакторами; оформлять текст перевода в электронном виде с учётом переводческой задачи.
3.3.Иметь навыки и (или) опыт деятельности (владеть):
3.3.1.Навыки верифицирования и корректировки электронных переводов.
Навыками обработки большого объёма иноязычной информации, учитывая безопаснось при работе с мировыми информационными ресурсами (поисковыми сайтами, страницами зарубежных вузов и профессиональных сообществ, электронными энциклопедиями.
Навыками графического оформления текста перевода.

4. Структура и содержание дисциплины

Код занятия Наименование разделов и тем Вид занятия Семестр Часов Компетенции Литература
Раздел 1. Электронные словари
1.1. Двуязычные электронные словари Практические 6 4 Л1.1
1.2. Выполненние практических заданий Сам. работа 6 8 Л1.1
1.3. Одноязычные электронные словари Практические 6 4
1.4. Выполнение заданий Сам. работа 6 8
Раздел 2. Системы машинного перевода
2.1. Программа автоматизированного перевода Wordfast Практические 6 4 Л1.1, Л2.1
2.2. Выполненние практических заданий Сам. работа 6 6 Л1.1, Л2.1
2.3. Работа в системе машинного перевода Smartcat Практические 6 4
2.4. Выполнение практических заданий Сам. работа 6 6
Раздел 3. Составление электронных глоссариев
3.1. Составление отраслевых глоссариев в системе Smartcat Практические 6 2 Л1.1
3.2. Выполненние практических заданий Сам. работа 6 6 Л1.1
Раздел 4. Системы машинного перевода. Сопоставление качества машинных переводов
4.1. Системы машинного перевода. Виды и стратегии машинного перевода Практические 6 2 Л1.1
4.2. Выполненние практических заданий Сам. работа 6 8 Л1.1
Раздел 5. Лингвистические корпуса текстов
5.1. Корпус текстов British National Corpus Практические 6 2 Л1.1, Л2.1
5.2. Выполненние практических заданий Сам. работа 6 7 Л1.1, Л2.1
5.3. Национальный корпус русского языка. Параллельные тексты на английском языке Практические 6 4
5.4. Выполнение практических заданий. Сам. работа 6 6

5. Фонд оценочных средств

5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины
Оценочные материалы для текущего контроля по разделам и темам дисциплины в полном объеме размещены в онлайн-курсе на образовательном портале «Цифровой университет АлтГУ» – https://portal.edu.asu.ru/course/view.php?id=6309
ОЦЕНКА СФОРМИРОВАННОСТИ КОМПЕТЕНЦИИ ПК-5
Способен оформлять текст перевода в компьютерном текстовом редакторе
ПРИМЕРЫ ЗАДАНИЙ ЗАКРЫТОГО ТИПА
1. Что такое сниппет?
а) искомая лексема во всех её словоформах
б) контексты, которые исследователь получает в качестве результата поиска в корпусе
Ответ: б
2. Что такое лемма?
а) исходная, словарная форма слова
б) словоформа в контексте
в) грамматические признаки слова
Ответ: а
3. Что в корпусе текстов обозначает помета «омонимия снята»?
а) контексты размеченные только автоматически
б) вычитанные человеком контексты
Ответ: б
4. Что такое представительность или репрезентативность Корпуса?
а) корпус представлен большим количеством единиц
б) корпус регулярно пополняется
в) корпус содержит по возможности все типы письменных и устных текстов, представленные в том или ином языке
Ответ: в
5. К какому типу относится письменный корпус Британского национального корпуса BNC: http://www.natcorp.ox.ac.uk/?
а) одноязычный корпус
б) корпус параллельных текстов
6. Как называется корпус, который включает в себя произведения в оригинале и несколько различных переводов этого произведения на один и тот же язык?
а) поливариантный корпус
б) мультиязычный корпус
Ответ: а
7. К какой системе относится система машинного перевода Trados?
а) Translation memory
б) Rule-Based Machine Translation
в) Statistical Machine Translation
Ответ: а
8. Как называется процесс, когда человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка?
а) постредактирование
б) интерредактирование
в) предредактирование
Ответ: в
9.Для перевода с одного языка на другой язык применяются программы (удалите 1 лишнюю):
а) словари
б) переводчики текстовых документов
в) статистического подсчета
Ответ: в
10. Как называют сохраненные комплекты настройки программы перевода ?
а) шаблоны тематики
б) препроцессоры
Ответ: а
11. Что не входит в состав лингвистической базы данных?
а) Лексико-грамматический классификатор
б) Базовый двуязычный морфологический словарь
в) конверторы
Ответ: в
12. Что такое Спайдеринг?
а) процесс загрузки подходящего набора страниц для анализа
б) методики извлечения содержимого из каждой выгруженной страницы, необходимые для подготовки его к анализу
Ответ: а
13. Текст оригинала, загруженный в систему переводческой памяти в формате MS Word, имеет большое количество синих значков. Что это значит?
а)готового сегмента перевода еще нет
б) гиперссылки, которые в тексте перевода должны работать точно так же, как в тексте оригинала
Ответ: б
14. При выполнении переводческого проекта, кто может загрузить файл и разбить его на фрагменты?
а) заказчик перевода
б) менеджер проекта
в) участники проекта
Ответ: б
15. Какая платформа является автоматической системой перевода а не автоматизированоой?
а) Google
б) Smart Cat
в) Wordfast
Ответ: а
КРИТЕРИИ ОЦЕНИВАНИЯ: Каждое задание оценивается 1 баллом. Оценивание КИМ теоретического характера в целом:
• «зачтено» – верно выполнено более 50% заданий; «не зачтено» – верно выполнено 50% и менее 50% заданий;
• «отлично» – верно выполнено 85-100% заданий; «хорошо» – верно выполнено 70-84% заданий; «удовлетворительно» – верно выполнено 51-69% заданий; «неудовлетворительно» – верно выполнено 50% или менее 50% заданий.
ПРИМЕРЫ ЗАДАНИЙ ОТКРЫТОГО ТИПА
1.Что такое автоматизированный перевод ?
Ответ: выполняется человеком с привлечением электронного словаря, установленного на компьютере или на сайте
2. Что такое электронный словарь ?
Ответ: программа, которая по запрашиваемому слову открывает словарную статью с вариантами перевода слова, примерами словосочетаний и фраз, причем не только общей лексики, но и специализированных (отраслевых) словарей
3. Приведите примеры электронных словарей.
Ответ: Лингво, МультиЛекс, Контекст, PromtED, Bridge to English, Сократ
4. Что такое машинный перевод?
Ответ: компьютерная программа, которая анализирует текст источника и выполняет перевод без вмешательства человека
5. Что такое статистический машинный перевод ?
Ответ: перевод, основанный на сравнении больших объемов языковых пар текстов, содержащих предложения на одном языке и соответствующие им предложения на втором
6. Что такое резервирование слов ?
Ответ: создание списка слон (имен, названий), которые программа должна оставить без перевода, особенно те слова, которые совпадают со значимыми словами
7. Что такое препроцессоры?
Ответ: предварительные условия, позволяющие отменить перевод особых конструкций, например адресов электронной почты, имен файлов, а также выбрать форму представления даты и времени в тексте перевода
8. Что такое текстовый корпус?
Ответ: это машиночитаемые базы текстовых данных, в которых можно осуществлять поиск по определенным критериям
9. Что понимают под «вхождением» при работе с текстовым корпусом?
Ответ: случаи употребления искомой лексемы во всех ее словоформах.
10. Что такое сниппеты?
Ответ: небольшие отрезки текстовой информации, которые выводятся в выдаче поисковой системы рядом с ссылкой на запрос пользователя
11. Что такое KWIC?
Ответ: это фрагменты контекстов длиной в одну строку, в середине которой расположено искомое слово или словосочетание.
12. Что такое метаразметка?
Ответ: я сведения о документах (то есть текстах), входящих в корпус: об авторе текста, названии текста и дате его публикации, некоторых его свойствах (объём, жанр, тип, тематика)
13. Что такое акцентная разметка?
Ответ: разметка в корпусе с указанием ударения
14. Что такое сбалансированность корпуса?
Ответ: Это означает, что тексты различных жанров представлены в них в равной пропорции
15. Что такое корпуса параллельных текстов?
Ответ: Это особый тип корпуса, в котором тексту на определенном языке сопоставлен перевод этого текста на иностранный язык или несколько языков
16. Что такое выравнивание оригинального и переводного текстов?
Ответ: Между единицами оригинального и переводного текста (обычно —между предложениями) с помощью специальной процедуры устанавливается соответствие
17. Что такое поливариантный корпус?
Ответ: Поливариантный корпус включает в себя произведения в оригинале и несколько различных переводов этого произведения на один и тот же язык. Пример: «Алиса в стране чудес» Льюиса Кэрролла в переводе на русский язык
Натальи Демуровой, Владимира Набокова, Бориса Заходера в параллельном корпусе НКРЯ
18. Что означает число в окнах «Расстояние от … до» при поиске словосочетаний в корпусе?
Ответ: Единица соответствует контекстам, где искомые словоформы расположены подряд, двойка – через одно слово, и так далее.
19. Можно ли в корпусе сравнить распределение словоформ по годам?
Ответ: Можно, результат будет представлен в виде графика, на котором показана частота употребления лексемы на миллион словоформ
20. Как можно проанализировать, каким образом поступают переводчики на английский язык в случае, если в тексте оригинала на русском языке встречается неполиткорректная лексика?
Ответ: С помощью корпуса параллельных текстов; с помощью функции «задать подкорпус» выбрать только тексты, в которых исходный язык русский, а язык перевода – английский
КРИТЕРИИ ОЦЕНИВАНИЯ ОТКРЫТЫХ ВОПРОСОВ.
«Отлично» (зачтено): Ответ полный, развернутый. Вопрос точно и исчерпывающе передан, терминология сохранена, студент превосходно владеет основной и дополнительной литературой, ошибок нет.
«Хорошо» (зачтено): Ответ полный, хотя краток, терминологически правильный, нет существенных недочетов. Студент хорошо владеет пройденным программным материалом; владеет основной литературой, суждения правильны.
«Удовлетворительно» (зачтено): Ответ неполный. В терминологии имеются недостатки. Студент владеет программным материалом, но имеются недочеты. Суждения фрагментарны.
«Неудовлетворительно» (не зачтено): Не использована специальная терминология. Ответ в сущности неверен. Переданы лишь отдельные фрагменты соответствующего материала вопроса. Ответ не соответствует вопросу или вовсе не дан.




5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.)
Не предусмотрено.
5.3. Фонд оценочных средств для проведения промежуточной аттестации
Промежуточная аттестация заключается в проведении в конце семестра экзамена по всему изученному курсу.Экзамен проводится в устно-письменной форме по билетам. В билет входит 2 вопроса: 1 вопрос теоретического характера и 1 вопрос практико-ориентированного характера.

ВОПРОСЫ ТЕОРЕТИЧЕСКОГО ХАРАКТЕРА
1.Для каких целей при переводе используются информационные электронные
средства? Приведите примеры таких средств.
2. В чем разница между поисковыми системами
типа «индекс» и «каталог»?
3.Что значит метапоиск? Какие системы позволяют осуществлять метапоиск?
4.Какую функцию выполняет комбинация «горячих» клавиш <CTRL+F>?
5.Какую информацию переводчик может найти на сайте www.cia.gov?
6.Предложите наиболее оптимальный алгоритм действий переводчика для решения следующих задач:
-перевод экзотического топонима на английский язык
-передать по-английски имя и фамилию лица иностранного происхождения
-перевести название организации.
7.Как осуществить поиск фразы на веб-страницах?
8.Что означает логический оператор ORв строке запроса?
9.Что необходимо ввести в строке поиска, если переводчику нужно определение термина на английском языке?
10. Какие преимущества дает применение электронных двуязычных словарей по сравнению с бумажными?
11. Какими базовыми электронными двуязычными словарями пользуется профессиональный переводчик?
12.На каких сайтах можно найти специализированные словари в Интернете?
13. Какие преимущества у компьютерных версий одноязычных словарей по сравнению с бумажными версиями?
14.Где можно найти информацию об антонимах, гиперонимах, гипонимах и синонимах английского языка?
15.Назовите наиболее популярные англоязычные и русскоязычные системы для расшифровки сокращений.
16.Составьте список словарей (глоссариев) по определенной тематике
17. С какой целью используются в переводческой практике руководства по стилю? Какие переводческие проблемы они помогают решать?
18.В каких крупных информационных агентствах мира имеются свои собственные корпоративные руководства по стилю?
19. Назовите крупные электронные библиотеки на английком языке и авторитетные СМИ, имеющие электронные версии своих изданий.
20. Расскажите о компьютерном фоносемантическом анализе текста.

ВОПРОСЫ ПРАКТИКО-ОРИЕНТИРОВАННОГО ХАРАКТЕРА
Образец вопроса:
Найдите в интернете словари синонимов и подберите синонимы для следующих слов и словосочетаний: а) нейтральные; б) эмоционально-окрашенные (выражающие положительную и отрицательную оценку).
В каком из словарей представлено больше синонимов? В каком из словарей предлагаются клишированные словосочетания? Какую еще информацию предоставляют онлайн словари синонимов? Оцените её полезность и целесообразность.
РУС.: разумный, ограбить, разузнать, круиз, вымысел, беда, польза, возмездие, воровать, ненавидеть, невежа.
АНГЛ.: smart, learn, know, route, dream, trouble, favor, use, do, cad, beautiful, outgoing, case, part, right.
КРИТЕРИИ ОЦЕНИВАНИЯ:
«Отлично» : студентом дан полный, в логической последовательности развернутый ответ на поставленные вопросы, где он продемонстрировал знания предмета в полном объеме учебной программы, достаточно глубоко осмысливает дисциплину, самостоятельно, и исчерпывающе отвечает на дополнительные вопросы, приводит собственные примеры по проблематике поставленного вопроса, решил предложенные практические задания без ошибок.
«Хорошо» : студентом дан развернутый ответ на поставленный вопрос, где студент демонстрирует знания, приобретенные на лекционных и семинарских занятиях, а также полученные посредством изучения обязательных учебных материалов по курсу, дает аргументированные ответы, приводит примеры, в ответе присутствует свободное владение монологической речью, логичность и последовательность ответа. Однако допускаются неточности в ответе. Решил предложенные практические задания с небольшими неточностями.
«Удовлетворительно» студентом дан ответ, свидетельствующий в основном о знании процессов изучаемой дисциплины, отличающийся недостаточной глубиной и полнотой раскрытия темы, знанием основных вопросов теории, слабо сформированными навыками анализа явлений, процессов, недостаточным умением давать аргументированные ответы и приводить примеры, недостаточно свободным владением монологической речью, логичностью и последовательностью ответа. Допускается несколько ошибок в содержании ответа и решении практических заданий.
«Неудовлетворительно» : студентом дан ответ, который содержит ряд серьезных неточностей, обнаруживающий незнание процессов изучаемой предметной области, отличающийся неглубоким раскрытием темы, незнанием основных вопросов теории, неумением давать аргументированные ответы. Выводы поверхностны. Решение практических заданий не выполнено. Студент не способен ответить на вопросы даже при дополнительных наводящих вопросах преподавателя.


6. Учебно-методическое и информационное обеспечение дисциплины

6.1. Рекомендуемая литература
6.1.1. Основная литература
Авторы Заглавие Издательство, год Эл. адрес
Л1.1 Щипицина Л.Ю. Информационные технологии в лингвистике : учебное пособие Издательство "ФЛИНТА", ЭБС "Лань", 2013 e.lanbook.com
6.1.2. Дополнительная литература
Авторы Заглавие Издательство, год Эл. адрес
Л2.1 Гребенщикова А.В. Основы квантитативной лингвистики и новых информационных технологий: учебное пособие : учебное пособие Издательство "ФЛИНТА", ЭБС "Лань", 2015 e.lanbook.com
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет"
Название Эл. адрес
Э1 курс в Moodle "Работа переводчика в мобильных компьютерных сетях" portal.edu.asu.ru
6.3. Перечень программного обеспечения
Microsoft Office 2010 (Office 2010 Professional, № 4065231 от 08.12.2010), (бессрочно);
Microsoft Windows 7 (Windows 7 Professional, № 61834699 от 22.04.2013), (бессрочно);
Chrome (http://www.chromium.org/chromium-os/licenses ), (бессрочно);
7-Zip (http://www.7-zip.org/license.txt ), (бессрочно);
AcrobatReader(http://wwwimages.adobe.com/content/dam/Adobe/en/legal/servicetou/Acrobat_com_Additional_TOU-en_US-20140618_1200.pdf), (бессрочно);
ASTRA LINUX SPECIAL EDITION (https://astralinux.ru/products/astra-linux-special-edition/), (бессрочно);
LibreOffice (https://ru.libreoffice.org/), (бессрочно);
Веб-браузер Chromium (https://www.chromium.org/Home/), (бессрочно);
Антивирус Касперский (https://www.kaspersky.ru/), (до 23 июня 2024);
Архиватор Ark (https://apps.kde.org/ark/), (бессрочно);
Okular (https://okular.kde.org/ru/download/), (бессрочно);
Редактор изображений Gimp (https://www.gimp.org/), (бессрочно)
6.4. Перечень информационных справочных систем
http://dictionary.cambridge.org/
http://engood.ru/
http://www.oxfordlearnersdictionaries.com/
http://www.macmillandictionary.com/
https://www.collinsdictionary.com/
https://www.merriam-webster.com/

7. Материально-техническое обеспечение дисциплины

Аудитория Назначение Оборудование
Учебная аудитория для проведения занятий лекционного типа, занятий семинарского типа (лабораторных и(или) практических), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проектирования (выполнения курсовых работ), проведения практик Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска)
Помещение для самостоятельной работы помещение для самостоятельной работы обучающихся Компьютеры, ноутбуки с подключением к информационно-телекоммуникационной сети «Интернет», доступом в электронную информационно-образовательную среду АлтГУ
513Д лаборатория "Лингафонный кабинет фмкфип"- учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации Учебная мебель на 20 посадочных мест; рабочее место преподавателя; интерактивная доска в комплекте; рабочее место преподавателя в комплекте (стол, ПК, гарнитура); 20 рабочих мест студента в комплекте (стол, гарнитура, цифровой пульт); специализированное коммутационное устройство «Норд Ц» в комплекте; компьютер: модель Инв. №0160604664 - 1 единица; проектор: марка SMART модель UF70 - 1 единица; интерактивная доска: марка SmartBoard модель SB480iv3 - 1 единица; монитор: марка ViewSonic модель VA1948M-LED - 1 единица; микросистема преподавателя Panasonic SA-PM07; учебно-наглядные пособия, карты

8. Методические указания для обучающихся по освоению дисциплины

Программа дисциплины включает практические занятия и самостоятельную работу студентов.
В ходе занятий преподаватель знакомит студентов со спецификой переводческой деятельности в современном мире, раскрываются основные вопросы в рамках рассматриваемых тем, подробно освещаются наиболее сложные и важные положения изучаемого материала.

Самостоятельной работе следует придать большую практическую направленность, ориентируя студентов на самостоятельное изучение отдельных вопросов, изучение специальной литературы.
В процессе преподавания дисциплины необходимо придерживаться базового учебного плана и рабочей программы

Современные компьютерные технологии помогают при решении следующих переводческих задач:
– общение с заказчиком и получение исходного текста;
– восприятие электронного иноязычного текста;
– информационно-справочный поиск по тематике иноязычного текста;
– переводческий анализ иноязычного текста;
– создание аннотированных списков информационных ресурсов;
–подбор переводческих соответствий и эквивалентов;
– создание текста перевода;
– создание примечаний переводчика;
– создание электронной информационно-справочной базы переводчика,
– редактирование, корректирование и верстка выполненного перевода иноязычного текста в соответствии с требованиями заказчика;
– оценка качества выполненного перевода иноязычного текста;
– сдача выполненного перевода иноязычно текста заказчику.
В связи с этим целью курса является помощь в приобретении основополагающих знаний, умений, навыков в области компьютерного перевода с иностранного языка на русский и с русского языка на иностранный.
Для целенаправленного поиска лингвистической информации следует пользоваться не популярными порталами, а специализированными поисковыми сайтами.
Поиск по ключевым словам позволяет быстро найти образец документа, который вам предстоит переводить (договор аренды – ключевые слова “rental agreement”, решение суда о праве воспитания ребенка – “family law” и затем поиск нужного документа на специализированном сайте)
Если вам нужно быстро найти толкование незнакомого термина, но вы не знаете, где найти глоссарий по данной теме, начать стоит с OneLook Dictionaries (www.onelook.com) , а если это не помогло, введите искомое слово в окно поиска на Google и добавьте слово Glossary или Dictionary.
Для формирования корпусов текстов лучше всего использовать популярный оффлайновый браузер Teleport Pro ( http://www.tenmax.com/teleport/pro/home.htm ). В тех случаях, когда сайт не поддается автоматическому скачиванию, интересующие вас материалы можно загрузить вручную, используя программу докачки ReGet ( http://www.reget.com/ru ) или ее аналоги.
Для индексации и поиска информации можно рекомендовать программу dtSearch (www.dtsearch.com). Программа поддерживает все основные типы файлов ( htm *, doc , txt ( ANSI и ASCII ), xls ), индексирует zip-архивы с минимальной потерей скорости, может работать с любыми языками на основе латиницы, с кириллицей и греческими шрифтами. Платная версия также поддерживает формат pdf .