25 декабря 2012

Словарная оболочка Lingoes под лупой

Обычно я выбираю некое направление деятельности/потребности и произвожу в отношении него обзор программ. Но этот мой пост посвящён только одному приложению, вернее, используемым в нём ресурсам. Как принято говорить, сказав "А", нужно произнести и "Б". В своей прошлой статье я просмотрела множество программ-словарей, отдав приоритет Lingoes. Но даже от очень хорошей программы мало пользы, если не научиться ею пользоваться и не произвести тонкую настройку под свои потребности. Итак, всё, что находится ниже, посвящено работе с Lingoes. Кто с ней не знаком, можете почитать краткое описание на  shirrma.blogspot.de. А эту статью читать не следует. Разве что, возможно, если интересуетесь иностранными языками, найдёте что-то полезное в самом конце, который посвязщён озвучке слов и обзору сайта swac-collections.org (projet Shtooka), содержащем крупную коллекцию различных произношений.


Понимаю, что организация статьи не самая лучшая, но возможности текстового редактора в блоге ограничены. Мне и так пришлось повыкручиваться с ручной корректировкой кода, чтобы расположить скриншоты в два столбца. На что только не пойдёшь, чтобы была возможности их нормально сравнить. :) Создавала статью в первую очередь для себя, чтобы разобраться и при возникновении какого-либо вопроса/потребности можно сравнить, навести справку. Такая публичненькая записная книжка, выставленная мною на публичное ознакомление-обсуждение.

Краткое оглавление того, что располагается внизу:
- сравнение словарей Lingoes, обеспечивающих англо-русско-украинские направления перевода;
- краткое рассмотрение справочников и энциклопедий, которые можно подключить к Lingoes;
- ознакомление с возможностями словарей, устанавливаемых всести с программой;
- сравнение online-сервисов перевода текста;
- рассмотрение пакетов озвучки слов;
- рассмотрение начинка упомянутого сайта swac-collections.org



В соответствии с оглавлением, начинаю со словарей перевода. Скачиваются они отсюда. Ниже привожу скриншоты, как они обрабатывают одни и те же слова. Иногда приводимые значения слова полностью а экран монитора не убиралась, в результате этого скриншоты выглядят обрезанными в конце. Словари рассматривала в порядке увеличения их веса в мегабайтах. Узкоспециализированные словари вне очереди перенесла в самый конец. Размер и количество слов приведены округлённо, ибо детали здесь не важны. Серым курсивом передано оригинальное описание словарей. В конце делаю небольшой вывод, выделяя его синим. Это моё личное мнение, если с ним не согласны или хотите дополнить, то добро пожаловать в комментарии.
Вступление сделано. Поедем!


АНГЛО-РУССКИЕ  СЛОВАРИ

1. Общей лексики
1а) Quick English-Russian Dictionary (v2.4) - 0.6 Мб, 32 000 слов



1б) Vicon English-Russian Dictionary (v2) - 3.8 Мб, 92 000 слов
This comprehensive English-Russian dictionary contains words, phrases, abbreviations & acronyms. It includes terms from a vast variety of subjects, such as Medicine, Electronics, Zoology, Business, Computers, Religion, etc., and features both the American and British forms of spelling.



1в) English-Russian Short Dictionary (v2)  - 5.3 Мб,  47 000 слов



1г) Apresyan English-Russian Dictionary (v2.4) - 15.7 Мб, 117 000 слов



1д) Universal English-Russian Dictionary (v2.4) - 16.2 Мб,  90 000 слов


2. Специализированные
2а) Building English-Russian Dictionary (v2.4) - 2.8 Мб, 50 000 слов
The Dictionary contains about 65,000 terms which cover the following branches of construction studies: engineering buildings and tools, construction and installation work, hydroengineering, engineering networks, construction materials and technologies, construction and road-building machines, construction tools, construction management, design, urban planning, ecology of construction, types of buildings and installations, architecture, theoretical foundations of construction. The Dictionary also contains terminology from related fields, including commercial and legal aspects of construction, trade in construction materials, valiation and trade in real estate. The Dictionary has been compiled to meet the needs of many specialists in construction industry and related fields, as well as of university professors, students and translators. It will be very useful for all specialists working on international construction projects.



2б) Polytechnical English-Russian Dictionary (v2.4) - 10.7 Мб, 176 000 слов  
The Comprehensive English-Russian Scientific and Technical Dictionary. © RUSSO, 1997. 200,000 words and expressions. This Dictionary is the first attempt in Russian lexicography to provide an all-encompassing snapshot of the current British, American, and Russian terminology related to technology and applied sciences. The Dictionary was compiled by a large team of experts specializing in various areas of scientific knowledge and technical translation. The authors and the publisher did their best to include as many terms as possible. Detailed entries have labels indicating to which branch of science or technology the given meaning belongs. In some cases, the most typical collocations are given. Headwords are either verbs or nouns. Adjectives can be found in the corresponding noun entries.

ВЫВОД: Для англо-русского направления перевода доступны 5 словарей общей лексики и 2 специализированных. Мне больше всех понравился Universal, очень хорош Apresyan, да и слов в нём побольше. Для всплывающих окошек, возможно, лучше подойдёт Vicon. От словарей Quick и Short по сравнению с ними пользы немного. Возможно, кто-то решит использовать Short в качестве второго словаря для всплывающих окошек.
Специализированные словари (Building и Polytechnical) обычному человеку не нужны.





РУССКО-АНГЛИЙСКИЕ СЛОВАРИ

1. Общей лексики
1а) Quick Russian-English Dictionary (v2.4) - 0.5 Мб, 23 000 слов


1б) Russian-English Short Dictionary (v2) - 4.8 Мб, 69 000 слов


1в) Vicon Russian-English Dictionary (v2) - 6.8 Мб, 87 000 слов
This comprehensive Russian-English dictionary contains words, phrases, abbreviations & acronyms. It includes terms from a vast variety of subjects, such as Medicine, Electronics, Zoology, Business, Computers, Religion, etc.


1г) Universal Russian-English Dictionary (v2.4) - 9.0 Мб,  68 000 слов   


2. Специализированные
2а) Building Russian-English Dictionary (v2.4) - 1.6 Мб, 41 000 слов
 The English-Russian Dictionary of Construction and New Constructional Technologies. © Russkiy Yazyk - Media, 2003, V.V. Bykov, A.A. Pozdnyakov. 65,000 words and expressions.


2б) Polytechnical Russian-English Dictionary (v2.4) - 5.3 Мб, 123 000 слов
The Comprehensive English-Russian Scientific and Technical Dictionary. © RUSSO, 1997. 200,000 words and expressions.

ВЫВОД: Мне больше всех понравился Universal, да и ударение в русских словах с его помощью можно чуть скорректировать (мне же ЕГЭ через 5 месяцев сдавать). В Vicon побольше слов, можно поставить его в качестве второго. По сравнению с ними Quick слишком мал и короток, а Short оформлен неудобно - всё в одну строчку и одним шрифтом.
Специализированные Building и Polytechnical обычному человеку не нужны.







УКРАИНО-РУССКИЕ  СЛОВАРИ

1) Universal Ukrainian-Russian Dictionary (v2.4) - 2.9 Мб, 56 000 слов

2) Polytechnical Ukrainian-Russian Dictionary (v2.4) - 3.1 Мб, 87 000 слов
ВЫВОД: Без вариантов, только один словарь общей лексики.




РУССКО-УКРАИНСКИЕ СЛОВАРИ

1) Universal Russian-Ukrainian Dictionary - 3.2 Мб, 57 000 слов

2) Polytechnical Russian-Ukrainian Dictionary - 4.0 Мб, 81 000 слов
ВЫВОД: Аналогично, без вариантов, только один словарь общей лексики.






АНГЛО-УКРАИНСКИЕ  СЛОВАРИ

1а) Universal English-Ukrainian Dictionary (v2.4) - 4.3 Мб,  44 000 слов


1б) Large English-Ukrainian Dictionary (v2.4) - 6.2 Мб, 79 000 слов

2) Business English-Ukrainian Dictionary (v2.4) - 0.8 Мб, 13 000 слов
The English-Ukrainian Dictionary. Economics, Finance, Banking, Investments, Bank Loans. © 2002, S. Ya. Yermolenko, V. I. Yermolenko. 12,500 entries.

ВЫВОД: Large и оформлен красочнее, и слов больше. Но Universal более лаконичен, поэтому для всплывающих окошек подходит лучше. Для основного окна программы возможны различные варианты.
Business обычному человеку не нужен.




УКРАИНО-АНГЛИЙСКИЕ СЛОВАРИ

1) Universal Ukrainian-English Dictionary - 3.8 Мб, 56 000 слов

2) Business Ukrainian-English Dictionary - 0.7 Мб, 12 000 слов
The Ukrainian-English Dictionary. Economics, Finance, Banking, Investments, Bank Loans. © 2003, S. Ya. Yermolenko, V. I. Yermolenko. 12,500 entries.


ВЫВОД: Без вариантов, только один словарь общей лексики.




=========================
Кроме словарей перевода в Lingoes можно просматривать всевозможные энциклопедии. Я пробежалась, посмотрела, что есть интересненького. Привожу лишь оригинальные описания. Часто их вообще нет, а иногда очень длинные, в этом случае привожу лишь начало и ставлю многоточие. Итак:

на русском языке
Comprehensive Dictionary of Contemporary Russian
(Толковый словарь современного русского языка)
The Comprehensive Dictionary of the Contemporary Russian languages in four volumes is the largest existing Russian dictionaries (over 180,000 entries). The Dictionary reflects Russian lexis at the turn of the 21st century. It contains both core lexical items and specialist terms, including those that have been adopted by the Russian language in the last few years. Obscene, taboo, and slang words have not been included...

Russian Explanatory Dictionary
(Русский толковый словарь)
Автор - С.И.Ожегов, у меня дома есть подобный в бумажном варианте, такой толстый. Упадёт со шкафа на голову - мало не покажется. :)


на украинском языке
Comprehensive Dictionary of Contemporary Ukrainian (urk -> ukr)
(Толковый словарь современного украинского)
The Comprehensive Dictionary of the Contemporary Ukrainian Language. © Perun Publishers, 2005. 250,000 words and phrases.


 на английском языке 
Ой, на английском много всего. Интересно, у кого-нибудь хватит мужества во всё это вникнуть? :) Не советую. Иду быстро, вполне возможно, что-то ценное пропустила, но и приведённого хватит с лихвой.
P.S. Позднее я попыталась добавить к наиболее интересным словарям по паре скриншотов, но это оказалось сложной задачей из-за скромных возможностей blogger'а, так что выгладываю только по одному. Лично мне больше всего понравились "Vicon English Dictionary" и "WordNet English Dictionary", в каждом из которых почти по 150 000 слов. Отмечу, что они покрывают большинство слов и из "English Idioms Dictionary" и "English Slang Dictionary".
  
English Idioms Dictionary (8 009 words)


English Slang Dictionary  (2 828 words)


MacMillan English Dictionary - American (38 691 words)
The Macmillan English Dictionary is the first learners' dictionary that is uniquely designed from scratch to allow you to find the word you want using a book OR your computer.

The Merriam-Webster Dictionary contains over 225,000 definitions, phrases, idioms, and usage examples. Dictionary definitions include pronunciations, etymologies, derivatives and illustrations, as well as, links to related words and definitions.



With over fifty years of experience in dictionary publishing behind it, Random House Webster’s Unabridged Dictionary is the most definitive single-volume reference of the English language available. This modern dictionary offers an exhaustive, traditional study of the language, while covering the latest, most important developments–ahead of any other dictionary. The Random House Webster’s Dictionary is designed to meet the wide-ranging needs of today’s students and scholars, who may study ancient documents one hour and surf the Internet the next; of professional writers, who craft poems or write articles for technical journals; of businesspeople, who need to communicate clearly; and–above all–the needs of word lovers. In addition to standard and specialized vocabulary, this extensive volume contains a wide variety of up-to-date, authoritative information. The Random House Webster’s Unabridged Dictionary is a unique general reference volume for the office, the school, and the entire family...

Roget’s II: The New Thesaurus, Third Edition, allows the user to find the right synonym with a minimum of effort. Unlike many thesauruses, this easy-to-use reference lists main entry words alphabetically, as in a dictionary, for quick lookup. Each entry is divided into senses, with brief definitions and a full list of synonyms for each sense, to ensure that the selected usage is the most appropriate one.
All special usages, such as slang terms, are labeled and grouped together at the end of each synonym list. Following each list is a cross-reference to a related entry in the thesaurus’s unique Category Index. This index leads the reader from the starting word to dozens of others that have related or opposite meanings. All these features make Roget’s II the best resource for finding the right word every time.


Vicon English Dictionary (148 494 words) 
This comprehensive English-English dictionary contains words, phrases, abbreviations & acronyms. It includes terms from a vast variety of subjects, such as Medicine, Electronics, Zoology, Business, Computers, Religion, etc., and features both the American and British forms of spelling.

This is the English language Wikipedia.Wikipedia is a multilingual, Web-based, free-content encyclopedia. It is written collaboratively by volunteers with wiki software, meaning articles can be added or changed by nearly anyone

WordNet English Dictionary (147 249 words) 
WordNet® is a large lexical database of English, developed under the direction of George A. Miller. Nouns, verbs, adjectives and adverbs are grouped into sets of cognitive synonyms (synsets), each expressing a distinct concept. Synsets are interlinked by means of conceptual-semantic and lexical relations.
CIA World Factbook 2005
 U.S. government profiles of countries and territories around the world. A wealth of information on geography, maps, flags, people, government, transportation, economy, communications, military, and transnational issues.
 
Computer file name suffix

Concise English Dictionary
Concise English Dictionary based on WordNet, This comprehensive English-English dictionary contains words, phrases, abbreviations & acronyms.

Concise English Synonym & Antonym Dictionary (16 126 words)
(краткий словарь английских синонимов и антонимов)
По умолчанию устанавливается вместе с программой, подробнее - ниже.

Dictionary of English Abbreviations
 
Dictionary of Word Roots and Combining Forms
The best way to understand and remember technical terms is to understand first their component parts, or roots. To this end the various word roots, from the Latin, Greek, and other languages, that are most frequently encountered terms have been brought together in this dictionary.

English Synonym and Antonym Dictionary

Essential English Dictionary (18 088 words)
(Основные английский словарь)
По умолчанию устанавливается вместе с программой, подробнее - ниже.

FOLDOC Computing Dictionary
FOLDOC is a searchable dictionary of acronyms, jargon, programming languages, tools, architecture, operating systems, networking, theory, conventions, standards, mathematics, telecoms, electronics, institutions, companies, projects, products, history, in fact anything to do with computing.
 
File Extension Dictionary 

HTTP Error Message List
 
IANA Root Zone Internet Domains suffixes. Including gTLDs such as ".ORG", and country-code TLDs such as ".BR"
 
Jukuu is a dedicated sentence search engine, which is speicially disigned to help Non-Enlgish users to write native English expressions by providing related bilingual sentences.
По умолчанию устанавливается вместе с программой, подробнее - ниже.

More than 10,000 entries defining computer terms, slang, and acronyms cover hardware, software, networking, Web authoring, and .NET.
Microsoft terminology spreadsheet with translations for over 40 languages
Moby Thesaurus is the largest and most comprehensive thesaurus data source in English available for commercial use. This second edition has been thoroughly revised adding more than 5,000 root words (to total more than 30,000) with an additional _million_ synonyms and related terms (to total more than 2.5 _million_ synonyms and related terms).
A western religion, myths, legend and other related items 

Mr. Schmit developed the Shakespeare lexicon in the later 19th century, which had been used for more than one hundred years. However, to this day, it still to be the greatest Shakespeare lexicon of all...

How's your vocabulary? Is it okay, pretty good, or exceptional? Whatever your answer to these questions, this is the book for you. For those whose vocabulary ranges from okay to pretty good, here is the opportunity to improve it. The main content is grouped into sets of words that have been taken from the SAT and GRE examinations over the past 10 years. These approximately 1,500 words are expected by the examiners to be familiar in one form or another to college and graduate school applicants. They need to become familiar to you, too...

This dictionary is based on word parts—those prefixes, suffixes, combining forms and roots which show up repeatedly to form words—and is meant to be used in conjunction with a standard dictionary and a thesaurus. It can help to retrieve words only dimly remembered, or it can lead to specific new words which otherwise might never have been discovered.
WordNet® is a large lexical database of English, developed under the direction of George A. Miller. Nouns, verbs, adjectives and adverbs are grouped into sets of cognitive synonyms (synsets), each expressing a distinct concept. Synsets are interlinked by means of conceptual-semantic and lexical relations.
По умолчанию устанавливается вместе с программой, подробнее - ниже.




.--------------------
В Lingoes по умолчанию находится несколько словарей, я решила разобраться, что они из себя представляют и есть ли среди них какие-либо действительно полезные. Приступим:

1) Essential English Dictionary
(Основной английский словарь)



2) Concise English Synonym & Antonym Dictionary
(краткий словарь английских синонимов и антонимов)


3) WordNet Online

WordNet® is a large lexical database of English, developed under the direction of George A. Miller. Nouns, verbs, adjectives and adverbs are grouped into sets of cognitive synonyms (synsets), each expressing a distinct concept. Synsets are interlinked by means of conceptual-semantic and lexical relations.

4) Jukuu English Sentence (online)
По запросу "eternity" Jukuu ничего не обнаружил. На первом скриншоте результат по слову "lady", на втором скриншоте - по слову "kitten".
P.S. Выложенные ниже скриншоты сделаны в Windows XP. Под Windows 7 всё выглядит более цивизовонанно. Данный словарь предоставляет примеры предложений с данным словом. Если щёлкнуть мышкой на примере, то открывается страничка сайта jukuu.com. Хороший словарь.

Jukuu is a dedicated sentence search engine, which is speicially disigned to help Non-Enlgish users to write native English expressions by providing related bilingual sentences.


5) Spelling Suggestion
The "Spelling Suggestion" is a tool that suggests correct spelling for words that are not spelled correctly. Using sophisticated proximity and phonetic algorithms, coupled with the glossaries installed, it shows a list of terms most likely to be the one originally intended by the user. Although it is used primarily for identifying spelling mistakes, it will find similar terms in any glossary installed. As the algorithm employed is resource intensive, it will find similar terms only in local glossaries, and not in subscribed glossaries.
Как этим пользоваться - не понимаю. В обычной ситуации включение или отключение этого словаря на результатах никак не сказывается.


6) Google Web Definition

Use Google to get glossary definitions gathered from various online sources


7) Instant Translation
Сначала не поняла, что это такое, а потом подивилась удобству. Работает также, как прекрасная программа Dicter от Googla, но можно сконфигурировать так, чтобы было ещё удобнее. Эта штука предназначена только для перевода текста, на одиночные слова никак не реагирует. Это и хорошо - не мешает пословным словарям. Язык, с которого осущуствляется перевод, определяется автоматически. Язык, на который осуществляется перевод, устанавливается на вкладке Configuration -> Translation. Если этот язык совпадает с языком страницы, то перевод делается на язык, дополнительно указанный для такого случая. Т.е. в подавляющем большинстве ситуаций это очень удобно, но если необходимо активно работать с одновременно с тремя языками во все стороны, то необходимо что-то дополнительно придумывать. Lingoes вообще не очень хорошо подходит для полноценной работы сразу с несколькими языками. Но какому проценту людей это нужно? :) Сервис, осуществляющий перевод (Translation Engine), также можно выбрать в настройках. Их сравнение чуть ниже. Instant Translation - прекрасная штука для всплывающего окошка.



Instant Translation Service of Lingoes, can translate as many as 41 kinds of language text for you. Despite the fact, that no machine translation is 100% accurate or delivers results equal to human translation, this great new feature, based on the most advanced text translation technology, helps you understand texts in languages you are less familiar with.


8) Text translation - формирует текстовое поле, в котором можно вводить текст и отсылать на один из Интернет-сервисов. Хорошее средство для работы с текстом, для одиночных слов не подходит, это что пушкой по воробьям. Ниже я составила список серверов. Зелёным выделены те, которые поддерживают русский язык. Красным - которые не поддерживают, их лучше не выбирать, поскольку сбивается направление перевода, потом снова приходится искать пункт русского языка в длинном перечне. Yahoo - отдельный разговор: русский язык имеется, но при запросе сервиса всё время возвращаются сбои.
Google Translate
Yahoo  Translation  - постоянные сбои
Microsoft Translator
Click2Translate
Cross Language
SYSTRAN
Reverso Translation  - значительное ограничение по длине
Excite Japan
KODENSHA
LEC Translation  - значительное ограничение по длине
LingvoBit
Baidu Translation
Youdao Translation
К сожалению, я не смогла найти возможность удалить из списка мешающиеся пункты.


Lingoes Text Translation System provides text translation service among main languages in the world for you, Text translation has never been easier, Despite the fact, that no machine translation is 100% accurate or delivers results equal to human translation, this great new feature, based on the most advanced text translation technology, helps you understand texts in languages you are less familiar with.




Здесь я приведу сравнение результатов работы различных сервисов. Канителиться со скриншотами лень и пользы никакой, банально копирую текст. Для эксперимента взяла первый подвернувшийся - из анлийской Википедии про Goofy:

    Goofy is a funny animal cartoon character created in 1932 at Walt Disney Productions. Goofy is a tall, anthropomorphic dog, and typically wears a turtle neck and vest, with pants, shoes, white gloves, and a tall hat originally designed as a rumpled fedora. Goofy is a close friend of Mickey Mouse and Donald Duck and is one of Disney's most popular characters. He is normally characterized as extremely clumsy and having little intelligence, yet this interpretation isn't always definitive; occasionally Goofy is shown as intuitive and clever, albeit in his own unique, eccentric way.


1. Google Translate
     Тупой смешной персонаж мультфильма животное, созданное в 1932 году Walt Disney Productions. Гуфи является высокий, антропоморфные собаки, и обычно носит шеи черепахи и жилет, с брюки, ботинки , белые перчатки, и высокая шляпа первоначально разработан какпомятой шляпе . Гуфи является близким другом Микки Мауса и Дональда Дака и является одним из самых популярных персонажей Диснея. Он , как правило, характеризуется как чрезвычайно неуклюжий и имеющий немного разума , но эта интерпретация не всегда окончательные , а иногда Гуфи показано , понятный как и умные , хотя и в своей собственной уникальной , эксцентричным способом.
 
2. Microsoft Translator
    Гуфи — смешные животных мультипликационный персонаж, созданный в 1932 году в Walt Disney Productions. Гуфи высокий, антропоморфные собака и обычно носит черепаха шею и жилет, с брюки, ботинки, белые перчатки и высотных Хат, первоначально разработан как rumpled fedora. Гуфи является близким другом Микки Маус и Дональд Дак и является одним из самых популярных персонажей Диснея. Обычно он характеризуется как крайне неуклюжим и имея мало разведки, пока это толкование не всегда окончательным; Иногда Гуфи показано как интуитивный и умный, хотя и в его собственный уникальный, эксцентричный способом.

3. Click2Translate
    Кретиничный - забавный характер мультипликации животных, созданный в 1932 при Производстве Уолта Диснея. Кретиничный - высокая, антропоморфическая собака, и типично носит с высоким воротом и жилет, с штанами, ботинками, белыми перчатками, и высокой шляпой, первоначально разработанной как приведенная в беспорядок мягкая фетровая шляпа. Кретиничный - близкий друг Микки Мауса и Дональда Дака и - один из самых популярных характеров Диснея. Он обычно характеризуется как чрезвычайно неуклюжие и имеющие небольшие сведения, все же эта интерпретация не всегда категорическая; иногда Кретиничный показывается как интуитивный и умный, хотя его собственным уникальным, эксцентричным способом.

4. SYSTRAN
    Чокнут смешной животный персонаж из мультфильма созданный в 1932 на продукциях Уолт Дисней. Чокнута высокорослая, антропоморфическая собака, и типично носит шею и тельняшку черепахи, при штаны, ботинки, белые перчатки, и высокорослый шлем первоначально конструированный как rumpled fedora. Чокнут близкий друг мыши Mickey и утки Дональда и один из характеров Дисней самых популярных. Он нормально охарактеризован как весьма топорное и иметь меньшяя сведения, но это толкование всегда не окончательно\; occasiona

5. Reverso Translation
    Кретиничный забавный животный характер мультипликации, создан в 1932 в Валте Диснее Продукшнсе. Кретиничный - высокая, антропоморфическая собака, и типично носит шею черепахи и жилет, с штанами, ботинками, белыми перчатками,

6. LEC Translation.
    Goofy забавный животный мультфильм характер созданный в 1932 при Walt Disney Рождениях. Goofy высокая, anthropomorphic собака, и обычно носит turtle шею и vest, с задыхается, shoes, белые перчатки, и высокая шляпа первоначально спроектированная в качестве мяла f

Отсюда видно, что LEC и Reverso имеют значительное ограничение на длину обрабатываемого текста. SYSTRAN лишь ненамного щеднее, тоже не разгуляешься. Не стану забивать интернет-страницу результатами второго эксперимента, где я попросила сервисы перевести сразу два абзаца. Только приведу результат: Click2Translate и Microsoft Translator также показали свои пределы. Кроме этого, Microsoft Translator периодически возвращает ошибки, приходится по нескольку раз нажимать кнопку отправки. С испытанием справился только Google.
Оценивать качество же перевода я не стану, смотрите сами. Лично я предпочитаю оригинал с небольшими подсказками при наведении мышкой на ключевые слова.




======================
Теперь пройдусь по озвучке английских слов. Отсюда можно скачать 4 пакета натуральных голосов. Ещё можно загрузить WyabdcRealPeopleTTS с code.google.com .
Приведу общие характеристики всех пакетов (размер в распакованном состоянии, округлённое количество файлов и их формат):
WyabdcRealPeopleTTS-1.0-1 - 166 Мб, 21 100 файлов формата .wav
Lingoes Basic English Voice Package - 26.4 Мб, 10 800 файлов формата .mp3
Longman 2005 Voice Package - British English - 140 Мб, 43 900 файлов формата .mp3
Longman 2005 Voice Package - American English - 99.4 Мб, 40 340 файлов формата .mp3
Webster Voice Package - English  - 288 Мб, 141 700 файлов формата .mp3 (исходный скачиваемый диск .iso занимает 382 Мб)
Что касается пакета Lingoes Basic, то в него входит та же самая озвучка, что и в WyabdcRealPeopleTTS-1.0-1, только количество слов меньше. Т.е. если у вас нет проблем с местом на диске, то его ставить смысла нет. (Кстати, в WyabdcRealPeopleTTS один файл - "beater.wav" - бракованный.)
По Webster Voice Package - скачать базу по приведённой ссылке у меня не получилось, но я нашла аналогичную здесь. Количество файлов в нём, конечно, ошеломляет. Но далее интереснее. Я посмотрела названия треков, загрузила одну из папочек в mp3-плеер, что-то не то... Тогда я начала копировать наименования файлов в онлайн-переводчик Google при включенном автоопределении языков. Интересный результат. Google сообщил , что данные слова относятся к следующим языкам: французский, испанский, эстонский, финский, голландский, норвежский, итальянский, немецкий и даже каталонский(?), галисийский(?) и Суахили(?). Далее не продолжала, ситуация понятна. Анлийские слова, конечно, тоже попадались, но общем фоне их не много. Т.е. никакая это не английская база произношений, а база произношений пары десятков языков, основанных на латинице. Кому-то такое нужно? Лично мне нет, меня из всего этого интересует лишь английский. Жаль, что я столько времени на данное дело потратила.

Базы на других языках можно найти, к примеру, на swac-collections.org . Лично мне была нужна база украинских произношений. Опишу, как создавала. По украинскому языку там 4 архива. Файл "ukr-balm-svitlana-proverbs" содержит не слова, а пословицы. При использовании программы Shtooka Explorer получается интересный инструмент для постановки дикции, но в данном случае мне нужно другое. Остаются три архива: ukr-balm-svitlana (1370 записей), ukr-balm-zhenja (2232 записи) и ukr-balm-galja (16043 записи). В них содержатся файлы формата .flac, их необходимо перекодировать в .mp3. Я использовала для этого конвертер, входящий в состав AIMP3. Долгая процедура, но достаточно сделать 1 раз. Я использовала преобразование в "Mono / CBR / 64 kbps". Mono - потому что исходные .flac были mono. CBR (Constant BitRate - постоянная скорость прохождения битов информации) предлагалось по умолчанию. Когда плохо понимаю технологию, то предпочитаю оставить как есть. Вообще-то из интереса попробовала ABR (Average BitRate - усреднённый битрейт), но выходные файлы оказались чуть большего размера, чем при методе CBR. А 64 kbps - поскольку посмотрела результат, получающийся при 32 кбит/с и при 128. Между 128 и 64 на слух разницы никакой. А между 64 и 32 в некоторых словах уже немного начинает слышаться искажение. Вот таким образом я получила в своё распорящение три базы произношения украинских слов из 1370 (20,7 Мб)
2232 (32,8 Мб) и 16043 (256 Мб) записей. Конечно, можно было перекодироват и более оптимально, но я и так уйму времени на это потратила.
А чтобы покрыть озвучиванием как можно большее количество слов, я все эти три базы слила воедино. Получилась папочка из 17 009 файлов. Неплохой размер.

Аналогично сделала и с английскими базами, объединив их в разной последовательности, чтобы у наиболее распространённых слов можно было сравнить произношение. В результате получила 3 мегабазы по 51 593 слова в каждой. Уф, пришлось посидеть, процесс скучный и медленный, и далеко от компьютера не отойдёшь, постоянная внимательность нужна. Но что хотела, то и получила. :)




=================
И заодно кратенько опишу, какие на swac-collections есть ресурсы по самому популярному для обучения английскому языку. В скобочках указывается пол создателя архива и его город.

eng-balm-emmanuel - 986 записей - одиночные слова и короткие словосочетания (M, Philadelphia)

eng-balm-judith - 625 записей - одиночные слова и короткие словосочетания (F, London)

eng-balm-judith-proverbs - 100 записей - пословицы на английском, хорошая вещь (F, London)

eng-balm-verbs - 466 записей - одиночные глаголы в инфинитиве и от первого лица (F, Massuchusetts)

eng-wcp-us (Wikimedia Commons - Pronunciation) - 7270 записей - одиночные слова (F, California)

eng-wims-mary - 4876 записей - аналогично предыдущему (F, Midwest)  Объединив два последних архива, можно получить небольшую базу произношений для словаря.

eng-wims-mary-conversation - 68 записей - предложения, в том числе достаточно длинные.(F, Midwest)

eng-wims-mary-num - 226 записей - произношение различных чисел. (F, Midwest)
Три последние архива созданы одной и той же женщиной, моё ей уважение.


На этом у меня всё. Неужели найдётся кто-то, кто всё это прочитает. :)



P.S.  В Lingoes можно подправить список поисковых машин, подробнее здесь . Лично я удалила оттуда явный мусор и добавила русскую и украинскую Википедии.

16 комментариев:

  1. Ты писатель - я бы забился писать такие длинные, узко специализированные тексты. Одно не пойму - зачем тебе понадобился украинский? Нормальные герои всегда идут в обход? У тебя и так мало времени до ЕГЭ. И скажи какие предметы ты собираешься сдавать на ЕГЭ?

    ОтветитьУдалить
    Ответы
    1. Я не писательница, в школе у меня с сочинениями всегда были проблемки. :) Скорее я являюсь исследователем, прорабатываю направление.

      Почему взялась за украинский. Есть мнение, что когда изучаешь два языка, один из которых является основным, а другой второстепенным и относительно лёгким (язык подскока), то овладение первым языком происходит быстрее, чем когда просиживаешь всё время за ним одним. Т.е. два два языка изучать проще, чем один. Вполне может быть: образование - своеобразная вещь, и результат не прямо пропорционален потраченным усилиям. В этом уже хорошо убедилась. В частности, английский я с пятого класса целенаправленно пыталась выучить, сколько каникул из-за него потеряла, а эффект чуть выше нуля. Я вообще сильно разочарована в официальном образовании, годы тратятся непонятно на что. Вот и решила проверить приведённое в начале абзаца утверждение. Украинский как таковой мне не нужен, я его избрала в качестве этого самого толкателя для английского. Так что да, получается, что нормальные герои идут в обход. :)

      > И скажи какие предметы ты собираешься сдавать на ЕГЭ?
      Информатика, физика, математика и русский.

      Удалить
    2. Синевласка, возможно это тебе поможет расширить кругозор.
      http://nikaan.livejournal.com/175106.html
      http://lj.rossia.org/~dmitri_pavlov/12972.html?nc=58

      Удалить
    3. Вот еще http://shad.yandex.ru/about/

      Удалить
    4. > Я вообще сильно разочарована в официальном образовании, годы тратятся непонятно на что.

      На выращивание послушного населения, "социализацию" и т. д. А ты думала, что государство держит всю эту машину с благородной целью распространения актуальных знаний по разным предметам? Всем известно, что бесплатный сыр... :)

      Анонимный тем временем проявляет завидное упорство ^^

      Удалить
    5. По приведёнными ссылочкам кратенько пробежалась. Грустно, конечно, от всего этого. Но значит ситуацию нужно исправлять, поднимать уровень. А не тратить большую часть сил на причитания и поиск очередных изъянов. Пределом мечты считая возможность свалить. Как писала, мне существующая система образования очень не нравится, но от чего отталкиваться есть. А дальше всё зависит от меня. Для начала необходимо поступить, поскольку на чистом самообразовании тоже далеко не уедешь, тоже убедилась. Выбор небольшой:
      - либо все вокруг виноваты и лапки кверху,
      - либо рыльце в землю. А взгляд на звёзды - конечная цель должна быть понятна.

      Становиться частью системы не нужно. Нужно быть лучше системы.

      Удалить
    6. Если ты добралась до ссылки с рекомендациями выпускников http://mathcenter.spb.ru/nikaan/opros/ то заметила куда еще можно с ЕГЭ, кроме МГУ, подать документы и где и как можно учиться по твоему направлению в том числе и параллельно в России и не только. Там предлагают не сидеть на месте в том же МГУ все 5 или даже 6 лет, а переводиться в другие вузы. Если баллов ЕГЭ не хватает, то сначала можно подать в одно место, а потом после попробовать перевестись куда хочешь, может быть даже сразу, после 1-го семестра. Пользуйся возможностью составлять программы обучения по своему желанию в пределах возможного согласно политики вуза. Короче будь динамичной и сможешь попасть туда, куда хочется, даже если подкачаешь с баллами ЕГЭ. Так учиться весь цивилизованный мир и только мы по старинке учимся на одном месте.

      Удалить
    7. Полагаю, эти ссылочки сильно мне понадобятся весной, пока же всё же неохота рассеивать внимание. За оставшиеся месяцы ещё очень многое может измениться. Спасибо.

      Переход из ВУЗа в ВУЗ - в общем случае неплохой вариант. Но я являюсь своеобразной личностью, очень далёкой от образа идеального студента. По МГУ обо мне уже интересные слухи ходят. :) Интересно, откуда это взялось... Можно, не буду вдаваться в подробности? Так вот, институты - либеральные места, и специально прикладывать усилия, чтобы поставить мне на экзаменах палки в колёса, не станут. Тем более, что при в личном общении я могу произвести очень адекватное впечатление. Но вот когда дело касается перевода и перед каким-нибудь секратарём декана лежат дела нескольких претендентов, то боюсь, меня возьмут в самую последнюю очередь, даже если мои показатели будут выше остальных.

      Удалить
  2. Англо-русский и русско-английский Universal совпадают со словарями ABBYY Lingvo. Отсюда возникает вопрос, насколько это легально, вообще говоря. С Яндекс.Словарями заключено соглашение, а тут? :)

    BlueHairLady, а есть ли готовые программы для перегонки словарей из формата Lingvo в формат Lingoes? К сожалению, у меня есть словари в формате Lingvo, от которых я пока не могу отказаться. В других форматах их не встречал.

    ОтветитьУдалить
    Ответы
    1. Нет, готового конвертера словарей, как поняла, нету. Но на сайте написано, сейчас над ним идут работы. Подробнее о формате словарей на http://www.lingoes.net/en/dictionary/dict_format.php , теоретически можно самостоятельно сделать и отослать им на компиляцию.

      Удалить
  3. BlueHairLady, не соскучилась по постам "за жизнь"? Всё программы да программы :)

    ОтветитьУдалить
    Ответы
    1. Завлекло. :) Но полагая, следующий пост как раз и будет про жизнь. Материальчик есть. Да и итог года следует подвести.

      Удалить
  4. > зачем тебе понадобился украинский?
    Ой, можно я один украинский анекдотик перескажу?

    - Как называется человек, который владеет двумя языками?
    - Двухязычный.
    - А если тремя?
    - Трёхязычный.
    - А если умеет разговаривать только на одном, то тогда как?
    - Москаль.

    Надеюсь, тонкий намёчек понятен. :)

    ОтветитьУдалить
  5. Дам ссылку на пакет по озвучке английских слов натуральными голосами. Webster Voice Package - English. Он самый большой из доступных, а на сайте Lingoes ссылка битая. Остальные пакеты можно не качать, т.к. они содержат значительно меньше слов.
    http://depositfiles.com/files/z2oic26hu

    ОтветитьУдалить
    Ответы
    1. Цитирую из вышерасположенной статьи:
      "По Webster Voice Package - скачать базу по приведённой ссылке у меня не получилось, но я нашла аналогичную здесь (ссылка как раз на http://depositfiles.com/files/z2oic26hu). Количество файлов в нём, конечно, ошеломляет. Но далее интереснее. Я посмотрела названия треков, загрузила одну из папочек в mp3-плеер, что-то не то... Тогда я начала копировать наименования файлов в онлайн-переводчик Google при включенном автоопределении языков. Интересный результат. Google сообщил , что данные слова относятся к следующим языкам: французский, испанский, эстонский, финский, голландский, норвежский, итальянский, немецкий и даже каталонский(?), галисийский(?) и Суахили(?). Далее не продолжала, ситуация понятна. Анлийские слова, конечно, тоже попадались, но общем фоне их не много. Т.е. никакая это не английская база произношений, а база произношений пары десятков языков, основанных на латинице. Кому-то такое нужно? Лично мне нет, меня из всего этого интересует лишь английский. Жаль, что я столько времени на данное дело потратила."

      Ну и добавлю, что иметь на своём компьютере несколько баз произношении полезно для сравнения. Иногда какое-то слово произносится нечётко и непонятно, является ли это небольшим дефектом данной записи или закономерностью. (К примеру, слово kitten.) Кроме того, может быть интересным сравнить британский английский с американским.

      Удалить
  6. В эту публикацию постоянно идёт англоязычный спам, попал адрес в некую нехорошую базу рассылки. :-/ Хотелось бы посмотреть в глаза тому, кто это делает. Так что я запретила добавлять сюда комментарии. Если у кого-то есть какие-то мысли, то пишите либо в какую-либо смежную тему, либо на мой e-mail - что-нибудь придумаем. :)

    ОтветитьУдалить