Мертвый заговорил

В Северной Америке разработана компьютерная программа, которая воскрешает мертвые языки. С ее помощью можно реконструировать даже те наречия, которые не оставили письменных памятников. Авторы уверены, что их детище поспособствует лучшему пониманию истории развития цивилизаций

Мертвый заговорил

В древности языки, на которых сегодня говорит человечество, имели общих предков. Был ли это один глобальный прапрадедушка или их было несколько, сказать затруднительно. Сегодня ученые-лингвисты объединяют языки в несколько крупных семей, члены которых имеют между собой много общего. Порой родство может показаться весьма не очевидным: например, язык фарси, на котором говорят в Иране, является дальним родичем норвежского, венгерский — двоюродным братом удмуртского, а иврит имеет много общего с наречием аборигенов Канарских островов.

Нахождение родственных связей между языками позволяет по-новому взглянуть на историческое взаимодействие народов, которые на них говорят. В рамках сравнительно-исторического метода лингвисты путем долгой и кропотливой работы устанавливают генетическое родство языков. Они изучают значение и звучание слов в разных языках, пытаясь найти сходные элементы. На основании полученных результатов выдвигаются предположения о том, каким могло быть общее древнее слово, от которого произошли элементы современных языков.

Близкие народы в стародавние времена произносили одни и те же слова чуть-чуть по-разному. Со временем их фонетический состав мутировал и менялся до неузнаваемости. Сегодня нужно обладать определенной языковедческой сноровкой, чтобы усмотреть общие корни в английском слове gold и русском «золото», в apple и «яблоко», в немецком kinder и древнерусском «чадо». Однако ученые могут с большой долей вероятности найти для этих пар общего предка.

Насколько трудоемок этот подход, можно судить по количеству известных языков — от пяти до семи тысяч, — в каждом из которых десятки, а то и сотни тысяч слов. Перелопатить такую груду материала, чтобы понять, какие наречия имеют общие признаки, человеческому разуму невероятно сложно. И здесь на помощь лингвистам приходят компьютеры.

Научные группы из Калифорнийского университета в Беркли и из университета Британской Колумбии в канадском Ванкувере разработали программное обеспечение, которое позволяет куда быстрее отыскивать кровные узы между языками. Более того: программа не только устанавливает степень родства, но и умеет выстраивать настоящее генеалогическое древо внутри языковой семьи. Результаты исследования опубликованы на сайте журнала «Труды Национальной академии наук США».

Особый алгоритм обработки материала воссоздает элементы языковых пращуров, которые не оставили после себя письменных памятников. Лингвисты могут только догадываться, что собой представляли эти далекие языки. Предложенный канадскими и американскими учеными метод однозначного ответа на этот вопрос не дает, но предлагает весьма и весьма любопытные гипотезы.

Разработчики уникального ПО преисполнены энтузиазма и честолюбия. «Мы надеемся, что наш алгоритм совершит революцию в исторической лингвистике примерно так же, как статистический анализ и вычислительные мощности компьютеров преобразили эволюционную биологию», — говорят они.

Программа находит родственные связи между языками, анализируя их лексику на уровне простейших звуковых элементов, из которых состоят произносимые слова. Данные по нескольким десяткам тысяч слов объединяются при помощи статистических методов. Таким образом шаг за шагом воссоздается облик древнего наречия, от которого произошли подвергаемые анализу языки.

Система была протестирована на основе австронезийской языковой семьи. В нее входит почти семь сотен языков, на которых говорят и говорили жители столь различных и удаленных друг от друга стран и территорий, как Тайвань и остров Пасхи, Мадагаскар и Новая Зеландия, Гавайи и Индонезия.

Предметом анализа стала база данных из 142 тысяч австронезийских слов. На их основе системе удалось реконструировать элементы праязыка, на котором, как полагают ученые, говорили примерно 7 тысяч лет назад. Результаты компьютерного анализа на 85% совпали с итогами лингвистических исследований, проведенных «вручную». Например, программа пришла к выводу, что на австронезийском праязыке слово «ветер» звучало как beliu, а языковеды придерживаются мнения, что оно произносилось как bali.

Компьютерщики из Беркли признают, что нынешняя версия программы, «оживляющей» древние языки, несмотря на высокую скорость работы, пока что далека от совершенства. «Система имеет свои недостатки. Например, она не может справиться с морфологическими изменениями в языках и не понимает повтора слов. Программа не сможет объяснить на более глубоком уровне, почему или каким образом возникли те или иные изменения», — говорит профессор Дэн Кляйн из Калифорнийского университета.

«Наша система не сможет найти всех нюансов, которые способны заметить лингвисты-профессионалы, она поможет им использовать больше языков при реконструкции их "пращуров"», — вторит ему профессор Александр Бушар-Коте из канадской группы.

Новый софт не является полноценной заменой языковедам. Он призван стать для них подручным инструментом, ускоряющим научный процесс и избавляющим людей от чисто технической работы. В настоящее время канадские исследователи работают над онлайн-версией программы, чтобы ею могли пользоваться лингвисты всего мира.

 

Статьи по теме:
Международный бизнес

Интернет больших вещей

Освоение IoT в промышленности позволит компаниям совершить рывок в производительности

Спецвыпуск

Бремя управлять деньгами

Замедление экономики разводит все дальше банки и реальный сектор

Бизнес и финансы

Номер с дворецким

Карта столичных гостиниц пополнилась новым объектом

Тема недели

От чуда на Хангане — к чуду на Ишиме

Как корейский опыт повышения производительности может пригодиться Казахстану?