Лингвистическая палеонтология – высший пилотаж в области языкознания. Но у нее есть две принципиальных уязвимости. Первая заключается в том, что столь выдающееся изобретение, как колесо, скорее всего, распространилось от культуры к культуре со скоростью лесного пожара и несло с собой свое имя. Лингвистические палеонтологи заверяют, что умеют распознавать такие заимствования. Конечно, в слове «кока-кола» легко опознать иностранное заимствование, вошедшее во многие языки, но чем старше заимствование, тем сильнее оно сливается с фоном принимающего языка. Один из аргументов академического сообщества против глоттохронологии состоит в том, что нераспознанные заимствования могут смешать всю картину.
Другая уязвимость палеонтологии – риск реконструировать весьма убедительно выглядящие слова, которых на деле не существовало. Лексемы, подобные слову «епископ», существуют в греческом (episkopos), латыни (episcopus), древнеанглийском (bisceop), испанском (obispo) и французском (evêque), из этого ряда можно реконструировать праиндоевропейское слово-предок *apispek, но в языке, на котором говорили 5000 лет назад, таких слов не было. Что касается колеса, то установлено, что в праиндоевропейском языке было слово *kwel со значением «вращаться», от которого, как считается, произведено *kwekwlos. Но могло быть и так, что в праиндоевропейском не было слова со значением «колесо» и на самом деле дочерние языки просто произвели свои названия для этого предмета от унаследованного ими всеми слова *kwel – «вращаться». В таком случае время существования праиндоевропейского отодвигается от момента изобретения колеса на несколько тысяч лет в прошлое.
Новая датировка праиндоевропейского языка
Более надежный и последовательный способ датировки языков, в котором давно нуждается наука, предлагают ученые, взявшие за основу технологию выстраивания филогенетических деревьев. Этот способ именуют «методом наибольшего правдоподобия»: он начинается с вопроса, какова наиболее вероятная форма дерева, объединяющего наблюдаемые факты. В случае языковых семей фактами служат разноязыковые списки Сводеша с уточнением, какие слова в них когнаты, а какие нет.
Применить метод наибольшего правдоподобия к истории языков впервые предложил Марк Пейгл, биолог из Университета Рединга (Англия). Он показал, что, располагая списком всего из 18 слов, можно составить максимально правдоподобное дерево для семи языков (валлийского, румынского, испанского, французского, немецкого, голландского и английского), и его дерево оказались ровно таким же, какое получили компаративисты чисто лингвистическими методами
{279}.
Недавно метод наибольшего правдоподобия усовершенствовал биолог из Оклендского университета Рассел Грэй. Он тщательно разобрал слабые места глоттохронологии и усовершенствовал метод именно с тем, чтобы компенсировать их. Одна из проблем – неопознанные заимствования. Из-за них язык может показаться моложе, чем он есть. Но вместе с тем они связывают побочные ветви языка, создавая сетевидную структуру. Такие структуры можно выявить, и затем отсеять неопознанные заимствования.
Другое узкое место глоттохронологии – то, что языки эволюционируют в разном темпе. Современные исландский и норвежский происходят от древнескандинавского, на котором люди говорили между 800 и 1050 гг. н. э. У норвежского с древнескандинавским 81 % слов из списка Сводеша – когнаты, что верно указывает на разделение 1000 лет назад. Однако современный исландский, развивающийся более обособленно, на 99 % состоит из слов древнескандинавского – ложное указание на то, что языки разошлись всего 200 лет назад
{280}.
Математические методы для выявления заимствований и учета колебаний в темпах языковой эволюции уже существовали, потому что с теми же трудностями сталкивались и биологи, составлявшие генеалогии на основе данных ДНК. Как и языки, некоторые гены эволюционируют быстрее прочих. И как слова могут быть унаследованы либо заимствованы, гены тоже достаются организму не только от родителей, но и «со стороны»: например, бактерии умеют обмениваться сериями генов и именно поэтому так быстро приобретают устойчивость к антибиотикам.
Одна из форм метода наибольшего правдоподобия, так называемый байесов метод Монте-Карло с цепями Маркова, на который сегодня делают ставку биологи, состоит в том, что последовательности ДНК разных генов вводят в компьютер и получают большое множество деревьев, которые могли бы связывать эти гены. Затем программа берет образцы из тех групп деревьев, которые выглядят наиболее перспективными (задача проверить каждую пока не под силу даже самым быстрым компьютерам), и раз за разом повторяет тот же алгоритм. С каждой итерацией перспективных деревьев становится все меньше, и в итоге процесс выдаст одно, наиболее вероятное дерево, объясняющее наличные данные.
При помощи этой мощной технологии Грей и его коллега Квентин Аткинсон нарисовали фамильное древо индоевропейских языков. В качестве контрольных данных они взяли список Сводеша из 200 слов для 84 индоевропейских языков, составленный лингвистом Исидорой Дайен, и дополнили его примерами из трех мертвых языков: хеттского и двух разновидностей тохарского, так называемых тохарского A и тохарского Б.
В генетике генеалогическое древо зачастую можно привязать к ленте времени, соотнеся одну из его ветвей с датами палеонтологических находок. То же самое можно проделать и с деревьями языков, сконструированными по методу наибольшего правдоподобия. Обнаружив статистически наиболее вероятное дерево для данных индоевропейской семьи, Грей произвольно совмещал определенные развилки на нем с подтвержденными датами расподобления языков. Хеттский, несомненно, был самостоятельным языком к 1800 г. до н. э., которым датируется старейшая из известных хеттских надписей. Древнегреческий отделился к 1500 г. до н. э., времени создания надписей линейным письмом Б
[11]. Латинский и румынский языки начали разделяться в 274 г., когда римские войска ушли из нижнего Подунавья.
Древо индоевропейской языковой семьи составлено Расселом Греем и Квентином Аткинсоном с применением передового статистического метода. Древо соотнесено с 14-ю известными датами возникновения недавно появившихся языков, что позволило приблизительно датировать и древние ветви. Цифры обозначают, сколько лет прошло с того момента, когда язык ответвился от родительской линии.