• Главная
  • Новости
  • Касьян и Старостин доказали: вопрос генезиса индоевропейских языков далеко не исчерпан

Касьян и Старостин доказали: вопрос генезиса индоевропейских языков далеко не исчерпан

  • 27.01.2026
Поделитесь с друзьями

Продолжаем рассказывать о важнейших научных достижениях исследователей из Института общественных наук Президентской академии. Речь пойдёт о статье, опубликованной в 2025 году в одном из ведущих научных журналов мира, Nature, и содержащей критический анализ наиболее авторитетной сегодня теории эволюционной истории индоевропейской языковой семьи, которая включает в том числе и русский язык. Объясняет Павел Сухов, кандидат филологических наук, руководитель программы бакалавриата ИОН «Креативные индустрии и цифровые проекты».
Статья «Поддерживают ли на самом деле языковые деревья с предками на выборке гибридную модель происхождения индоевропейских языков?» была написана ведущим научным сотрудником Школы актуальных гуманитарных исследований Института общественных наук Президентской академии (ШАГИ ИОН РАНХиГС), д.филол.н. Алексеем Касьяном в соавторстве с российским лингвистом, к.филол.н. Георгием Старостиным. 

Авторы обращаются к знаковому исследованию группы учёных под руководством Пола Хеггарти (Paul Heggarty), результаты которого были опубликованы в 2023 году в журнале Science в статье под заголовком «Языковые деревья с предками на выборке поддерживают гибридную модель происхождения индоевропейских языков» и содержали прорывные на тот момент представления о времени начала распада и дальнейшей эволюции праиндоевропейского языка.

Суть научной проблемы

Современные лингвисты сходятся в представлении о том, что много тысячелетий назад существовала некая общность людей, живших в некоторой ограниченной локации и говоривших на общем языке (который принято называть праиндоевропейским). Впоследствии в ходе миграций они расселились на огромной территории от севера Индии до Ирландии. В результате этих процессов возникла крупнейшая семья родственных языков, на которых сейчас говорят более 3 миллиардов человек на всех континентах – в их число входят все славянские и балтские языки, а также языки германской и романской групп, хинди, персидский и целый ряд других.

Главной научной проблемой является детальная филогения индоевропейских языков – то есть установление конкретных путей данных миграций на территорию Европы и времени их осуществления, а соответственно, и связей между разными языками одной огромной семьи.

Одна из нескольких ведущих гипотез – «анатолийская» – предполагает, что эти процессы происходили в раннем неолите, и локализует индоевропейскую прародину в Малой Азии – Анатолии (территория современной Турции). Согласно конкурирующей гипотезе, так называемой «степной», праиндоевропейцы изначально жили в Причерноморско-Каспийской степи, и уже оттуда перебрались на запад в позднем неолите или раннем бронзовом веке.

Работа группы Хеггарти объединяет эти две гипотезы, относя время существования единого праиндоевропейского языка к эпохе ранее 8120 лет назад (6740–9610 лет назад при доверительном интервале 95%) и локализуя прародину индоевропейцев в двух ключевых географических центрах. В исследовании утверждается, что на первом этапе, после раннего раскола праиндоевропейской общности, около 8120 года выделилась анатолийская ветвь (к ней относится, например, хеттский язык). На втором, после ухода «анатолийцев», оставшаяся часть индоевропейцев мигрировала в так называемую «степную» прародину – Черноморско-Каспийскую (или Понтийско-Каспийскую) степь – откуда предприняла уже дальнейшую экспансию. «Германские и кельтские языки, по оценке, разошлись около 4890 лет назад (3720–6190 лет назад), а италийские отделились от них несколько раньше — около 5560 лет назад (4230–6980 лет назад). Балто‑славянская ветвь связана с этими тремя менее тесно и отделилась раньше — примерно 6460 лет назад (5040–7940 лет назад)», – утверждается в статье Хеггарти.

«Языковые деревья с предками на выборке»

Исследование Хеггарти основано на построении «языковых деревьев с предками на выборке». Под этим термином понимается специализированная статистическая методика создания филогенетических деревьев, которая применяется в компьютерной лингвистике для моделирования происхождения языков. Она отличается от классических моделей тем, что позволяет непосредственно включать в само дерево известные древние языки в качестве возможных прямых предков современных. 

Так, в стандартном филогенетическом дереве все известные языки отображаются как «кончики ветвей», а узлами, в которых ветви раздваиваются, являются гипотетические предковые языки, которые нам непосредственно не известны (одним из них является и праиндоевропейский). 

Метод «с предками на выборке» работает в другой логике. В ней древний язык, например, классическая латынь или готский, может быть представлен не «кончиком ветви», а реальным узлом на пути к одному из современных языков. Очевидно, что всё дерево, содержащее в качестве узлов предков, которые фактически взяты из корпуса данных (и значит, точно привязаны к датам), а не только реконструированы, должно давать более реалистичные и исторически обоснованные датировки. Для индоевропейской проблемы это важно, потому что в споре о прародине индоевропейцев критически важно правильное расположение древних языков на дереве для точной датировки расколов.

Впрочем, при таком подходе возможны и проблемы: например, модель вполне может показать, что современный итальянский является прямым, непосредственным потомком латыни. Хотя классическая латынь (уже мёртвый в Средние века язык, который, тем не менее, широко использовался в письме) – это не непосредственный предок, а лишь близкий родственник, «сестра» народной, или «вульгарной», латыни как средневекового прароманского, устного языка, не имевшего зафиксированной письменной формы.

Работа Касьяна и Старостина

Именно этот метод – а скорее, даже данные, на которых были проведены оценки – стали основной мишенью для критики в статье Касьяна и Старостина. Авторы признают значительный прогресс в работе команды Хеггарти по сравнению с предыдущими попытками примерно того же научного коллектива экспертов-лингвистов (так называемой «Новозеландской школы») в составлении обширной базы лексических данных (IE-CoR – Indo-European Cognacy Relationships, «Когнаты в индоевропейских языках»). В её состав входят по 170 понятий из базового списка слов (например, «вода», «огонь», «дать») 161 языка, включая 52 древних, которые и помогли откалибровать дерево хронологически.

Однако при этом российские лингвисты отмечают значимые проблемы в анализе. Главные из них – это использование устаревшего «корневого» подхода к установлению родства слов, включённых в базу IE-CoR, который не учитывает явление «деривационного дрейфа» (независимых морфологических образований от одного и того же корня в языках разных ветвей), и не даёт во многих случаях возможности различать истинное родство и ареальную диффузию, возникающую при языковых контактах между разными группами.

В итоге недостаточно корректные данные «на входе» приводят к тому, что модель выстраивает неверные эволюционные связи при размещении предков на дереве. Российские авторы и показывают, что результаты не соответствует некоторым твёрдо устоявшимся представлениям о родстве языков: «Полученная классификация дерева не только статистически слаба, но и противоречит хорошо установленным знаниям в некоторых важных моментах. Поэтому она вряд ли может служить надёжной основой для дальнейших исследований», – подчёркивают Касьян и Старостин.

«В целом авторы не предлагают ничего нового по сравнению с предыдущими экспериментами команды (2003, 2012)... Как и в более ранних публикациях, дата распада индоевропейского (4740–7610 гг. до н.э.) сообщества действительно примерно совпадает с миграцией ранних земледельцев из Анатолии в Европу около 7000 г. до н.э. (в этом смысле полученные результаты по‑прежнему поддерживают «аграрную» гипотезу, связывающую этих земледельцев с индоевропейцами)… Что касается промежуточной степной прародины, то действительно вероятно, что по меньшей мере некоторые индоевропейские языки мигрировали из Евразийских степей в Центральную и Северную Европу в начале III тысячелетия до н. э. Нерешённым остаётся вопрос о конкретной лингвистической конфигурации и последовательности этих "выходов из степи"», – заключают российские исследователи.

Соотношение между количеством включённых в IE-CoR языков и размером списка может быть недостаточным для создания гарантированно надёжной топологии, резюмируют Касьян и Старостин. Для этого следует либо резко расширить список (что нереалистично по ряду практических причин), либо сократить число сравниваемых таксонов – возможно, с помощью использования промежуточных реконструкций для предковых стадий вместо множества отдельных языков (принцип, продвигаемый «Московской школой» исследователей в данном вопросе, к которым относятся и два российских автора статьи в Nature). Таким образом, Касьян и Старостин обозначают новые горизонты для исследования далекого прошлого человеческой цивилизации, указывая на возможные инструменты для проведения более точного и надёжного анализа.