Про те, чому мови і діалекти насправді відрізняються

Прості запитання часто вимагають складних відповідей. Наприклад: в чому відмінність між мовою і діалектом? Якщо ви поставите це запитання лінгвісту, то влаштовуйтесь зручніше. Незважаючи на простоту запитання, існує багато можливих відповідей.

Світлина: https://www.deviantart.com/arminius1871/art/European-language-tree-684240770

Відмінність може залежати від чиєїсь точки зору. З політичної перспективи мовою є та, якою, як правило, розмовляє нація. Наприклад, з 1850 по 1992 існувала мова, відома як сербохорватська, яка мала декілька діалектів, включно з сербським, хорватським і боснійським. Але після того як Югославія розпалася на декілька незалежних держав в середині 1990-х, ці діалекти визнали окремими мовами. Це політичне визначення працює певною мірою, хоча воно призводить до більшої кількості запитань, ніж надає відповідей: Існують мови, які розповсюджені по різним державам, наприклад, іспанська в Латинській Америці. Ніхто не стане стверджувати, що іспанська в Мексиці і іспанська в Колумбії являють собою різні мови. Можливо, іспанська, якою розмовляють в деяких частинах Іспанії, є настільки відмінною від латиноамериканських варіантів, що і заслуговує називатись окремою мовою, але це неясно.

Можливо, відмінність між мовою і діалектом можна знайти в термінах взаємного розуміння? На жаль, із цим підходом виникають миттєві проблеми. Данець розумітиме шведа трохи краще, ніж швед данця. Так само, той, хто розмовляє своєрідним сільським діалектом британської англійської розумітиме американця з Лос-Анджелесу набагато краще, ніж навпаки. Взаємне розуміння часто залежить від перебування в певному середовищі, надзвичайно неконтрольованої змінної, аніж від чогось належного до мови.

«В чому відмінність між мовою і діалектом? В популярному розумінні діалект розглядають як дещо «меншу» мову. Коли ми говоримо про діалект, то іноді маємо на увазі просто розмовну мову (без письма), а іноді – варіант стандартної мови, який хоча і походить на стандарт, також має свої власні незалежні елементи, які відрізняють його від стандартної мови».

«Про чисті мови і брудні діалекти»

То можливо нам варто впровадити більш лінгвістичний підхід. Уявімо, що ми можемо виміряти різницю D між двома різновидами мови на системному рівні. Тоді ми могли б припустити, що певна величина D визначає розділ між двома діалектами і двома мовами. Така міра має бути досяжною, адже існує багато чого, що можна порівняти між двома мовами, наприклад, їх фонетичні, граматичні характеристики або лексика.

Але якщо відмінності між різновидами мови змінюються поступово, так, що ймовірність знайти задану величину D дорівнює ймовірності знайти і якусь іншу величину? В такому випадку нам довелось би обрати довільну величину D в якості нашої точки розділу, а довільна величина відкине нас назад до міркувань про політичну або практичну природу, до чого ми прийти не хочемо. Чи бажаємо ми, щоб наш розділ перебував на рівні, на якому сербська і хорватська мови являють собою одну мову або різні мови? Якщо ми хочемо скласти каталог мов світу, то скільки тисяч мов ми хочемо класифікувати – 5, 7 чи може 10?

Нещодавно дві основні перешкоди для відрізнення мови від діалекту було подолано. Перша – це те, як виміряти відмінності між варіантами мови, знайти значення для D. В 2008 році ряд лінгвістів зібрались разом, щоб створити Автоматизовану програму оцінювання близькості (Automated Similarity Judgment Program, ASJP), для якої автор цієї статті є автором і щоденним куратором. ASJP старанно зібрала систематичний порівняльний набір даних про мови, який наразі містить 7 655 списків слів з двох третин мов світу, якщо припустити, що для цих цілей мови визначаються так, як в стандарті кодів ISO 639-3. Позаяк кожен список слів містить фіксований набір з 40 понять і транскрибований однаковим способом, їх можна легко порівняти і можна виміряти відмінність.

Міра відмінності між двома словами, яка отримала найбільше застосування, – це версія відстані Левенштейна, названа на честь Владіміра Левенштейна, радянського математика, який в 1965 році розробив алгоритм порівняння двох строк символів. Він визначив «відстань» як кількість замін, вставок і видалень, які необхідно виконати, щоб перетворити одну строку в іншу. Відстань Левенштейна корисно поділити на довжину найдовшої з двох строк, оскільки це приводить всі відстані в проміжок між 0 і 1. Це назвали нормалізованою відстанню Левенштейна, або LDN (normalised Levenshtein distance).

Друга перешкода – це те, що, можливо, «мова» і «діалект» є поняттями, які можна визначити лише довільно. Тут є ще більше радісних новин. Якщо ми подивимось на всі мовні сім’ї в базі даних ASJP, для яких автори бази даних внесли значну частину близьких варіантів, ми можемо помітити різну поведінку мов і діалектів. Виникає цікава картина: відстані схильні коливатись довкола або відносно малої величини, або відносно великої, із впадиною поміж ними.

Як виявляється, впадина перебуває у вузькому діапазоні довкола середнього значення, що складає 0,48 LDN. Без втрати суттєвої точності ми можемо сказати, що варіанти мов не схильні бути наполовину схожими за своїм основним словником. Вони будуть схильні бути або більше схожими, у випадку чого їх можна визначити як різні діалекти, або менше схожими, у випадку чого їх можна визначити як різні мови. Тут і полягає відмінність між мовою і діалектом.

Уряд Сінгапуру здавна наполягав, щоб кожен громадянин острівної держави знав англійську мову, яку використовують в школах, на роботі і в уряді. Проте на практиці багато людей розмовляють змішаною мовою, яка може повністю спантеличити гостей і яку називають «сінгліш», тобто сінгапурська англійська мова.

«Сінгліш. Змішана диво-мова Сінгапуру»

Цей феномен, ймовірно, є результатом соціальних обставин. Діалекти будуть розходитись мірою того, як люди оселяються в нових місцях і формують нові ідентичності, проте, якщо зберігається деякий контакт, конвергенція також може бути присутня, так що варіанти мови залишаються більш ніж наполовину схожими (а відтак однією мовою). Проте невеликий поштовх в бік дивергенції може призвести до того, що варіанти розійдуться відносно швидко, збільшуючи відстань Левенштейна між собою, що робить їх різними мовами.

Можливо, існує зв’язок між розділом для відстаней між словами в стандартному переліку, використовуваному ASJP, і відповідними відстанями в інших частинах мовної структури, що зумовлює серйозну втрату взаємного розуміння. Іншими словами, поріг для взаємного розуміння може корелювати з порогом між мовами і діалектами. Цього ми ще не знаємо, але це те, що варто вивчати.

Створивши об’єктивний і обґрунтований критерій для відрізнення мов від діалектів, ми можемо застосувати його до мов світу. Деякі пари різновидів мов, які вважають національними мовами, такі як боснійська і хорватська, попадають набагато нижче розділу LDN = 0,48 (одна й там сама мова, незалежно від існування Югославії). Деякі попадають ненабагато нижче, такі як гінді і урду (ледве різні мови). А варіанти арабської і китайської, про які обидві часто думають як про єдині мови, злітають вище LDN = 0,48 (самі варіанти є окремими мовами). Цікаво, що існує мало пар варіантів, які зазвичай вважають різними мовами, але які перебувають на межі: наприклад, данська і шведська, із значенням LDN = 0,4921.

Нарешті, техніку, отриману з наборів даних, яку називають ASJP хронологією (ASJP chronology), можна застосувати до встановлення кількості часу, який потрібен діалектам, щоб відійти достатньо далеко, аби їх вважали окремими мовами. Відповідь, яку було знайдено, не беручи до уваги певну похибку, говорить про 1059 років. Ці отримані дані можна незалежно перевірити, поглянувши на те, скільки зазвичай потрібно батьківській мові мовної сім’ї, щоб розпастися на дітей, які потім стають батьками підсімей. Для цього потрібні інші методи, але результати є схожими: для того, щоб діалекти стали мовами, потрібна тисяча років. Ми це знаємо, бо тепер можемо відрізнити одне від іншого.

ПРО АВТОРА

Сорен Віхманн (Søren Wichmann) Søren Wichmannданський лінгвіст, захистив докторську дисертацію в Університеті Копенгагена, співпрацює з Лейденським університетом (Нідерланди), Казанським федеральним університетом (Росія) і Пекінським університетом мов (Китай). Його спеціалізацією є історична лінгвістика, топологія мов і епіграфіка, також спеціалізується на вивченні ієроглифів майя, зокрема на лінгвістичних аспектах розшифроування письма майя. Є автором декількох книг, зокрема присвячених мовам Мезоамерики. З 2007 року зосередився нарозробці кількісних методів історичної лінгвістики, включаючи Automated Similarity Judgment Program.

Джерело: AEON
Ліцензія: Attribution-ShareAlike 4.0 International

Інші статті

Всі голоси іспанської мови
Словник загальної іспанської мови забезпечить економію часу і коштів і більшу ефективність серед носіїв різних варіантів іспанської мови >>>
Кузини арабської мови вижили в Омані - проте чи надовго?
Мова шехрі є лінгвістичною рідкістю, якою розмовляють декілька тисяч людей в на півдні Аравійського півострова. >>>
Рюкюські мови - вивчати не можна втратити
Шість рюкюських мов потрапили в «Атлас мов світу, які перебувають в небезпеці зникнення» ЮНЕСКО >>>
Чому ніхто не розмовляє індонезійською мовою
Метою індонезійської мови було розбити бар’єри спілкування між понад 300-ми етнічними групами і полегшити їх включення в нову державу. >>>
Чи застосовує Каталонія школи як політичну зброю?
Іспанські націоналісти засудили каталаномовну освіту як зловісну силу, що підбурює сепаратистські настрої. >>>
Мови в кібернетичну епоху
Технології можуть допомогти врятувати малі мови, або можуть допомогти вбити їх. >>>
Люксембурзька - мала мова великого князівства
Особливе місце для люксембурзької: місцева мова Великого князівства переживає ренесанс, і уряд поспішає скористатись цим >>>
Про чисті мови і брудні діалекти
Те, чому певний варіант мови стали розглядати стандартом, а його варіанти понизили статусом до «діалекту», є продуктом історії і політики. >>>
Ретороманська - справжня швейцарська мова
Незважаючи на свій cтатус офіційної, зв'язок з Римською імперією і унікальну культуру, ретороманська мова повільно вмирає. >>>
Еускара, мова басків, - найзагадковіша мова Європи
Баскська мова - привід гордості народу басків. Приблизно 700 000 з них, або 35% баскійського населення, розмовляють нею в наш час. >>>