Войничський рукопис. Манчурний кандидат

Войнич Мануреп (ВМС) називають Грайлем криптографії. Протягом декількох сотень років, тисячі людей, які пройшли і продовжують витрачатися, намагаючись розкрити свій зміст і переклад. І люди постаралися дуже різними, в тому числі видатними криптографами світу. Поки не дуже добре працює. Дві сотні сторінок пергаменту, невідомий алфавіт, невідома мова, Каліграфічний впевнений почерку, десятки малюнків невідомої рослини і голих жінок, які купують в дивних каналах, зодіаку астрологічних діаграм - безліч відчуттів, але так далеко не що дозволить дешифрувати рукопис. Для будь-якого, хто навіть трохи спробував вирішити гачки, Мб здається ідеальною головоломкою - не знаю, що ще немає.





Сторінка 16v
Я бачив кілька місяців тому пост на Habre про мову Aztec і ботанів, які виділили кілька Центральноамериканських рослин, але все ще отримують мої ноти від проектів. Мета роботи полягає в тому, щоб представити читачам світ вирішувачів VMS і мій несумісний аналіз одного з порівняно останніх гіпотез про Манчурну мову рукопису.


Ви можете пройти сканування високої роздільної здатності тут: Войнич Войнич

Я вперше зустрів MV з довгою статтю в паперовому комп'ютері, але я хотів зробити трохи цього тепер, після інтерв'ю з Lenta.ru з автором останнього дослідження Marcello Montemurro, опублікованого на PLoS One. Я раджу читати статті в Вікіпедії та Комп’ютерах та інтерв’ю на стрічці.

544568

Графік статистичного підключення між частинами рукопису – Рисунок від статті Монтемурро
Під час історії неправдивого рукопису з'явилася багато гіпотез про свою мову - з Європи (один або суміш з них) і Близького Сходу до абсолютно рідкісних і далеких, таких як древній Javanese або індійці, динаміки яких не контактували з Європою в 15 столітті; це не без перекладу з давньої української. Деякі з останніх «проривів» початку цього року є декодування десятки слів британським лінгвістом Стівена Backs та спроб зв’язати деякі малюнки та підписи на Центральноамериканські ендеміки та рідні мови. Крім того, багато дослідників знеболюють і вирішили, що текст є передсердям або нецензурою, абракадабра, призначеним для викликати туман або здивувати покупців. Але все ж, багато хто вважає, що MB є реальним зашифрованим текстом. Причини вірити, що це справа:
1,1 км Наявність складної структури тексту. Як і всі реальні мови, CF заперечує закон Блискавка, тобто частота слова інверсально пропорційна його рудній кількості в періодичній послідовності.
2,2 км За даними антропічних характеристик, текст закривається на європейські мови - Латинська мова, англійська.

Одна з автобіографічних книг Річарда Фейнмана описує його аналіз альбомних аркушів нібито невідомих книг з Майанськими ієроглифами. У цій історії Фейнман швидко розтріскував проростання через статистичні оцінки та логічні причини. Тоді він фантазує з захопленням - як чудово буде, якщо хтось вирішив створити дійсно круту підробку, враховуючи всі візерунки в таких текстах. Якщо у кого-небудь виникло успіх, це є MB.

У 2003-2004 рр. Польський дослідник Zbigniew Banasik запропонував Манчурну версію. Я не знайшов ніяких посилань на нього, крім свого листа про Войнич, тільки при написанні цієї статті я знайшов публікацію в польському газеті. Google надає переклад, це любительське лінгвіст і поліглот з села біля Вроцлава. Він запропонував перекладати алфавіту рукопису в латинський алфавіт і дав початкове тлумачення першої сторінки. Перша сторінка рукопису Одна з основних цілей атак на VMS, вважається, що при вирішенні принаймні частини її можна отримати ключі до всього рукопису.

Коротка інформація про Манчурну мову.
Є стаття про російську Вікіпедію. В короткий час Манчус були люди, які мешкали в північній частині сучасної Китаю і трохи Далекої східної Росії, спочатку з Байкал і Алтай. Старша назва Юрчена. У 17-му столітті Китай був атакований і захоплений, Шаолін був спалений, а династії Цин був заснований, що до кінця 20 століття. За цей період в Манчурі відбувся офіційний документоообіг Кішельської імперії, який накопичувався в китайських архівах, до якого дослідники не отримали своїх рук. Вважається, що хороший китайський історик повинен оволодіти Манчурним принаймні для того, щоб читати найважливіші документи епохи в оригінальному. З 17-го століття Манчус мав оригінальний алфавіт, але потім перейшов на китайські символи. Китайський значно розвивав мову підкорювачів, додала багато слів до неї, переведений в Манчурний Tao De Jing і військовий договір Sun Tzu, а наприкінці 19 століття успішно осаджений Манчурія. Сьогодні майже всі Манчус говорять Китаянки, за винятком малих, ізольованих людей Шибо. Наприкінці 19-го століття мова Манчу була розглянута вимиранням, і тепер її можна вважати практично мертвим.

Історично, в Росії XIX ст. У ХХ ст. через війну і революції було створено потужну школу манчурологів, які, як кажуть, пройшли у XX ст. У мережі ви можете знайти сканування в pdf глибоко розробленому "Повний Манчур-Російський словник" І.І. Захаров 1875 видання. Але в цьому випадку зручніше використовувати цифровий манчур-Англійський словник J. Norman. Тут можна послухати пісню ARKI UCUN з латинським лайнером. Як я розумію, ім'я перекладається як «напій» або щось схоже.



Манчурний офіцер династії Цин, наприкінці 1700-х, картина з Вікіпедії
Опис методики
Альфабет і трансляція
І взяв багато роботи з Вільяма Поркета. Manchu Skeleton Key to Voynich Manuscript. Не існує посилань на неї з головної сторінки, але це Googles, і я також знайшов багато цікавих речей в кореневій папці, де знаходиться стаття. Крім того, він залишив посилання на статтю в різних форумах військових науковців.

Таким чином, приймаючи алфавіт Банасик і його розширення, яке Ви можете перевести текст рукопису в кілька варіантів тексту в латинському алфавіті з невеликою кількістю додаткових літер. Переміщення на припущення, що ми отримали текст в Манчу або в одному з його діалектів, винятку або змішаних з додатковими словами з іншої мови, ми можемо спробувати отримати переклади кожного слова і фрази з декількох слів. Одна з головних уподобань полягає в тому, що слова були написані вухо або особою, яка знає мову без глибоких знань граматики і писання - якщо будь-який час створення. Це означає, що одне слово може бути написане в декількох подібних варіантах. На користь цього говорять особливо поширені закінчується айн, аїн, аїн, айїн, даїн і т.д. в нотації EVA (Європейський Voynich Alphabet).

Перше, що я зробив створення рамки для аналізу тексту. Oracle 11g був обраний для ряду причин. Oracle зауважив, що приклади запитів будуть надані на своїй версії SQL. Ви можете знайти сценарії в репозиторію Github. Є набір сценаріїв, які створюють діаграму, таблиці та ряд сценаріїв DML SQL, які заповнюють таблиці рукопису, словника Manchurian-Ukrainian та інші.

Отже, просте послідовність формальних виразів з текстових записів рукопису в EVA і в розширеному алфавіті Banasik ми отримуємо сценарії, які імпортують VMS лінії по лінії, де рядок індекс виглядає як . Наприклад, другий рядок першої сторінки рукопису має індекс <1r.2>:

Перші 2 лінії ВМС у Єва виглядають як це (з www.voynich.nu/analysis.html):



JavaScript licenses API Веб-сайт Go1.13.8 Житло
Сорі.cKhar.or,y.kair.chtaiin.Shar.are.cThar.cThar,dan

Трансляція буде виглядати так:

'<1r.1>', 'fachys.ykal.ar.ataiin.Shol.Shory.cThres.y,kor. Житло
'<1r.1', 'cušil i cum us Uhungg tosi jolkl i cos tombi Р

'<1r.2>', 'sory.cKhar.or,y.kair.chtaiin.Shar.are.cThar.cThar.cThar,dan Р
'<1r.2>', 'losi gus os i cuks šhungg tus url jus jus баг'

Підписка на кінець п'ятої лінії першого абзацу Український перетворювати Українськийй Я думаю, що це ім'я власної. Не існує такого слова в Словник Манчу, як я дізнався про простий пошук на Facebook, це може означати людину з міста Сурат (не місто") на півдні Індії - російською мовою, як Суртян. Не в Манчурі, але в Хінді або Гуджараті.

Порівняння функції подібності
Слова та фрази, перекладені з VMS до латинського алфавіту, повинні бути у порівнянні з словами Норманського словника. Один запис у словнику містить одне слово або фразу кількох слів Манчу в літерах столиці та перекладі з англійської мови. Наприклад:

Крути кристалічний
НІОГОМБІ Мати сексуальний intercourse

Перше слово фачиса транслюється на першій сторінці в CINAILE. Другий неодноразово спалахнув в рукописі, в тому числі граматично правильні деклінації в Манчурі. У тій же словох зручно показати додаткові літери: С звучить як тверда "х", Š - як "ш", ui - про як "ю".

СУНЕКС
Для початку, для індексування і узгодження словника і рукопису я взяв просту функцію SOUNDEX. Це найстаріший телефонний алгоритм, створений в 1918 році, і я думаю, що він був використаний навіть перед комп'ютерами в переписі США. Створювалися стовпчики з індексом SOUNDEX в таблиці словника і в таблиці, де зберігаються фрагменти рукопису, можна побачити параметри перекладу на ньому.
На жаль, Soundex є дуже простим. Займає перші 2-3 стружки з слова, перекладається з альфа-нумерного коду, де групи подібних звуків (тобто літер) перекладаються в один характер. Для отримання додаткової інформації див. посилання на Вікі. Але це дає вам англійські варіанти перекладу! Це перша апроксимація, і дуже важлива.

МЕТАПХОН
Розробка фонетичних алгоритмів привели до створення Metaphone і потім Double Metaphone. Це більш розширений спосіб порівняння слів. Замість альфа-нумерного коду, чистий поштовий індекс розраховується з слова або фрази, що надаються одному реєстрі. Зазвичай в одному представнику вводять, в парі або аналогічні завіси. Прогноровано всі сепаратори та невиліковні символи. Метафон з'явився на межі 80-х-90-х, подвійний Metaphone - в середині-90-х, Metaphone 3 - в 2009 році. Останнім є комерційне програмне забезпечення, яке продається разом з невеликою основою для порівняння імен та прізвищ, написаних англійською мовою. Є імплементації подвійного Metaphone для різних мов, з урахуванням вимова латинських літер та літер. Для росіян. Не для Манчур. Я знайшов безкоштовну імплементацію Double Metaphone на PL / SQL, і розширив його трохи, додавши вищевказані листи і пару більше. У репозиторію доступно, в буквальному сенсі змінено кілька рядків. Так, він не зловить особливості морфології мови з усіма сортами децилінацій, суфіксів і префіксів, але навіть що вийшло дуже цікаво.

Підключаючи таблицю з текстом, що направляє рукописом та словником Манчу через поле коду METAPHONE (MPH_CODE) за допомогою LEFT JOIN.
У таблиці нижче відображаються варіанти перетягування першого рядка першої сторінки <1r.1>. Більшість слів мають кілька варіантів, але немає для 5 (хонь) і 8 (jolkl).

'<1r.1>', 'fachys.ykal.ar.ataiin.Shol.Shory.cThres.y,kor. Житло
'<1r.1', 'cušil i cum us Uhungg tosi jolkl i cos tombi Р

ПН кількість слів в рядку <1r.1>
НОРД слово в запропонованому алфавіті
МПХ_КОДЕ Код Metaphon для слова NWORD
Слова Варіант слова Манчу від Норманського словника, який має метафонний код, що дорівнює коду від NWORD
ТРАНСПОРТ Переклад манчу

НОРД МПХ_CODE ТРАНСПОРТУВАННЯ 1 кристал CUSILE 2 i I 1. він, вона 2. genitive частинок 3. взаємозв'язок використовується для отримання уваги підлеглих 2 i IO масло, фарба, лак 2 я бачу i шкіряний головний у формі спини i інсульту i i я шкода, щоб зламати дерев'яний палицю до п'ятисторонньої 2, Імммам шкода отримати 7 CE, Імммммммммммам шкода 7, Імммммммммммммммммммммам шкода 7, 7 CE, 1st.
Як видно, що деякі слова схожі за зовнішнім виглядом, деякі далекі, через майже повне зрізання бюветів в коді, всі варіанти слів Манчу видаються з слова, які мають абсолютно різні голосні звуки між консонанти. Короткі одно- і дволетові слова – в цілому, «збиток на небо». Але це вже цікаво, ніж пошук словника вручну з Ctrl-F.

В цілому використовуються три модифікації метафона - оригінальні англійські та два більш модифіковані, з додатковими літерами та з змінами умов конволюції.

Трансфери до синонімів у сфері перекладу
Невелика корекція словника - переклад цього синоніму додається в поле перекладу, що містить перекази "див. SOME_OTHER_WORD" через сепаратор.
Трансфери до синонімів виловити регулярне вираз.

Наприклад, таблиця вище:
ТЗ Переглянути зуб

Він негайно доповнюється перекладом посилання:
ТЗ див. тозо: 1. вага (для балансу) 2. влада, влада, право 3. шпинделя

Морфологія. Деклінація дієслова за часом
Тримати. Можна поглибитися в мову. Вербс в Манчу іноді нахиляється, додаючи закінчення. Ось таблиця дезлінацій з прикладами та листами до англійських часів. Ви можете помітити, що один англійський презент Континентний або Past Continious має кілька різних варіантів Манчу. Звісно, вони відображають деякі незручні мені тонкощі або вони просто синоніми, але неважливо шукати листи в Войничі. З таблиці словника ми робимо і зберігаємо зразок дієсловів у вигляді нефінітивної - тобто всі слова, що закінчуються нескінченним закінченням - МБІ і мають підрядку "на" в перекладі поле. Зняття закінчення та збереження результату в окремому столі, ми отримуємо список дієвих кореневих кореневих кореневих коренів Manchu_VERB_STEM.
Наприклад, дієслово АКУМБИ (до вмирання) зберігається як: АКА:й

З вищезазначеного посилання ми беремо таблицю деклінації та робимо таблицю MANCHU_VERB_SUFFIX:

Р

Всі можливі деклінації дієслова є фактично кошикичними продуктами цих таблиць. Крім того, пошук у рукописі здійснюється таким же чином, згідно з кодом Metaphone, і при декларування до кореневого коду, додається код кінцевого суфікса метафона. Через це можуть занехтувати різні закінчення.

Наприклад, з декларування простих пасів у словнику, різні закінчення додаються в різні дієслова, але для пошуку скибочками рукопису буде додано тільки метафоновий код. Х або ККй

пасти -ha (-he, -ho, -ka, -ke, -ko), Приклад: araхристина (Я писав)

Це те, що частина TRANSL_ Код презентації VERBS21 виглядає так, що дає варіанти перекладу одно- і двох фразових комбінацій одночасно, з урахуванням морфології дієсловів: варіанти децилінації видаються через внутрішню підклінію від UNION ALL:

SELECT LPAD (TRIM (REGEXP_REPLACE (idx, '[[[[:digit:]] +)[[[[:digit:]]] *]>, '\1', 3, '0') lpad1, REGEXP_REPLACE (idx, '[[[[[[[:digit:]] +]([[[[2']) lpad2, LPAD(L)], nxxxxxxx, LT, LE, nxxxxxxxxxxxxx, n.com, n.com.com.p Переклад трансляцій, метафон21 (VS.STEM) suff.suffix) mph21 від VMS. MANCHU_VERB_STEM vs. Перетинати ВМС. MANCHU_VERB_SUFFIX свінгери WHERE suffix <> 'mbi' UNION ALL SELECT D.WORD, D.TRANSLATION, D.MPH21_CODE З VMS. MANCHU_DICT_JOIN d) v На NW.MPH21_CODE = v.mph21 WHERE nw.n_type В (1, 2)
Приклад. У Манчурній граматиці є ще багато варіантів змінення дієслова з суфіксами, але це було занадто багато зусиль, щоб копати глибоко, тому нехай просто бачить, як виявлена морфологія дієслова. НІОГОМБІ:

виберіть * з VMS. TRANSL_VERBS21 RT де 1=1 і (слово як "%HOMBI%" або переклад, як "%niyohomb%" або слово, як "%NIOH%" і n_type = 2

Результати
Інтерсекція з словами зі списку Сваде
Списки Swadesh є базовою лексикою, наборами базових слів, за допомогою яких лінгвісти оцінюють зв'язки двох або більше мов один одному. Наприклад, тут є таблиця порівняння слов’янських мов на списку Свадешу. Таблиці також оцінюють швидкість зміни мови за часом. Основні слова з таких списків заміщуються або змінюються набагато рідше, ніж інші, але з часу їх занадто часу. Наприклад, в російській мові слово «іє» - алеввіальна, практично сланцева, заміщалася загальне Слов’янське слово «око» в якомусь 13 або 14 ст. Спочатку означають гальку з отвором всередині. Очі збереглися в поезії, доростанню і церковних текстах. Списки Swadesh 100, 200 і 215 слів. Лінгвісти використовують найкоротший перелік 100 слів. Якщо Вас цікавить, тут знаходиться біографія Морріса Свадеша в Росії.

Я написав великий англомовний список 207 слів в окремому столі і перехрестився з усіма перекладами всіх наборів 1 і 2 слів з рукопису, відсортованих частотою. Стіл - топ 33 найпоширеніших слів. Не все очистіть тут, так як багато манчурних слів даються в 2 або 3 варіантах в одному полі і значить, але для первинної оцінки - це буде зробити.

select T21.NWORD, SWM.ENG_WORD, SWM.WORD, count(*) від VMS. TRANSL_VERBS21 t21 JOIN (виберіть слово, верхній(слово) WORD від VMS) SWADESH_MANCHU) swm ON swm.word = t21.word група від T21. NWORD, SWM.ENG_WORD, swm.word замовлення від 4 desc Є не багато подібних слів, але є деякі речі: насіння, право, сонце, ви, щоб дати і кілька інших.

30 стілНОРД СКАЧАТИ СКАЧАТИ Сортувати ми насіння USE 559 бі місяць BIYA 306 s ви (sing.) SI 290 бордовий пил BURAKI 194 n'o земля NA 171 ji і JAI 111 ji Дитина JUI дати 111 b місяць BIYA 101 tgi хмара TUGI 57 tobi там TUBA 52 fus назад FISA 47 tbi там TUBA 40 usi див. USE 35 n'oh земля NA 34 NA 32 tji TUGI хмара 32 schun сонце schun schUN schUN 89 schi 12 TUI BA 12 schjoy BA 12 schjoy schi schi schi schi schi b 12 sch 12 sch


Статистика за характером Манчу абетки
Наступне запиту показує частотний розподіл таких слів і пар слів з пробілами, які строго збігаються з словами з словника. Від всього вибраних слів, які характерні для комбінації Манчурного листа - тип з й йй пн і так далі. Визначені листи з VMS-тексту за допомогою онлайн-аналізатора TAPoR з веб-сайту Університету МакМайстер в Канаді. Тепер існує ціла колекція аналізаторів і візуалізаторів залежностей в текстах, але це, що на скріншоті, на жаль, не доступний. Є версія, де потрібно копіювати текст у форму на сторінці, але посилання на текст не може передаватися в параметри.



Для порівняння з такою ж програмою візуалізації я збирав крихітні корпси Манчу на 14 кб. Це майже все, що я зумів копати – кілька коротких казок, кілька сторінок перекладу Tao De Jing, і кілька читальних матеріалів.

р.

Він помітний, що візуалізатор вже висвітлює всі довгі слова, такі як: ниалма (особа) або б(книжка) У рукописі немає таких слів, але є багато рідкісних фрагментів або цілих слів, які цілком відповідають граматиці мови, багато навіть з декларуваннями.

У статті Монтемурро проаналізовано антропну близькість слів рукопису та наведено схему декількох кластерів слів, пов’язаних з великим наближенням (рис. 2). Такий же малюнок графіків з накладною «перекладкою» виглядає так.



Ось я пропустив кілька слів, і я мав зробити всі написи сині з самого початку.

Нижче розглянуто статистичну статистику частоти з включеннями характерних частин, виділених онлайн-аналізатором з першого скріншоту. Навіть нижче результати.

виберіть nword, слово, переклад, кількість(*) від VMS. TRANSL_VERBS21 т де (T.NWORD як "%ng%" OR nword як '%mb%' OR nword як '%us%' OR nword як '%os%' OR nword як '%šom%' OR nword як '%um%' OR nword, як '%tk%%' OR nword як '%urg%' OR nword як '%urg%' OR nword як '%urg%' ) і верхній(trim слово замінити (nword,' ) = група nword, переклад, 4 de замовлення' OR nword як '%urg%' OR nword як '%' OR nword%' ) і верхній(не слово замінити (nword, '%, '%nword,' OR (nword,' OR nword, ')
Є 38 слів в таблиці, але 17 показані з частотою понад 1, рештою під псуванням.

NWORD WORD TRANSLATION COUNT(*) cos COS звук ricocheting або rebounding 28 ombi OMBI (імперафектний participle -joro, імперативний -so) 1. щоб стати, щоб змінити в 2. бути, щоб бути, щоб бути правильним, щоб бути дозволеним 18 usun fussy, поперек розмови 11 us un USUN fussy, як і раніше, говорити 10 bumbi до 9 šom bi ŠOMBI (-SO), щоб стати обов'язковим до 2, OOM, до 2, 1stimmberight до s
Інші слова з ng, os, mb і т.д.NWORD WORD TRANSLATION COUNT(*) ретельно DUMBI (для tūmbi) для удару, для удару 1 jombi JOMBI (2) (-ngko, -ndoro, -mpi) 1. щоб принести до розуму, згадати, щоб згадати, щоб принести 2. перемістити в ромб 1 fus i FUSI неоднорідний, лякаючий, монстроус плями на голові тварини 1 jombiBI (1) (-Uro) щоб побачити 1 UMBBus до um 1, 1 до MBI, 1 до um, 1.

Нарешті, таблиця точного листування слів з рукопису та словника, принаймні, 3 літери довжиною, відсортовані, зменшуючи довжину і тільки після частоти.
Знову показана вершина, решта під псуванням. Текст запиту надається тільки тому, що на мій погляд найбільш компактний вираз того, що знаходиться в таблиці.

виберіть nword, слово, переклад, кількість(*) від VMS. TRANSL_VERBS21 т де верхній(trim( замінити(nword,')) = слово і довжина(слово) >= 3 група nword, слово, замовлення перекладу по довжині (слово) desc, 4 desc NWORD WORD TRANSLATION COUNT(*) urg umbi URGUMBI див. urhumbi :: худнути на рейку одну сторону, бути недбалим, щоб бути упередженим до одного боку 1 бомбон BOMBON палі, wad, a bunch 1umbi OBUbi дивиться бі., щоб зробити занадто багато в, щоб стати птахами знайомим, для šosiki, щоб дати одну сторону 1 BOMBON палі, a BI, 1 для пучка, 1 BI, 1 до Мб, 1 в BI, 1 до s, до BI, 1 s, 1 Мб, 1 Мб,
Решта 83 слівНОРД ТРАНСПОРТНА КОУНТ(*) ici hi ICIHI пляма, blemish, flaw 1 fumbi FUMBI (2) (-ngke, -mpi) щоб стати німкою 1 jom bi JOMBI (2) (-ngko, -ndoro, -mpi) 1. щоб принести до жіночого взуття, пам'ятати в білому іргу URGUN 1, жіночність, 2ndrigo, 2ndrigo, 2ndrigo, 2ndrigo, 1st s в BI, 2ndrigo, 2jogo, 2ndrigo, 2ndrigo, 1st s, щоб jorigo 2 плита, вогнище 2. тканина, пульпа дерева 3. вена 1 занадто TOO 1n HON bow, більшість, 1 uli ULI 1. ударні 2 плодів дуже француженого 1 (Prunuser).

Окремі слова
Статистика за деякими словами, вибраними словником. Перш за все, цікаво поглянути в стабаліст. Слово «жінка» було вилучено з переліку, щоб скорочувати виведення.

виберіть nword, слово, переклад, кількість(*) від VMS. TRANSL_VERBS21 т де (переклад, як "%magic%" або переклад, як "%медицина%" або переклад, як "%herb%" або переклад, як "%gras%" або переклад, як "%медицин%" -- або переклад, як група "%жінка%") nword, слово, переклад замовлення по словом, 4 desc
Що відбувається. Ось не тільки абсолютно ідентичні слова, але всі збіги на метафоні – так деякі різні. Але магія (FANGGA) в тексті досить.

GAFAG, GAB, GAB, GAB, GAB, GAB, GAB, GAB, GAB, GAB, GAB, GAB, GAB, GAB, GAB, GAB, GAB, GAB, GAB, FE, GAB, GAB, GAB, GAB, GAB, GAB, FE, GAB, GAB, GAB, FE, GAB, GA, FE, GAB, GAB, GAB, , GAB, GAB, , FE, GAB, , , , , GAB, , GA, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , викласти нову сітку або іншу траву висихати 2. щоб говорити безлюдно 1 fumbi FEMBI 1. викласти нову сіву або іншу траву, щоб висохнути 1, щоб поговорити з безшовною травою, щоб FEha простий хаун: 1. висихати 2. поговорити з безлюдною травою, щоб говорити безлюдно, що він був новий безшовний 1 фуг (просте Fy укладання 1 до 2) до Fymless до 2.
Решта. Про сто ліній, деякі цікаві. Наприклад, ОКТО — 1. препарат, медицина 2. гармата 3. барвник 4.NWORD WORD TRANSLATION COUNT(*) fiYO 1. ula rose-a м'яка трава використовується як наповнювач в взуття 2. тканина ткана з хрін 67 f FOYO 1. ula rose-a м'яка трава використовується як наповнювач в взуття 2. тканина ткана з хрін 16 ?fi FOYO 1. ula м'яка трава-віо використовується в якості наповнювача 2. тканина тканого вовняного коня з травиф f FOY 2. ФОЙО 1. ula rose-a м'яка трава використовується як наповнювач в взуття 2. тканина ткана з хершера 1 fus l FUSELI їстівна свіжоводна риба, що нагадує чорний короп, галь якого використовується в якості наповнювача 1 gurg GURUka в траві (suff.k): (1) до чоловічого викопу (їїї їжі), я прийшов з попереднього віку, безперервні ліки в AN 2, 1-й рік, я наповню траву (NY) 1 місце до 2, n. NUKTE 1. Район, в якому кочовики призводять до своїх підлокітників і трав. NUKTE 1. область, в якій кочовики призводять до своїх запобіжників і отруйних вод і 2. багажу на тваринах 1 п'ятий NUKTE 1. Район, в якому кочів ведеться на воді і ОКГage, що здійснюється на тварин 1 n'c отрута NUKTE 1, 1 гармата 1, 3p, 1-й 1-й гарматі, 1st, 1st, 1st, 1st, 1st, 1st, 1st, 1st. p. gunpowder 3. барвник 4. отрута 1 octi o OKTO 1. препарат, медицина 2. гармата 3. барвник 4. отруєння 1 ок? хати OKTO 1. препарат, медицина 2.powder 3. барвник 4. отрута 1 окту OKTO 1. препарат, напій 2. гармата 3. барвник 4. отруєння Пас (suff.kto Продовжити 2. для лікування 1 octol ohkito smoke 1 (MI) взяти 1 ommine 1 для прийняття 1 BI. OMIka Simple Past (suff.k): 1. пити 2. окремо до диму (tobacco) 3. взяти (медицина) 1 omc OMIka Simple Past (suff.k): 1. to smoke (tobacco) 3. взяти (медицина) 1 omug OMIka Simple Past (suff.k.), окремо взяти (до диму) 3. взяти (сюжети) траву, 1. взяти (відступник) 2 фути. s 2 фут.

Слова для яких метафон не міг знайти єдиного перекладу
Топ 15 слів, як це. Деякі з них інтерпретуються, коли вони попарюються з сусіднім словом, або до або після.

NWORD COUNT(*) škbi 380 tkbi 325 n'ocungg 239 bum 234 n'octbi 230 ocungg 204 n'ocum 202 n'ockbi 181 ohus 181 škfi 179 škfi 179 škom 172 ohungg 166 ocum 163 ohum 161
Багато з них в структурі можуть бути деякі Манчурне слово - мають характерні суфікси і закінчення. -ng-, -ungg-, -mbi-, -bumbi- і так далі.
Поодинокі слова без узгодження найширшого покриття (TRANSL_VERB21, з деклінаціями дієслова) - 18 К з усього 40К. Однак, враховуючи пари сусідніх слів, надає ще 30K унікальних пар, які мають принаймні один метафоновий переклад. І багато слів, які не мають варіантів перекладу, попарених сусідами, створюють комбінації для яких розташований переклад.
Наприклад, свінгери навіть у парах не дає однолітків, але наступне таке слово ткбі У одному з 325 місць він формує з сусідом. tkbi бомби Варіанти перекладу 4 Слова бетмен численні пари бетмен - і так далі. Я не генерую або перевірені набори з трьох або більше сусідніх слів, але, можливо, 3-х ключових блоків варто шукати.

Думки
Кількість слів збігається і граматичних змін у тексті робить його обережним, щоб зробити висновок, що рукопис Войнича хоча б використовує слова з Манчурного / Ярченського діалекту. Послідовності Word не вписуються в мовні конструкції, такі як фрази і вироки. Але вони не знайшли раніше, статистичний аналіз не визначили їх з перших спроб. Здається, що в багатьох місцях є запис індексу – тобто короткі ноти з абревіатурами, які автор розуміли, але вони не додають до когерентного тексту. Багато слів розбиваються на частини, можливо, автор тексту написав його з усного виступу іншої людини.

Я не можу визначити, як надійно знайдені слова та їх частоти вказують на те, що в рукописі є Manjouric вставки. Текст має близько 170K букв і 40K слів. Точні збіги слів за словником кілька сотень, але я не врахую дуже короткі слова в 1-2 символи. Крім того, є тисячі приблизних матчів, за кодом метафона. Швидкий погляд на сторінки, здається, що слово знаходиться в словнику, але на перший погляд вони не додають до вироків.

Це буде чудово, щоб показати це до співативного науковця, спеціаліста з іноземних мов. Я не знаю їх, але вони повинні бути в Росії. Статті про такі особистості як Сергій Старостин і записані інтерв'ю з ними пропонують, що ви повинні шукати RSUH або MSU. Звичайно, ви можете сказати, що це все неспроможність. І взагалі не відомо, як часто вони приходять до них з ідеями і питаннями про Войнич, можливо, вже втомилися ...

У процесі я побував на цікавій онлайн-курсі Corpus Linguistics з Ланкастерського університету на платформі FutureLearn. Я навіть підписала його, але, як кажуть, це не ходило. Саму платформу і презентацію матеріалу не так зручно, як на курсі, а час не був досить вже після першого тижня. Може бути, ми повинні взяти його більш серйозно в наступний раз. Від неї я можу ще порадувати любителів програми АнтКонк - він призначений для аналізу конкордансів текстів за допомогою завантажених випадків їх вибірки з них. Також реконструйований з англійської до Манчурної версії функції Metaphone є дуже недосконалим – потребує вдосконалення.

Під час обговорення знайомий веб-програміст запропонував простий спосіб розпізнати весь рукопис: вирізати картинки сторінок на індивідуальні слова і вставити їх в капча під час входу в сайти.

Коментарі
Основні.
Інтерв'ю з Marcello Montemurro на Lenta.ru
Маржело А. Монтемурро, Дам'ян Г. Занетт, PLoS ONE, 2013
Критика його статті на сторінці вченого війни
2005 Комп'ютерний папір на мануфактурі
Огляд історії ВМС, виявлення спроб та статистичного аналізу
Зручний перегляд MB. Войнич Войнич

Willam Porquet's pageA Manchu Sceleton ключ до VMS
Повна транкулація з початковим текстом VMS

Список теорійВойничих теорій
Візуальна карта історії Войнича

Візуалізація текстових структур в рукописі Войнича
Посадка рукопису Войнича - частина 3
Посадка рукопису Войнича - частина 4

Детальний аналіз частини зодіаку

Войничські алфавіти, сценарії - на Omniglot

Теорія Манчу
Відповідь Столфія до Манчурної теорії - обговорення аспектів

Бразильський Jorge Stolfi є найвідомішим і актуальним веб-сайтом на MV, але є багато іншого.
Zbigniew Banasik's Manchu теорія
Перші переклади Zbigniew Banasik

Працевлаштування польського професора, аналізу мов Землі та рукопису

Огляд на reddit

Бібліотека Манчу
Вікіпедії 2
Вікіпедії 3
Вікіпедії 4
Книги Google Манчу: Підручник для читання документів: Манчу
Журженський на Omniglot
Юрчен сценарій на Вікі

Монгольські та тюркські запозичення у зразках дрібного Юрченського письма

... Лист Юрчена. Вікіпедія

Про Сергію Старостину та Глоттохронологічну школу
Про Старостину на Алтайці
Сергій Старостин. Два підходи до вивчення мовної історії
Яка мова дала Адам і Єва?

Ретушування

Великий текст спогадів про І.І. Захаров та російсько-китайські зв’язки у 19 столітті

Манчурський манчурський писав пам'ятники як джерело з історії та культури Цинської імперії 17-18 ст.

Сайт: www.vinich.net

Повернутися з комп'ютера 2005 - про демонтажних дешифраторів непрочитаних давніх текстів

Фотографії.
Манчу ВМС візуалізатор у вигляді бульбашок - від колекції TAPoR:



Як деякі дослідники ВМС стверджують гіпотезу, що жінки в басейнах є зображенням внутрішніх органів людини.

1,1 км Кінгні

Р

2,2 км Братина.



3. У Серце.

4. У Угри.

5. Умань Яйця.



Джерело: habrahabr.ru/post/186952/