1.1. hsk 7 за номером 172 разбивается на слоги как bin4an4 или bi4nan4 ?

Здравстуйте. Помогите, пожалуйста, сделать часть компьютерно-лингвистического проекта – а я в публикации поставлю ссылки на ваши каналы на Ютубе и в Телеграмме, если такие у вас есть.

В путунхуа много омонимов; слова, отличающиеся только тонами, тоже будем считать омонимами. Закрытые слоги путунхуа заканчиваются только на «ⱶ (й) , n, , r, s/z»; поэтому чтобы различить омонимы, в конец одного слога (а если исчерпаны возможности к различению, то и нескольких слогов) добавляем цифру «1» (цифра не видна в специальном текстовом редакторе) и один-два согласных (любые, кроме «ⱶ, n, , r, s/z» - см. пример в таблице 6 ниже). Такие добавленные два или один согласных назовем инфиксами (т.е. инфиксов при необходимости в многосложном слове может быть несколько). Самый частый омоним – назовем его султаном – оставляем без инфиксов (т.е. в таблице 6 султаном является见). Когда шва (т.е. /ә/, [ɛ] ) в儿 не прозносится (儿 с тоном 33 после слога, заканчивающегося на согласную), “r” переносим в конец предыдущего слога.

Смысл в том, что иностранец слова заучивает и печатает с инфиксами (такой вариант путунхуа назовем лонхуа), а в беседе произносит без них. В специальном текстовом редакторе текст можно отображать несколькими способами: с инфиксами, без инфиксов, иероглифами. Таким образом иностранец пишет и читает китайские тексты, не мучаясь с иероглифами.

В качестве инфиксов для омонимов сначала используем «p, t, k, ş (ш), f, h, ʟ (л), m», затем при их исчерпании «ph, th, kh, şh, fh, ʟh, mh», затем «ʟp, ʟt, ʟk, ʟş, ʟf», затем «mp, mt, mk, mş, mf, mh». Хотелось бы, чтобы синонимы и слова с похожими ассоциациями (все ассоциирующиеся, например, с жесткостью или влажностью) использовали бы одинаковый инфикс – чтобы иностранцу легче было вспомнить синонимы. Кстати, если какие-то конкретные слога с конкретными инфиксами черезчур трудны для произношения самими китайцами, пожалуйста, дайте об этом знать. Вообще делитесь, пожалуйста, любыми вашими предложениями и соображениями.

Инфиксы нужно добавить вручную[1] в колонке «loŋhua» листа «Stems» прилагаемого файла «Stems of Loŋhua 2022.08.18 with russian translation.xlsm». Строки, в которые вы уже внесли изменения, помечайте, пожалуйста, любым значком в колонке «done»; уже обработанные строки и помеченные в этой колонке можете изменить как посчитаете нужным.

Исключительно для сортировки в Excel, существуют колонки «hsk, q, QQ, qq, 1st syll, _potLen». Колонки «q, QQ, qq» указывают частотность слова только среди омонимов с учетом и без учета тона. На всякий случай, колонки «gzl, giga, inet, wl» указывают частотность слова по разным источникам (колонки «giga1, inet1, wl1» лучше игнорировать, а не использовать как подсказку: они содержат результаты предыдущей попытки собрать информацию и оставлены просто на всякий случай). В колонке «deprivR» цифрами «8, 9» я отмечал слова, не вошедшие в HSK – можете в ней отмечать что и как хотите.

В колонках «глагол, существительное, прилагательное, наречие, междометие или частица» отметьте, пожалуйста, любым значком часть речи для иероглифа. А если иероглиф относится к нескольким частям речи, как например ai (любить), задублируйте, пожалуйста, эту строчку и добавьте в эти строки разные инфиксы. В колонке «имя собственное» отмечены все существительные, пишущиеся с заглавной буквы. Из колонки «translation» часть текста, повествующая о счетном слове для данного слова, перенесена в колонку «счетное его слово» - если это где-н до сих пор не сделано, не сочтите за труд, перенесите часть текста из колонки в колонку.

На листе tail находятся слова в колонке vofR и иероглифы в колонке simpleR. В одних словарях иероглиф встречается в единственном многосложном слове, судя по другим словарям создается впечатление, что иероглиф употребляется как отдельное слово. Вообще информацию с листа tail тоже нужно добавить в лист Stems, но я не знаю, нужно добавлять один иероглиф, или многосложное слово, или и-то-и-другое.

 

P.S. Тона 55, 35, 214, 51, 33 в путунхуа обозначены в эксельном файле как ᒣ, ᓯ, ᓴᒍ, ᒉ, ᖵ. ᓴᒍ-слога подряд в слове, кроме последнего в серии, записаны ᓯ-тоном – как и произносятся. Если эта корректировка где-нибудь не сделана, сделайте ее тоже, пожалуйста.

P.P.S. Проверьте, пожалуйста, правильность разбития на слоги в этих и других местах:

1. Проверьте, пожалуйста, верно ли разбиты китайские слова на слоги – для удобства они помечены красным в колонке deprivR.

1.1. hsk 7 за номером 172 разбивается на слоги как bin4an4 или bi4nan4 ?

1.2. hsk 5 за номером 75 разбивается на слоги как cang1uan3 или can1guan3 ?

1.3. hsk 7 за номером 398 разбивается на слоги как chang2e2 или chan2ge2 ?

1.4. hsk 6 за номером 204 разбивается на слоги как dang4an4 или dan4gan4 ?

1.5. hsk 7 за номером 743 разбивается на слоги как dang1e5 или dan1ge5 ?

1.6. hsk 5 за номером 41 разбивается на слоги как bing1uan3 или bin1guan3 ?

1.7. hsk 7 за номером 1253 разбивается на слоги как gang1a4 или gan1ga4 ?

1.8. hsk 7 за номером 4785 разбивается на слоги как yang3ai4 или yan3gai4 ?

1.9. hsk 5 за номером 506 разбивается на слоги как ming3an3 или min3gan3 ?

1.10.hsk 2 за номером 48 разбивается на слоги как cang1uan1 или can1guan1 ?

1.11.hsk 7 за номером 1053 разбивается на слоги как fang3an3 или fan3gan3 ?

1.12.hsk 7 за номером 1478 разбивается на слоги как guang4ai4 или guan4gai4 ?

1.13.hsk 5 за номером 981 разбивается на слоги как zheng1ui5 или zhen1gui4 ?

1.14.hsk 5 за номером 180 разбивается на слоги как dang4ao1 или dan4gao1 ?

1.15.hsk 6 за номером 344 разбивается на слоги как guang1uang1 или guan1guang1 ?

1.16.hsk 4 за номером 977 разбивается на слоги как zhuang3ao4 или zhuan3gao4 ?

1.17.hsk 2 за номером 393 разбивается на слоги как nang2uo4 или nan2guo4 ?

1.18.hsk 7 за номером 4249 разбивается на слоги как wang2u4 или wan2gu4 ?

1.19.hsk 7 за номером 3432 разбивается на слоги как ren2ge2 или reng2e2 ?

1.20.hsk 7 за номером 3621 разбивается на слоги как shen1ao4 или she1nao4 ?

1.21.hsk 4 за номером 630 разбивается на слоги как sheng1ao1 или shen1gao1 ?

1.22.hsk 7 за номером 3868 разбивается на слоги как shui3zhang3chuang2ao1 или shui3zhang3chuan2gao1 ?

1.23.hsk 5 за номером 75 разбивается на слоги как cang1uan3 или can1guan3 ?

 

1.24.hsk 2 за номером 48 разбивается на слоги как can1guan1 или cang1uan1 ?

1.25.hsk 6 за номером 204 разбивается на слоги как dang4an4 или dan4gan4 ?

1.26.hsk 7 за номером 1253 разбивается на слоги как gan1ga4 или gang1a4 ?

1.27.hsk 7 за номером 1455 разбивается на слоги как guang1an3 или guan1gan3 ?

1.28.hsk 7 за номером 1567 разбивается на слоги как hang2ai4 или han2gai4 ?