Studies in Linguistics and Poetics

Complexity and Harmony of Russian Poetic Speech Dialogues by Andrej Broido, Jana Kutin Copyright © 1996 Andrej Broido. All rights reserved


2. Время, гармония и сложность, или Зачем нужны логарифмы? Интервалы времени по отношению к жизни отдельного человека надо измерять количеством переработанной информации. Но это количество трудно точно учесть. В первом приближении интервалы индивидуального времени можно измерять по логарифмической шкале. Ноль надо поместить в момент зачатия. А 1 -- в момент рождения, потому что это социальное время, до рождения человек пребывает вне общества. Логарифмы социального времени тогда будут положительны. Ты рождаешься; до рождения проживаешь бесконечный срок. Здесь, конечно, ясно, что нашу модель надо подправить, потому что количество информации, которое человек может переработатьза конечный промежуток времени, всегда конечно Почему эта модель может быть верна? Ведь скорость переработки впечатлений, скорость восприятия информации у каждого своя. Мы знаем, однако, что она убывает с возрастом (шведская молодежь, например, говорит так быстро, что пожилые люди их не понимают). Пусть скорость воспиятия обратно пропорциональна возрасту: v=k_0/t. Тогда знание, накопленное до возраста t, будет равно k \log t +C, так как скорость, с которой возрастает \log t, пропорциональна 1/t. (Здесь C -- знание в момент рождения, в который мы считаем t=1. Если считать, что C=0, то мы получаем просто k\log t.) В рамках этой модели за промежуток своей жизни от t до t' человек успевает переработать и в себя впитать, освоить количество информации k\log (t'/t), где k -- константа, характерная для данного человека. Попробуем с двоичными логарифмами. Последовательность вех, размечающая человеческую жизнь на сегменты, в течение которых предположительно перерабатывается одно и то же количество информации, будет тогда 3/4 года (рождение), 3/2 года, 3 года, 6, 12, 24, 48, 96 лет. Всего получается в жизни семь октав. Октава -- увеличение вдвое. В принципе октаву и любой другой интервал можно отсчитывать от любого возраста. "Собственное время" от t до t' в октавах будет равно \log_2(t'/t). Мы хотим историю спроецировать на восприятие человеком самого себя. Жизнь типичного человека в социальном плане укладывается в семь октав. Можно сказать, что это было октаву назад или квинту или терцию назад. Квинта равна 2^7/12 (7/12 октавы на логарифмической шкале). Терция: большая -- 1/3 октавы, малая -- 1/4 октавы. Малая терция -- это интервал между теперешним возрастом и возрастом, умноженным на 1.2 (1.1892), октава -- удвоенным возрастом. Терция назад -- поделить на 1.2. Большая терция -- 1.26. Квинта -- 2^7/12 = 1.5 (точное значение 1.4983). В такой системе отсчета время будет похоже на хорошо темперированный клавир. Идея хорошо темперированного клавира в том, что частоты музыкальных звуков составляют геометрическую прогрессию со знаменателем 2^1/12. Он был внедрен в музыку Бахом, хотя не Бах его изобрел. Но он сделал его широко известным, написав 24 пары произведений (прелюдия-фуга), каждое их которых имело тонику в одной из 12 мажорных и минорных тональностей, идущих через равные промежутки по логарифмической шкале. До него это знали. Но ноты до него настраивались из рациональных соотношений между частотами. Так, квинта считалась 1.5, терция 1.2, а большая терция -- 1.25. Международный стандарт с 1939 -- нота ля (A) в 1-ой октаве устанавливается на 440 гц, все остальные считаются от ля по логарифмически равномерной шкале. Тем самым, например, до (C) во второй октаве будет иметь частоту в 1.1892 раза выше, то есть на малую терцию от ля -- 523.25 гц; до в первой октаве -- 261.6256 гц. Но во времена Баха и долго после него музыканты не признавали хорошо темперированный клавир. Так он называется потому, что можно любое произведение играть в любой тональности -- все расстояния между нотами в любой тональности одни и те же по логарифмической шкале. (Надо понимать значение терминологии: терция -- это третья нота, кварта -- четвертая, квинта -- пятая. Ты берешь некоторую тонику, от нее отсчитываешь пять нот и получаешь квинту. Квинта -- это очень благозвучный интервал, потому что ее соотношение частот равно 3/2. Это известно со времен пифагорейцев). Возьмем квинту от до. До было 261.6 гц. Квинта -- 261.6*1.5=392.44 гц. Это соль 1-ой октавы. Предположим, берем одновременно до и соль. В качестве до звучит \sin 2\pi ft, где f=261.6, а t -- время в секундах, и одновременно с ним звучит \sin 2\pi(3/2)ft. Если обозначить f/2 через q, то получим сигнал с(т) = син 2пи 2ьт + син 2пи 3ьт Период такого колебания будет по-прежнему такой же, как у синусоиды с частотой q, он равен 1/q (это наименьшее общее кратное двух периодов, 1/2q и 1/3q); тем самым период удвоился, но это очень мало, потому что при произвольном соотношении частот он возрос бы во много раз. В этом и состоит основа гармонии: хотя период и увеличивается, но только в малое целое число раз, иными словами, частота делится на очень малое целое число. Сумма этих двух колебаний имеет свою основную частоту, свою нижнюю частоту (q) всего лишь вдвое и втрое меньше, чем частоты слагаемых ишодного сигнала. Почему это замечательно? Это значит, что полученный сигнал звучит на хорошей звуковой частоте. Представим, что будет, если мы суммируем синусоиды, у которых частоты не так хорошо соизмеримы. У суммы не будет тогда четко выраженного периода, будут лишь приближенные периодичности. Они зависят от разложения отношения частот в цепную дробь. Если взять, например, синусоиды с частотой f и 1+\sqrt 5\over 2 f (расстояние между этими звуками примерно 81\over 3 полутона) то приближенными (не точными!) периодами суммы будут произведения T=1/f на числа Фиббоначчи: Т,: 2Т,: 3Т,: 5Т,: 8Т... "Последнего" периода здесь нет -- в сумме можно обнаружить, при желании, сколь угодно низкие частоты (такие функции называют почти-периодическими). Возникнут не предусмотренные композитором и исполнителем звуковые эффекты. И эти эффекты в принципе присутствуют не только тогда, когда берешь две ноты, но даже и когда берешь одну ноту за другой, хотя в этом случае восприятие их намного слабее. Вот почему нужны рациональные соотношения между частотами и вот почему музыканты так долго держались за плохо темперированный клавир (т.е способ настройки инстумента) -- он имеет только одну тональность, в которой можно играть, в ней все соотношения между частотами нот выражаются рациональными числами с маленькими числителями и знаменателями. Например, малая терция 6/5, большая терция 5/4, квинта 3/2. Вследствии этого звучание аккордов, трезвучий очень благозвучно, -- это то, что называют гармонией. Гармония -- это созвучие. Мелодия -- это последовательность нот. Гармония -- это ноты, рассматриваемые как звучащие одновременно, хотя в рамках одной мелодии они могут разделяться временным промежутком. % Гармония % С математической точки зрения гармония -- это свойство суммы сигналов. Если ее период отличается от периодов отдельных сигналов небольшими целочисленными множителями, то созвучие (сумма сигналов) воспринимается нами как гармоническое. Музыканты в конце концов поступились своей абсолютной гармонией в пользу возможности переносить произведения из тональности в тональность, сохраняя их звучание. До этого им надо было перенастраивать инструмент. Теперь можно приспособиться к более низкому или более высокому голосу, или к какому-то набору инструментов, который может играть только в одном регистре, в каком-то ограниченном диапазоне 1-2 октавы (как некоторые духовые), поменяв тональность. Для этого уже не надо лезть в рояль с гаечным ключом. И петь можно собственным голосом, а аккомпаниатор будет играть на рояле в твоей, а не в одной-единственной благозвучной тональности. Но за этот счет, естественно, все благозвучие с точки зрения ценителей подвяло, отношения частот-то теперь иррациональны -- два в дробной степени. Может быть, об этой возможности знали уже в древней Греции или во времена Леонардо. Но в течение столетий это считалось бредовой идеей, как сейчас некоторые спекулятивные приложения математики к предмету, на который она не имеет никаких прав. Подход к народной поэзии с точки зрения колмогоровской сложности, наверное, так же будет воспринят профессионалами литературоведения. Определение этой величины звучит очень просто: итр Колмогоровская сложность текста -- это длина кратчайшей программы, ноиндент (При этом, конечно, надо предварительно указать и описать язык программирования). К сожалению, колмогоровская сложность не вычислима, то есть нет никакого алгоритма, который бы ее находил. Можно строить только ее аппроксимации, то есть утверждать, что колмогоровская сложность ограничена сверху какой-то величиной. Кроме того, она зависит от выбора языка программирования -- сложность одного и того же объекта (текста) зависит от того, какой способ кодировки (язык программирования) мы выбираем. Однако Колмогоров и, независимо, Соломонов показали в 1964, что существуют оптимальные системы кодировки: длины кодов в этих системах не больше чем на константу превышают длины кодов в любой другой системе программирования. (Колмогоров дал еще определение, которое допускает априорное знание, или "входные данные"; сложностью тогда считается длина программы, преобразующей эти данные в искомый объект. Это определение гораздо точнее описывает функционирование народной поэзии). Пример: чтобы запомнить телефон, надо запомнить семь цифр, и еще с каким делом, с каким человеком связаны эти семь цифр -- то есть надо запомнить довольно большое количество информации. Как с этим в Америке борются? Уменьшают количество информации. В Америке понимают, что если простому человеку поставить задачу запомнить семь цифр, то он обойдется без тебя. Типичная реклама выглядит так: я тебя озолочу, только позвони по такому-то телефону. Но для этого надо, чтобы телефон легко западал в память. Фирмы стараются выбрать телефон с легко запоминающимися цифрами -- много нулей и повторяющихся цифр. Например (из телефонного справочника): 390-3060, & 299-3998 467-0700, & 295-3355 (удвоенную цифру легче набирать -- не надо перебрасывать палец). Другие, которые хотят, чтобы их помнили наизусть, выбирают себе слова в качестве телефонов : 297-рм СОЛД. Кнопки 2-9 на телефоне размечены -- по три буквы на каждую цифру; рм СОЛД соответствует 7653. Это номер аукциона, ты запомнишь рм СОЛД (продано), и вместо запоминания цифр обойдешься перекодировкой. Время надо измерять как интервалы в музыке. Поэзия его измеряет, вводя последовательность временных шкал, соответствующую последовательности удвоений, утроений и упятерений. Ритм как созвучие (Утроение присутствует в трехсложных размерах, трехстопных строках и в куплетах, где поют последнюю пару строк дважды). Поскольку 3=2*1.5 а 5=4*1.25, ритм поэзии содержит "созвучия" с интервалом в октаву (*2) или октаву, увеличенную на квинту (*3). Большая терция плюс две октавы (т.е. множитель 5) входит в структуру пятистопных размеров и и пятисложных стихов -- например, двустопных ямбов с женским окончанием: В ландо моторном, в ландо шикарном &(I2w) Я проезжаю по островам... (Северянин, "На островах"), или: Здесь снега кругом вьются по ветру, &(H2w) Синева кругом -- как не выть? Интересно, что поэзия и музыка с незапамятных времен используют геометричекие прогрессии частот, а математики додумались до них только недавно, в середине 1980х (если не считать забытые работы столетней и полустолетней давности). Новая теория импульсов (рм щавелетс) использует последовательность шкал для измерения времени, T, 2T, 4T, 8T\ldots или T, T/2, T/4,\ldots и называет это многоразрешающим анализом (рм мултиресолутион аналысис). До изобретения этой теории спектральный анализ ассоциировался только с арифметическими прогрессиями частот -- f, \; 2f,\; 3f,\; 4f \ldots (как у рядов Фурье). % 2.1. Сложность народной поэзии Поскольку колмогоровскую сложность вычислить нельзя, то приходится искать какой-то заменитель. Нулевое приближение -- длина текста, которая измеряется килобайтами, количеством символов. Это очень грубое измерение. Оно лишь приближенно указывает, сколько в тексте информации, и эта оценка работает только для однородной группы текстов. Нельзя одновременно таким образом измерять количество информации в литературной поэзии и народной. Стихотворение Тютчева в 12 строк, по 20 знаков в строке, занимает 240 байт, а "Гоп со смыком", 20 куплетов по 125 знаков в куплете -- 2500 байт. Но у них разные требования к априорному знанию читателя (например, разные словари). Мы не скажем, что в "Гоп со смыком" в 10 раз больше информации, чем в стихе Тютчева, скорее наоборот -- "Вот эта книжка небольшая томов премногих тяжелей." Следующее приближение -- это частотки, хотя и их вряд ли можно применять к литературной поэзии. Информация и частота Частотка -- это метод измерения информации посредством суммирования логарифмов вероятностей слов (со знаком минус). Для этого надо знать, как часто встречается данное слово во всем наборе слов (во всей народной поэзии). Вероятности, которые неизвестны, мы заменяем на относительные частоты, деля частоту на объем выборки (сейчас 210000 словоупотреблений). Сумма имеет смысл логарифма вероятности песни как последовательности независимых случайных слов. Это тоже грубое приближение, потому что в нем совершенно не учитывается порядок слов. Поскольку сложение коммутативно, то все определяется просто набором слов, а в каком именно порядке расположены эти слова, не учитывается. Но ведь текст песни потому и можно запомнить, что слова, взятые в данном порядке, имеют намного меньшую сложность, или, точнее, меньшую колмогоровскую сложность, чем этот же набор слов, подвергнутый случайной перестановке. Например, рассмотрим строчку "На форду там работала Рая" и такую строчку "На там работала Рая форду". Ясно, что сложность второй строчки намного больше, чем первой. Или -- "Форду работала там Рая на" -- понять ничего нельзя, сложность очень велика. Одна величина выступает под тремя именами: энтропия, сложность (колмогоровская) и информация. Колмогоровская сложность, как говорит Манин, это сложность сказывания сказок, а не сложность делания дел. По его мысли, присказка -- "скоро сказка сказывается, да не скоро дело делается" -- описывает различие между колмогоровской и вычислительной сложностью. Вычислительная сложность -- это сколько времени работает алгоритм, а колмогоровская -- это сколько места в памяти занимает описание алгоритма. Присказка как раз и говорит об этом -- события, которые описываются в нескольких словах, на самом деле растягиваются на несколько лет. Например, герою говорят: пойди в тридевятое царство, три слова (заметь, что в 3\times 9-е, а не в 27-ое). Но чтобы пойти в 27-ое царство, надо затратить несколько лет, ведь двадцать шесть надо пройти. Дж. Но ведь царства на двумерной поверхности? Др. Нет, остальные в стороне от маршрута, а 26 надо пересечь. Пойди за тридевять земель -- в 28-ую землю. В тридевятое -- в 27-ое царство. 2.2. Время и мудрость Промежуток времени для человека измеряется количеством информации, усвоенной за это время. В информацию входят переживания, впечатления, мысли, науки, которые вючил, произведения, которые создал -- вся интеллектуальная работа, которую ты сделал. Все это надо взвесить. Каждому делу -- весовой множитель. Знакомство с новым человеком будет весить больше, чем написание модуля в 100 строк на фортране. Потому что, чтобы в принципе оценить, стоит ли с этим человеком поддерживать отношения, надо проанализировать намного больше факторов, чем для написания одной программы, даже если она входит в какую-то систему. Конечно. В системе уже есть какой-то стандарт, в котором ты пишешь -- например, одни и те же имена для переменных или как их занулить. В большой программе ты окружаешь себя хорошими знакомыми, про которых ты знаешь, как они себя ведут, какие их свойства, какое их поведение надо считать нормальным или ненормальным. И с помощью своих представлений ты живешь в этой системе без сильных впечатлений -- с каким-то минимальным количеством новых впечатлений, которые появляются, когда ты образуешь немножко отличающиеся сообщества хорошо знакомых объектов. В работе большинства людей всегда присутствует элемент повторения, она тиражируется во многих экземплярах. Например, люди вючивают ремесло и дальше повторяют одно и то же достижение. И им это легко, потому что не требует ни переработки, ни выдачи дополнительной информации, только подлаживания под потребности текущего момента. Поведение они строят по образцу группы, к которой принадлежат. Значит, не надо ни анализировать, ни принимать решений, надо только делать так, как все друзья делают. Этот рецепт жизни и выражается словами -- делай как все. Выходит, поведение человека и все его устремления, и профессиональные амбиции можно описать с помощью трех слов. Оно закодировано этими тремя словами. Собственное время -- это количество переработанной информации; математически, это обратная функция количества переработанной информации. Мы говорим -- как разделить жизнь на одинаковые по психологической длительности сегменты? Возьмем мудрость -- количество усвоенной информации -- как функцию времени, а затем возьмем, наоборот, время как функцию мудрости. Например, когда мудрость достигает известного порога, ты становишься взрослым. А как измерить мудрость? Я мерю мегабайтами с тех пор, как набиваю песни. К каждому песенному тексту даю комментарий, когда я его записал, какой у меня есть собственный вариант (запомненный в детстве), тем самым я могу измерить, сколько в памяти содержится мегабайт. Это, конечно, грубая мера, но другой пока нет. Я знаю, что в моей памяти записано около 2 М народных песен, еще около 2 М литературной поэзии, может быть больше, но это легко измерить количественно. Если продолжать по аналогии, то я знаю около 2 М математики, может быть, больше, шведского языка около 2 М, русского -- 10 М, английского -- 3-4 М, латинского, французского примерно 100 К, испанского -- 10 К. Знаю -- это имеется в виду наизусть знаю. Того, что я узнаю как известное, примерно в пять раз больше. Например, в литературной поэзии -- 10 М, в математике то, что я мог бы преподавать, читая книги, которые я когда-то изучал, тоже, может быть, 10 М. Но это длина, объем текста, который я знаю. Колмогоровская сложность этого текста примерно в 100 раз меньше. Мы запоминаем что-то среднее между колмогоровской сложностью и длиной текста. Наш интеллект не может закодировать этот знание с его истинной (колмогоровской) сложностью. Этой границы он достичь не может. фнр (Всего в голове, наверное, 1 Тб (10^12 байт) -- все друзья, все подруги, воспоминания детства. Иногда время года, рассвет, закат вызывает в памяти, что ты делал тогда, давно. Это со всеми впечатлениями эмоционального опыта -- это уже аналоговый опыт, если его перекодировать -- например, виды закатов, пейзажи, зимние походы...) 2.3. Общие песенные сюжеты. В народной поэзии присутствует сжатый до предела набор стандартных трансакций, то есть поступков в рамках отношений, связывающих отдельных лиц (например, прокурор судит своего сына). Основной мотив блатной песни состоит в выборе между двумя линиями поведения, двумя обязательствами, каждое из которых вынуждает человека быть верным какой-то группе людей. Это -- трагедия блатной песни, это трагедия жизни, как ее понимает блатная песня. Но группы эти могут быть разными, это может быть преданность любимому (или родному или своей компании) и преданность государству. Или какой-то, может быть, другой компании людей. Это выбор между верностью и теми обязательствами, которые она накладывает на тебя. Из этого разворачиваются все ее сюжеты; этим она интересна для всех. Например, Мурка. Ее убили за то, что она оставила блатных и перешла на службу государству. Она выбрала преданность более широкому кругу людей. Преданность силе она сменила на преданность другой силе. В песне "Я родился на Волге" человек убил свою возлюбленную за то, что она вышла замуж, пока он сидел в тюрьме, то есть верность ему она променяла на верность другой, вновь созданной семье. В песне "Вот снова луной озарился" ("Алой зарей озарился") прокурор приговаривает к расстрелу своего сына, чего бы он никогда не сделал, если бы заранее знал, что это его сын. Он ему подписывает смертный приговор, после чего сын в последнем слове говорит: "Я сын трудового народа, отец -- окружной прокурор". Прокурор опознает его и в результате кончает с собой. Вот основа всех этих конфликтов. И в большинстве случаев одна сторона в конфликте -- это общество или государство, а другая -- это семья, (может быть, временная) или блатная компания. Как в песне "Я встретил Вареньку" -- похожа на Мурку. "Я родился на Волге", "Много женщин есть" -- одна и та же история, рассказанная в трех разных вариантах, мотивах, размерах. Там два конфликта. Сначала из-за преданности женщине человек порывает с обществом, становится блатным, однако впоследствии его любимая порывает с блатным миром и передает себя государству (или другому человеку), что по понятиям блатного мира обязывает ее первого любимого с ней расправиться, создает ситуацию, в которой он с высокой вероятностью находит такой выход. Это не реальность, а модель жизни, которая задается в песне. С точки зрения этой упрощенной модели он почти обязан так поступить. Вся шема отношений такова, она напоминает греческую трагедию -- совершая свои подвиги, герой все ближе и ближе подходит к смерти, он подходит к тому подвигу, который становится для него роковым. Только в этих песнях он подходит к убийству своей подруги, так что герой, совершающий подвиги, и гибнущий герой здесь оказываются антагонистами. Фактически такой же конфликт обозначен и в песне "Я пишу тебе, голубоглазая": как только он попадает в тюрьму, его возлюбленная соединяется с человеком, причем даже не принадлежащим к блатному миру: Скромный фраер в галстучке в полосочку Стал уж твои губы целовать, Но пойми же ты, голубоглазая, Уркаган не любит ревновать дальше следует скрытая угроза убить ее нового друга, правда, не ее. Я помню этот сюжет в двадцати различных изводах. Мне не надо помнить 20 сюжетов. Я помню как они реализованы в словах. Кроме этого, помню их (стихотворные) размеры. Теперь мне надо решить задачу -- есть размер и есть сюжет, как вспомнить песню по этим двум проекциям? Это два независимых элемента информации: сюжет -- это смысл, а размер -- комбинаторная структура: функция на целых числах (1, если на слоге есть ударение, 0, если нет), дерево или программа. Высоты и длительность нот измеряются по логарифмической шкале (целая нота, половинка и т. д.) Все дискретизовано. Значит, мне (певцу) надо еще вспомнить длительности нот (функция с шестью значениями) и высоты (функция с двадцатью значениями). Я помню длительности и высоты нот -- мелодию, причем помню ровно столько, сколько пролезает в мою память, сколько она может вместить. Вот и весь набор информации, который дает возможность восстановить песню как целое, -- плюс еще ключевые слова, выражающие основной смысл песни ("Как это, на границе! Гробы-то!"). Обычно это слова, которые встречаются в песне чаще, чем во всей совокупности текстов. Если слово или словоформа встречается во всех наблюдениях единственный раз -- только в данной песне, то его относительная частота в песне (содержащей, например, 100 слов), на одиннадцать октав, то есть в 2000 раз выше, чем во всей выборке. Теперь берем одну песню: Есть в саду ресторанчик шикарный &(A3) Было скучно там Оле одной в ней 95 слов; "ресторанчик" будет составлять 1% и (относительно этого текста) попадет в 7-ую октаву, а относительно всей совокупности -- 1/210000 (18-я октава). Было бы удобно, конечно, работать с абсолютными частотами, а не с вероятностями, но значения частот % Частоты % зависят от объема выборки. Относительные же частоты (т.е.частоты, деленные на объем выборки), должны по идее шодиться к вероятности; наращивая материал, мы можем рассчитывать на то, что оценка вероятностей с помощью частот становится все более и более точной. Действительно, с переходом от 90000 слов к 200000 слов диапазон частот увеличился больше чем на одну октаву (в два раза), а логарифмическая вероятность слова "и" изменилась всего лишь на 0.01 -- с 4.89 до 4.90. Первые 10 слов (в порядке убывания вероятностей) остались теми же: и, в, не, я, на а, ты, с что, как. Можно безошибочно утверждать, что вероятности наблюдаемых слов начинаются с (минус) 5-ой октавы -- 3%, слово "и". (Это очень высокая частота: примерно каждое тридцатое русское слово -- это "и"). Дальше идут более низкие частоты; например, "что" и "как" -- конец седьмой октавы (6.96): каждое 128-е слово -- это "как". Затем идут группы по, мы, за, мне и он, у, но, в которых произошли перестановки, но сами группы сохранились. В зависимости от того, как мы ограничиваем свои данные (скажем, рассматриваем общенародные, или студенческие песни), меняются вероятности разных слов. И наоборот, по вероятностям появления групп слов мы (без вычислений!) определяем принадлежность песни или человека к определенному кругу.
Top | Studies Next | Previous | Home | KOI

Вверх Статьи Вперёд Назад Каталог КОИ

Readable since 1996-07-17

Удобочитаемо с 17.07.96