За секунду до: как мозг конструирует будущее, которое становится настоящим - Дэниел Йон. Страница 8


О книге
ребенка, — бессловесные младенцы не могут нам об этом рассказать, — мы можем предположить, что эти гипотезы позволяют им вставлять собственную воображаемую пунктуацию там, где, как им кажется, проходят границы воображаемых слов. Услышав неправильное «дапику», младенец удивляется, понимая, что его гипотеза о языке оказалась неверна и он ставит паузы не в тех местах — точь-в-точь как описанный Пинкером ребенок, который настаивает, что на самом деле он очень даже «хейв».

«Извините, послышалось»

Прогнозирование не только помогает слушателям разделять на слова речевой поток. Оно еще и становится отличным способом избавиться от двусмысленности в устной речи. Время от времени по интернету разлетаются вирусные ролики с бистабильной речью — звуками, которые без редактирования могут быть услышаны разными слушателями совсем по-разному. На одной такой записи можно услышать одну и ту же звуковую волну либо как «Янни», либо как «Лорел». На другой — одно и то же слово слышится или как «green needle» («зеленая иголка»), или как «brainstorm» («мозговой штурм»). А в одной особенно хитрой мультистабильной химере разные люди могут услышать настолько отличающиеся слова, как «iPhone», «nightfall» («наступление ночи»), «Throw a knife» («Брось нож») и даже «I saw a dinosaur» («Я видел динозавра») [26].

Эти демонстрации выглядят особенно убедительными — и набирают миллионы просмотров на YouTube, — ведь слова, которые вы слышите, могут значительно измениться, если вы скорректируете свои ожидания. Если вам перед прослушиванием неоднозначной записи скажут, что в ней говорят «green needle», или вы увидите эти слова на экране перед тем, как начнет проигрываться запись, именно эта интерпретация станет доминирующей при восприятии услышанного.

Подобный эффект может показаться загадочным, если вы считаете, что, слыша речь, воспринимаете лишь входящие звуки. Но он становится логичным, если речь, которую вы слышите, — на самом деле сочетание звуков, попадающих в уши, и «спущенных сверху» ожиданий. При подобной схеме то, что вы реально слышите, — на самом деле лучшая догадка вашего мозга о том, что могло быть сказано. Зрительная система похожа на камеру, которая редактирует собственные изображения; и так же слуховая система напоминает микрофон, редактирующий собственные записи.

В лаборатории это особенно хорошо заметно по так называемой речи с шумовым вокодером. Процесс вокодинга искажает акустические свойства голоса, превращая нормальную речь в искусственный треск и шипение, которые неподготовленным ушам напоминают шум каких-то механизмов, абсолютно лишенный лингвистического содержания. Но если слушателю сказать, какие слова были произнесены на исходной записи, до жесткой обработки, то сквозь непроницаемый шум вдруг явственно проступает скрытый ранее человеческий голос [27].

Это синтетическое восприятие, которое благодаря предварительно полученной информации преображает механический шум в понятную речь, возникает благодаря прогнозам мозга. Ожидания слушателей, формирующиеся на уровне слов, превращаются в предположения о том, какие звуки они услышат, и с помощью последних уже конструируется реально услышанное.

Подобный предсказательный синтез можно показать в процессе с помощью средств визуализации мозга. Некоторые из самых изящных экспериментов в этой области принадлежат Мэтту Дэвису и его лаборатории из Кембриджского университета. Я впервые встретился с Мэттом на конференции в Сан-Себастьяне, где собрались нейробиологи, интересующиеся предсказательными процессами в мозге, чтобы обменяться представлениями о том, как они работают. В одном вечернем разговоре в баскской рюмочной Мэтт объяснил мне, как ему с коллегами удалось начать понимать, каким образом в языковых сетях мозга формируются и используются прогнозы.

Мэтт с коллегами смотрели, что происходит в мозге человека, когда речь, идущая в него «снизу вверх», соединяется с прогнозами «сверху вниз», наблюдали за соединением ожиданий и входящей информации в языковом центре и пытались понять, насколько глубокое влияние ожидания могут оказывать на субъективный опыт.

Участники одного эксперимента в лаборатории, который провел Эдиз Сохоглу [28], выполняли очень простое задание. Они слушали произносимые слова в наушниках. Реплики были в той или иной степени обработаны вокодером, что влияло на разборчивость: одни фразы оставались такими же ясными и четкими, как естественная речь, другие становились куда менее понятными. Задача слушателей была очень простой: оценить ясность звуков, которые они слышали, и сказать, разборчивой была речь или нет.

Что особенно важно, перед тем, как услышать слова, участники видели буквы на экране. Письменное слово служило сигналом для прогнозирования, говоря слушателям, что они должны услышать. Иногда предсказание и результат совпадали — участник видел на экране «clay» («глина»), а потом слышал слово «clay» в наушниках. Но порой слово было совершенно неинформативным (например, на экране появлялось «xxx», и слушатель вообще не знал, чего ждать), или же прогноз не сбывался: слушатели видели слово «snail» («улитка»), а потом неожиданно слышали «glass» («стекло»).

Заглянув «внутрь» мозгов участников, Сохоглу и его команда заметили интригующую закономерность. Если у людей есть возможность предсказывать звук, который они должны услышать, самая ранняя активность отмечается не в слуховых центрах височной доли, а в лобной доле — отделе, который, как обычно считается, находится на более высоком уровне в цепочке лингвистического анализа. Примерно через полсекунды меняется и активность височных областей мозга — тех, которые, по нашему мнению, кодируют «сырую» речь, поступающую из наушников.

Ранняя активация лобной доли вполне соответствует идее, что информация в языковом центре на самом деле течет в обратном направлении: прогнозы слов формируют прогнозы о звуках, которые затем поступают на нижний уровень. При такой схеме, увидев написанное слово «clay», нейроны лобной доли предсказывают, что следующим звукосочетанием, которое донесется до ваших ушей, скорее всего, будет «cl». И когда эта информация поступит в височные доли (кодирующие звук), она может изменить восприятие входящих сигналов.

В самом деле: когда лингвистические прогнозы сбываются, участки височных долей, кодирующие входящие звуки, менее активны. Подавление активности может быть связано с изменениями звуков, о которых сообщают слушатели: чем больше лингвистический прогноз ослабляет активность височных долей, тем четче и разборчивее кажется речь.

Такие открытия могут объяснить, почему мы можем слышать неоднозначную речь и правильно, и неправильно. Когда мы вооружены точными прогнозами, передача последних в речевые центры мозга создает объект восприятия («перцепт»), которое точно совпадает с тем, что говорится на самом деле. Но если прогноз не совпадает с реальностью, ожидания могут создать синтетический перцепт, где будет доминировать то, чего вы ожидали, а не то, что на самом деле говорится. Так порой возникают и мондегрины: когда, не поняв образ автора, слушатели превращают его слова во что-то более понятное для них [29]. Но, когда вы смешиваете неверное предсказание с тем, что на самом деле воспринимаете, вы в результате слышите ложную интерпретацию.

Подобные прогнозы, возможно, еще и объясняют, почему разговоры бывают настолько быстрыми. На записях беседы двух людей паузы

Перейти на страницу: