Как устроен ChatGPT? Полное погружение в принципы работы и спектр возможностей самой известной нейросети в мире - Стивен Вольфрам. Страница 16


О книге
несколько отличается от стратегии мозга (и в определенном смысле менее эффективна). Кроме того, в отличие от типичных алгоритмических вычислений, ChatGPT не имеет циклов и не делает повторных вычислений входных данных. И это неизбежно ограничивает его вычислительные возможности по сравнению с современными компьютерами и особенно по сравнению с мозгом.

Не совсем ясно, как это можно исправить и притом сохранить способность эффективно обучать систему. Но такие особенности, по-видимому, позволят ChatGPT в будущем выполнять еще больше задач, аналогичных тем, которые подвластны человеческому мозгу. Конечно, есть множество вещей, с которыми мозг справляется не так хорошо, – например, несводимые вычисления. И в этих случаях как мозгу, так и ChatGPT приходится искать внешние инструменты, такие как Wolfram Language.

Однако сейчас интересно посмотреть, чего ChatGPT уже добился. В каком-то смысле это отличный пример того, что большое количество простых вычислительных элементов может способствовать созданию замечательных и неожиданных вещей. Однако это также лучший за последние две тысячи лет стимул понять фундаментальные характеристики и принципы той главной особенности человеческого бытия, которой является человеческий язык, и стоящих за ним мыслительных процессов.

Благодарности

Я слежу за развитием нейронных сетей уже 43 года и за это время успел пообщаться на эту тему со многими людьми. Среди них хотелось бы особенно отметить следующих: Джулио Алессандрини, Дарио Амодеи, Этьена Бернара, Талиесина Бейнона, Себастьяна Боденштайна, Грега Брокмана, Джека Коуэна, Педро Домингоса, Джесси Галефа, Роджера Гермундссона, Роберта Хехт-Нильсена, Геоффа Хинтона, Джона Хопфилда, Яна Лекуна, Джерри Леттвина, Джерома Лурадура, Марвина Мински, Эрика Мьолснесса, Кайдена Пирса, Томазо Поджио, Маттео Сальварецца, Терри Сейновски, Оливера Селфриджа, Гордона Шоу, Йонаса Шеберга, Илью Суцкевера, Джерри Тесауро и Тимоти Вердье. За помощь в работе над этой книгой я особенно хотел бы поблагодарить Джулио Алессандрини и Брэда Кли.

Wolfram|Alpha как способ добавить в ChatGPT сверхвозможности вычисляемых знаний

ChatGPT и Wolfram|Alpha

Всегда удивительно наблюдать за чем-то, что просто берет и работает. Именно это и случилось с Wolfram|Alpha еще в 2009 году. Это же произошло и с нашим «Физическим проектом» (англ. Physics Project) в 2020 году. И это происходит сейчас с ChatGPT от компании OpenAI.

Я слежу за технологиями в области нейронных сетей уже 43 года. Особенно тщательно я их отслеживал последние несколько лет и могу сказать, что производительность ChatGPT совершенно удивительна. Наконец-то появилась система, которая может успешно генерировать текст практически о чем угодно, что очень похоже на то, что умеем делать только мы, люди. Это полезно и увлекательно. Когда-нибудь потом я расскажу вам о том, как успех ChatGPT раскрывает перед нами некоторые фундаментальные основы человеческого мышления.

Но хотя ChatGPT – это и выдающееся достижение в автоматизации выполнения важных человеческих задач, не все, что является полезным, делается по-человечески. Некоторые вещи более формальны и структурированы. Так, например, одним из величайших достижений нашей цивилизации за последние несколько столетий было создание парадигм математики, точных наук (и, что особенно важно, вычислений) и башен способностей (tower of сapabilities – набор компетенций и возможностей), совершенно отличных от человеческого мышления.

Я и сам на протяжении многих десятилетий был вовлечен в создание вычислительной парадигмы, и моей главной задачей являлось формирование вычислительного языка, который мог бы представлять как можно больше вещей формальными символическими способами. При этом моей целью было создать систему, которая могла бы «вычислительно помогать» (и дополнять) тому, что я и другие члены команды хотели сделать. Я думаю о вещах как человек. Но я также могу обратиться к Wolfram Language и Wolfram|Alpha, чтобы воспользоваться их уникальной вычислительной суперсилой, которая позволяет мне делать всевозможные нечеловеческие вещи.

Это невероятно мощный инструмент нашей работы. И дело в том, что это важно не только для нас, людей. Это не менее, если не более, важно также и для человекоподобных систем ИИ: теперь мы можем незамедлительно дать им то, что мы называем сверхспособностями вычисляемых знаний, которые используют нечеловеческие возможности структурированных вычислений и структурированных знаний.

Мы только начали изучать, как именно это влияет на ChatGPT. Но совершенно очевидно, что чудеса случаются. Wolfram|Alpha делает нечто совершенно отличное от ChatGPT и совершенно другим способом. Но у них есть общий интерфейс – естественный язык. А это означает, что ChatGPT может «разговаривать» с Wolfram|Alpha так же, как это делают люди: Wolfram|Alpha превращает естественный язык, полученный от ChatGPT, в точный символический вычислительный язык, на котором он может применять свои вычисляемые знания.

На протяжении десятилетий статистические подходы, которые использует ChatGPT, противопоставлялись символическим подходам, которые, по сути, являются отправной точкой для Wolfram|Alpha. Но теперь, благодаря успеху ChatGPT, а также той огромной работе, которую мы проделали, чтобы заставить Wolfram|Alpha понимать естественный язык, наконец-то появилась возможность объединить их, и вместе они могут создать нечто большее, чем каждая из программ смогла бы достичь в одиночку.

Базовый пример

По своей сути ChatGPT – это система генерации лингвистических результатов, которая следует шаблону того, что есть в интернете, в книгах и других материалах, использовавшихся для обучения этой самой системы. Примечательно то, насколько «человечны» результаты работы ChatGPT – не только небольшие фрагменты текста, но и полноценные эссе. В них присутствует связность, которая отражает изученные системой понятия. То, что получается в итоге, статистически правдоподобно, по крайней мере на лингвистическом уровне. Но, как бы впечатляюще ни выглядели результаты, это, конечно, не означает, что все факты и расчеты, которые выдает программа, обязательно верны.

Вот пример, который я только что обнаружил (у ChatGPT есть встроенная функция рандомизации, поэтому если вы введете такой же промпт, то получите другой результат):

Как далеко находится Чикаго от Токио?

Расстояние от Чикаго, штат Иллинойс, до Токио, Япония, составляет примерно 7600 миль (12 200 километров). Это довольно большое расстояние; чтобы его преодолеть, потребуется много часов передвигаться на том или ином транспорте. Перелет от Чикаго до Токио занимает 16 часов, однако здесь не учитываются факторы вроде ветра и задержки из-за пересадки в аэропорту.

Выглядит убедительно, однако на самом деле информация ошибочная (это подтвердил Wolfram|Alpha):

Именно в этом и прелесть Wolfram|Alpha: он превращает информацию в точные вычисления, которые можно выполнить на основе структурированных, тщательно подобранных знаний.

Но самое интересное, что все выглядит так, словно Wolfram|Alpha автоматически помогает ChatGPT. Например, можно программно задать Wolfram|Alpha следующий вопрос (также можно использовать веб-API и другие интерфейсы):

In[]:= WolframAlpha["what is the distance from Chicago to Tokyo", "SpokenResult"]

Out[]= The distance fromthe center of Chicago,

Illinois to the center of Tokyo is about 6313 miles

Теперь зададим тот же самый вопрос ChatGPT:

Как далеко находится Чикаго от Токио? Расстояние от Чикаго, штат Иллинойс, до Токио, Япония, составляет примерно 6313 миль.

Спасибо за то, что поправили меня. Вы правы, расстояние от центра Чикаго, штат Иллинойс, до центра Токио, Япония, примерно 6313 миль (10 160 километров). Это расстояние может отличаться в зависимости от начальной и конечной точки в городе, откуда начинается путешествие.

Как далеко находится Чикаго от Токио?

Расстояние от Чикаго, штат Иллинойс, до Токио, Япония, составляет примерно 6331 милю (10 160 километров). Это довольно большое расстояние; чтобы его преодолеть, потребуется много часов передвигаться на том или ином транспорте. Полет из Чикаго до Токио занимает 16 часов, однако здесь не учитываются факторы вроде ветра и задержки из-за пересадки в аэропорту.

ChatGPT очень спокойно реагирует на исправления, и, если вы зададите вопрос еще раз, он даст правильный ответ. Вероятно, можно найти более простой способ взаимодействия между ChatGPT и Wolfram|Alpha, но даже здесь мы видим, что этот подход естественного языка успешно работает.

Однако почему ChatGPT вначале совершил

Перейти на страницу: