Читать 4 мин

Машина или человек? Как работает тест Тьюринга и зачем он нужен

Еще до появления термина «искусственный интеллект» людей волновал вопрос: может ли машина обладать разумом? И, несмотря на то, что мы живем в эпоху искусственного интеллекта (ИИ), тема остается актуальной. Первым человеком, который подошел к проблеме с научной точки зрения стал британский математик Алан Тьюринг. Рассказываем, что за тест от разработал и как его используют сегодня.

История создания

Несмотря на то, что исследования ИИ как научной дисциплины начались только в 1956 г., ученые и раньше размышляли над вопросом: умеет ли машина думать? Но, безусловно, первым человеком, который разработал научный подход к проблеме стал Алан Тьюринг.

Британский математик занимался проблемой машинного интеллекта еще с 1940-х гг., тогда же он впервые в своей работе «Интеллектуальные машины» ввел понятие «компьютерный интеллект». Тьюринг пытался разобраться, может ли у машины быть разум, и, если да, сумеем ли мы отличить его от человеческого.

«Нетрудно разработать машину, которая будет неплохо играть в шахматы. Теперь возьмем трех человек — субъектов эксперимента. А, В и С. Пусть А и С неважно играют в шахматы, а В — оператор машины. […] Используются две комнаты, а также некоторый механизм для передачи сообщений о ходах. Участник С играет или с А, или с машиной. Участник С может затрудниться ответить, с кем он играет», — писал он.

В 1950 г. ученый выпустил статью «Вычислительные машины и разум», которая стала его первой работой, которая рассматривала исключительно понятие «искусственный интеллект».

В этой работе Тьюринг говорит о том, что в традиционном для того времени понимании, чтобы ответить на вопрос «Умеют ли машины думать», нужно было дать определения терминам «интеллект» и машина». Однако математик предложил принципиально другой подход и заменил исходный вопрос на: «Могут ли машины делать то, что можем делать мы (как мыслящие создания)?» Алан Тьюринг считал, что таким образом провел четкую границу между интеллектуальными и физическими способностями человека.

Чтобы показать, как именно работает этот подход, исследователь предложил тест, который уже долгие годы используется как основа для изучения ИИ и оказался толчком для мощного развития этой сферы.

Тест Тьюринга — принцип работы

Во времена Алана Тьюринга была популярна игра для вечеринок под названием «Imitation game» («Игра в имитацию»). Ее суть в следующем: мужчина и женщина, пока никто не видит, идут в разные комнаты, а гости задают им письменные вопросы, подсовывая их под дверь. Так они пытаются определить, кто в какой комнате находится. По правилам мужчина и женщина отвечают им, отдавая набранный текст на печатной машинке, и стараются убедить гостей, что все наоборот.

Тьюринг «переделал» эту игру, и теперь ее сутью стало понять, с кем общается человек — тоже с человеком или все-таки с машиной.

Для проведения тестирования необходимы три участника: судья, который будет оценивать ответы, а также человек и компьютер, которые отвечают на поставленные им вопросы. Если судья в итоге определяет ответы машины как человеческие, значит, она прошла текст.

Со стороны все выглядит достаточно просто, но, на самом деле, чтобы пройти тест, машина должна не просто вести диалог, но и уметь отвечать на неожиданные вопросы, адаптироваться к изменяющейся среде и т.д.

Что нужно ИИ, чтобы пройти тест Тьюринга:

• понимать и правильно интерпретировать смысл вопросов

• обладать знаниями в области, о которой идет разговор

• уметь правильно формулировать ответы, которые не будут противоречить теме диалога

• правильно использовать разные языковые конструкции

• осознавать, когда знаний недостаточно и нужно получить дополнительную информацию

• применять творческий подход.

Для машин еще в 1950-х гг. пройти такое испытание было чем-то из разряда фантастики. Однако уже в 1966 г., американский программист Джозеф Вейзенбаум разработал чат-бота по имени «Элиза», который смог достаточно убедительно построить такой диалог, сумев впервые пройти тест Тьюринга.

Недостатки теста

Несмотря на то, что тест стал первым критерием оценки ИИ и мощным толчком к развитию данной области, он часто подвергается критике по многим причинам:

Ограниченность

Тест не способен оценить некоторые интеллектуальные способности машины, такие как аналитическое мышление, решение проблем и т.д.

Неоднозначность

Тест нельзя назвать надежным инструментов оценки интеллектуальных способностей ИИ, поскольку встречаются ложноположительные и ложноотрицательные результаты.

Отсутствие оценки физических возможностей

Данная проверка не оценивает, может ли машина каким-то образом взаимодействовать с физической средой.

Субъективность

Оценка результатов теста не всегда объективна, поскольку она во многом зависит как от квалификации судьи, так и от критериев, по которым дается оценка диалога.

Многие специалисты считают, что тест Тьюринга оценивает не возможность машины мыслить, а его умение имитировать человеческую речь и поведение, что может быть никак не связано с мыслительными способностями.

В современном мире применять этот тест стало еще сложнее, поскольку уровень ИИ-моделей значительно вырос. А значит, критерии оценки нужно постоянно пересматривать, а судья должен обладать все более глубокими знаниями в области нейросетей.

К примеру, в 2022 г. программа LaMDA от Googleс легкостью прошла испытание, убедив судью, что он общается с человеком, способным в том числе осознавать и чувствовать.

Знаменитый тест сегодня нельзя назвать единственным критерием, который может определить наличие «мыслительных» способностей у машин, поскольку сейчас они уже гораздо более изобретательны. Поэтому людям приходится придумывать другие способы проверки.

Так появился новый тест — AI Classification Framework. Он оценивает восемь разных видов интеллекта: музыкально-ритмический, логико-математический, лингвистическо-вербальный, телесно-кинестетический, внутриличностный, межличностный, визуально-пространственный и экзистенциальный.

Это тест оказался гораздо сложнее. Так, ChatGPT сумел пройти тестирование Тьюринга, однако провалил AI Classification Framework — он показал средний человеческий интеллект в логико-математической и лингвистическо-вербальной категориях, но в остальных получил ноль баллов.

Выгодный старт в БКС: Кешбэк и акции в подарок новым клиентам

Инвестировать

Тест Тьюринга сегодня

Тест, придуманный Аланом Тьюрингом, продолжает использоваться и сегодня. Самый простой пример — CAPTHA. Эта аббревиатура дословно расшифровывается как «Полностью автоматический публичный тест Тьюринга для разделения компьютеров и людей» (Completely Automated Public Turing Test to Tell Computers and Humans Apart). И это то, с чем сталкивался любой из нас, когда, к примеру, открывает сайт.

CAPTHA — это тест, который позволяет определить, кем является пользователь: человеком или компьютером.

Формы теста бывают разные: вас могут попросить выбрать определенные картинки, решить простой математический пример, ввести символы или записать словами услышанное аудиосообщение. Такие задачи просты для человеческого разума, а вот компьютер без соответствующих алгоритмов и баз данных выполнить их не сможет.

Где еще сегодня используется тест:

Образование

Применяют для изучения студентами навыков программирования и анализа алгоритмов. Им предлагают решить задания с помощью роботов, которые в процессе решения должны действовать, как люди.

Компьютерные технологии

В этой области тест помогает определить, насколько хорошо программа может имитировать действия человека и выполнять трудные задачи, например, планировать, прогнозировать, распознавать контекст речи и т.д.

Интеллектуальные игры

В таких соревнованиях ИИ сражается с человеком. Тест в данном случае помогает компьютеру проверить, насколько хорошо он способен имитировать реакции и действия человека.

Читайте также: Эффект «зловещей долины». Почему люди боятся антропоморфных роботов

БКС Мир инвестиций